Az automata és kézi szegmentálás ejtésvariációk okozta
problémái
Zsigri Gyula,* Tóth László,+ Kocsor
András,+
Sejtes Györgyi*
* Szegedi Tudományegyetem
Magyar Nyelvészeti Tanszék
+MTA-SZTE Mesterséges Intelligencia Kutatócsoport
A beszédadatbázisok egyik legértékesebb
része a beszédhang szintű szegmentálási információ. A szegmentálást
és címkézést tökéletesen csakis nagy figyelmet igénylő, fáradságos
és hosszadalmas kézi munkával lehet elvégezni. Megkönnyítheti és meggyorsíthatja
viszont a munkát egy megfelelő, speciálisan erre a célra kialakított
algoritmus, amely megkísérli automatikusan elhelyezni a fonetikai határokat.
Akár ember, akár gép végzi a szegmentálást, segítségként rendelkezésére
áll a hanganyag feltételezett fonetikai átirata, amelyet egy fonetikus
átíró algoritmus állít elő a betű szerinti lejegyzésből.
A jel valódi fonetikai tartalma azonban eltérhet ettől, hiszen
ugyanannak a szövegnek ejtésvariációja lehet. A cikkben megvizsgáljuk,
hogy ez a jelenség hogyan befolyásolja az általunk alkalmazott automata,
illetve félautomata szegmentáló algoritmusokat. Megnézzük továbbá, hogy
az MTBA adatbázis kézi feldolgozása során a szegmentálást végző
személyek miben tértek el az előzetesen rögzített szabályoktól,
különös tekintettel arra, hogy mentális (fonetikai) lexikonjuk hogyan
befolyásolta őket a várttól eltérő ejtésvariációk kezelésében.