|
@article{,
author={Vicsi, Kl{\'a}ra and T{\'o}th, L{\'a}szl{\'o} and Kocsor, Andr{\'a}s
and Gordos, G{\'e}za and Csirik,
J{\'a}nos},
title={MTBA - magyar nyelv{\^u} telefonbesz{\'e}d-adatb{\'a}zis},
abstract={Magyar nyelvu, telefonon kereszt{\"u}l r{\"o}gz{\'i}tett
besz{\'e}d-adatb{\'a}zist hoz l{\'e}tre
a Budapesti Muszaki Egyetem T{\'a}vk{\"o}zl{\'e}si {\'e}s Telematikai
Tansz{\'e}k (Besz{\'e}dakusztikai
Laborat{\'o}riuma) a Szegedi Tudom{\'a}nyegyetem Sz{\'a}m{\'i}t{\'a}studom{\'a}nyi
Tansz{\'e}k{\'e}vel
egy{\"u}ttmuk{\"o}dve. A magyar telefonbesz{\'e}d-adatb{\'a}zis
(MTBA) a statisztikai feldolgoz{\'a}si
m{\'o}dszereken alapul{\'o}, telefonon kereszt{\"u}l muk{\"o}do
besz{\'e}dfelismero rendszerek
betan{\'i}t{\'a}s{\'a}ra {\'e}s tesztel{\'e}s{\'e}re ad lehetos{\'e}get.
Ilyen lehets{\'e}ges alkalmaz{\'a}sok
az izol{\'a}lt szavas rendszerek, sz{\'o}kereso {\'e}s azonos{\'i}t{\'o}
rendszerek, dial{\'o}gusrendszerek,
valamint az {\'u}n. sz{\'o}t{\'a}rf{\"u}ggetlen felismerok, amelyekn{\'e}l
a felismer{\'e}s a sz{\'o}n{\'a}l
kisebb felismer{\'e}si egys{\'e}gek modellez{\'e}s{\'e}n alapul. Az adatb{\'a}zis
szab{\'a}lyrendszer{\'e}t
eur{\'o}pai szak{\'e}rtoi bizotts{\'a}gi aj{\'a}nl{\'a}sok alapj{\'a}n
[1, 2] szerkesztett{\"u}k meg.
Az EU adatb{\'a}zis-specifik{\'a}ci{\'o}ban nem szerepel a besz{\'e}d
fon{\'e}ma szintu szegment{\'a}ci{\'o}ja
{\'e}s c{\'i}mk{\'e}z{\'e}se. Mivel a specifik{\'a}ci{\'o} {\"o}ssze{\'a}ll{\'i}t{\'a}sa
{\'o}ta a besz{\'e}dkutat{\'a}s folyamatosan
fejlodik, egy most l{\'e}trehozand{\'o} adatb{\'a}zisn{\'a}l fontos az
adatb{\'a}zis egy r{\'e}sz{\'e}nek
fon{\'e}maszintu szegment{\'a}l{\'a}sa {\'e}s c{\'i}mk{\'e}z{\'e}se, hiszen
ez teszi lehetov{\'e} a sz{\'o}t{\'a}rf{\"u}ggetlen
rendszerek betan{\'i}t{\'a}s{\'a}t, {\'e}s {\'i}gy ilyen t{\'i}pus{\'u}
felismerok l{\'e}trehoz{\'a}s{\'a}t. A
k{\'e}sz{\"u}lo {\'u}j adatb{\'a}zis fon{\'e}maszintu szegment{\'a}l{\'a}st
{\'e}s c{\'i}mk{\'e}z{\'e}st is tartalmaz.
Az adatb{\'a}zis hanganyaga 500 besz{\'e}lo {\'a}ltal telefonon bemondott
sz{\"o}vegbol
(300 vezet{\'e}kes, 200 mobil h{\'i}v{\'a}s) {\'a}ll. Az {\"o}ssze{\'a}ll{\'i}tott
sz{\"o}veganyag a sokfeladatos
elv{\'a}r{\'a}soknak megfeleloen igen sokr{\'e}tu, v{\'a}ltozatos. Tartalmazza
p{\'e}ld{\'a}ul
a magyar telep{\"u}l{\'e}sneveket, a Magyarorsz{\'a}gon muk{\"o}do
legjelentosebb int{\'e}zm{\'e}nyek
neveit, valut{\'a}k neveit, d{\'a}tumokat, csal{\'a}d {\'e}s keresztneveket,
speci{\'a}lisan
a magyar nyelv saj{\'a}toss{\'a}gait t{\"u}kr{\"o}zo mondatokat
stb. },
journal={H{\'i}rad{\'a}stechnika},
volume={LVII},
year={2002},
pages={35-39},
number={8}
}
|
|