english

DrFarkasRichárd

egyetemi tanársegéd

SzegediTudományegyetem

INFORMATIKAI TANSZÉKCSOPORT

email: rfarkas AT inf.u-szeged.hu

szoba: IR fsz. MestInt Kutatócsoport 45.

» Számítógépes nyelvészeti alkalmazások speckoll.

» Mesterséges Intelligencia I. gyakorlat

» Mesterséges Intelligencia előadás anyagok

Diplomamunka/TDK témák:

Gépi tanulási technikák a szövegbáynászatban

A szövegbányászat célja, hogy az emberek által írt folyó szöveges adattengerből (weblapok, blogok, céges belső jelentések) automatikusan kiemelje a lényeges információt. Ehhez speciális gépi tanulási (mesterséges intelligencia) megoldásokra van szükség, mint például

Webbányászat

Az Interneten elérhető adat (aminek 80% folyó szöveg) exponenciálisan növekszik, azonban a jelenlegi keresőrendszerek nem minden esetben képesek a szükséges információ összegyűjtésére. A diplomamunka témája lehet egy bizonyos erősen leszűkített keresésnek a megvalósítása és tesztelése, ami lehet például:

vagy a webbányászathoz szükséges alaptechnikák módszeres körüljárása, mint például:

BiológiaiEseményekazonosításatermészetesnyelvűszövegekben

Tudományos cikkekben leírt összefüggések, kísérletek (prior-art) ismerete elengedhetetlen a biológus kutatók munkájához. A közlemények nagy száma szükségessé teszi ennek (fél-)automatizálását. A feladat számítógépes nyelvészeti, gépi tanulási megközelítésben a terület egy-egy részproblémájának körüljárása. A feladatokhoz általában rendelkezésre állnak előre feldolgozott tudományos szövegekből álló (tanító) adatbázisok, melyekben a szükséges információt biológusok bejelölték, így azok biológiai ismereteket nem igényelnek. Lehetséges részfeladatok: