Jelenlegi hely

Szeminárium

Félév: 
2019/20 I. félév
Helyszín: 
Árpád tér 2. II. em. 220. sz.
Dátum: 
2019-10-22
Időpont: 
14:00-15:00
Előadó: 
Tóth László (Szoftverfejlesztés tanszék, tanszéki mérnök, PhD-hallgató)
Cím: 
Nyelvtechnológiai és gépi tanulási módszerek a Stack Overflow felhasználói kérdések minőségének értékeléséhez
Absztrakt: 

Az online Q&A fórumok, mint például a Stack Overflow, egyre fontosabb
szerepet játszanak a fejlesztők napi feladatainak támogatásában. Ezek
a websiteok olyan találkozási pontok a tapasztalt fejlesztők és a hobby
programozók közösségének, akik valamely fejlesztéssel összefüggő
problémájukra keresnek megoldás. Mivel ezeken a fórumokon bármely
fejlesztői háttérrel és tapasztalattal rendelkező felhasználó tehet fel
kérdéseket, és válaszolhat is azokra, a Q&A közösség különböző szabályok
segítségével próbálja meg fenntartani az adott oldal minőségét, mint
például a nem megfelelő hozzászólások lezárása és törlése útján.

A StackOverflow esetében több mint 8000 hozzászólás érkezik naponta,
amelyek ellenőrzése manuálisan rendkívül időigényes, ezért automatizált
megoldásokra van szükség. Kutatásunk olyan módszereket keres a probléma
megoldására, amelyek csak a beküldés során ismert szöveges információkra
támaszkodnak, nem használnak a felhasználóra, vagy a poszt múltjára
vonatkozó információkat. Ebben a megközelítésben rejlik kutatásunk
újdonsága, mert az eddigi kutatások eredményei támaszkodtak ezekre a
jellemzőkre, amely a gyakorlati alkalmazás szempontjából nehézséget
jelenthet egy adott kérdést megfogalmazó felhasználó számára. Modellünkben
természetes nyelvi feldolgozásra épülő módszereket és a mélytanulásban
alkalmazott technológiákat alkalmazzuk a StackOverflow kérdések
osztályozására minőség, illetőleg lezárás prediktálása céljából.

Eredményeink biztatóak, az osztályozást 70% feletti pontossággal sikerült
végrehajtanunk mind a minőség, mind a lehetséges lezárás meghatározása
során kizárólag a kérdés megfogalmazásakor ismert szöveges információkra
támaszkodva.