Megerősítéses tanulás
2012
Ajánlott könyvek:
A kurzus követelményei a következők:
-
Mindenkinek tartania kell majd egy kiselőadást a félév során,
amelyben egy megerősítéses tanulás
alkalmazásával foglalkozó tudományos publikációt dolgoz fel.
(Lehet az általam - majdan - felsorolt cikkekből választani,
illetve lehet külön is keresni;
de mindenképpen egyeztetni kell velem előtte.) Erre 20 pont kapható.
-
A félév során majdan kihirdetésre kerülő programozási feladatokat meg kell oldani,
és arról be kell számolni kiselőadás formájában.
(Milyen módszerekkel próbálkoztatok? Miért? Melyik mennyire volt sikeres? stb.)
Ezekre összesen 30 pont kapható.
-
Kollokvium 20 pontért.
Megajánlott jegy: 1. és 2. alapján. Amennyiben ez nem kielégítő, a kollokviumon szerzett pontszámmal kiegészétve az érdemjegy meghatározása a következőképpen történik:
-
71-80 pont: jeles
-
64-70 pont: jó
-
57-63 pont: közepes
-
51-56 pont: elégséges
-
0-50 pont: elégtelen
Egy rövid bevezető az alapfogalmak ismertetéséhez.
A sokkarú rabló probléma sztochasztikus változatához konstruált UCB-1, illetve a nem-sztochasztikus esettel foglalkozó Exp3 algoritmusok.
Egy leírás leírás és egy példa az UCT algoritmushoz.
Rövid bevezető a megerősítéses tanuláshoz:
video
Példák a megerősítéses tanulás alkalmazási területeire:
-
Pacman:
video
-
Íjász:
video
-
Palacsintasütő:
video
-
Egy előrejelzési probléma a légi irányításban
-
Játékhelikopter vezérlése:
video
-
Tőzsdei előrejelzések
Egyéb hasznos linkek: