Megerősítéses tanulás

2012





Ajánlott könyvek:


A kurzus követelményei a következők:
  1. Mindenkinek tartania kell majd egy kiselőadást a félév során, amelyben egy megerősítéses tanulás alkalmazásával foglalkozó tudományos publikációt dolgoz fel. (Lehet az általam - majdan - felsorolt cikkekből választani, illetve lehet külön is keresni; de mindenképpen egyeztetni kell velem előtte.) Erre 20 pont kapható.
  2. A félév során majdan kihirdetésre kerülő programozási feladatokat meg kell oldani, és arról be kell számolni kiselőadás formájában. (Milyen módszerekkel próbálkoztatok? Miért? Melyik mennyire volt sikeres? stb.) Ezekre összesen 30 pont kapható.
  3. Kollokvium 20 pontért.
Megajánlott jegy: 1. és 2. alapján. Amennyiben ez nem kielégítő, a kollokviumon szerzett pontszámmal kiegészétve az érdemjegy meghatározása a következőképpen történik:


Egy rövid bevezető az alapfogalmak ismertetéséhez.


A sokkarú rabló probléma sztochasztikus változatához konstruált UCB-1, illetve a nem-sztochasztikus esettel foglalkozó Exp3 algoritmusok.


Egy leírás leírás és egy példa az UCT algoritmushoz.


Rövid bevezető a megerősítéses tanuláshoz: video



Példák a megerősítéses tanulás alkalmazási területeire:


Egyéb hasznos linkek: