Adatbányászat tételek, 2008 tavasz 1. Adatbányászat fogalma, OLAP, tipikus feladatok, részterületek. Jellemzőkinyerés és adatreprezentáció elemei. 2. A nagydimenziós tér néhány tulajdonsága. Jellemzőszelekció. 3. Dimenziócsökkentés. 4. Távolságok, hasonlósági mértékek, szerkesztési távolság, Smith-Waterman, FASTA, BLAST, dinamikus idővetemítés. 5. Klaszterezés. 6. Regressziók. KNN, LVQ. 7. Osztályozási és rangsorolási problémák. Gépi tanulási kritériumok. 8. Modellek kiértékelése. Osztályozók kombinációja. 9. Döntési fák, véletlen erdők, neurális hálók, SVM. 10. Naive Bayes, HMM. 11. Bevezetés a szövegbányászatba (és webbányászat).