Számítógépes látás projektek
Kató Zoltán
Egy-egy projekten 3-4 fős csapatok dolgoznak. A projektfeladat
megoldásához szükséges a kiírt probléma megértése, a megfelelő
megoldás (algoritmus) megtervezése és kódolása, egy rövid
projektjelentés megírása és mindezekhez egy weboldal
összeallítása. Szükség lehet angol nyelvű szakirodalom
tanulmányozására is. A projekten folyamatosan kell
dolgozni, a munka előrehaladását a félév folyamán 2
ellenőrzőpontban értékeljük, valamint a félév végén minden csapat
10-15 percben bemutatja a munkáját (védés).
A munka menete és értékelése
- 1. ellenőrzőpont [15%]:
- A projekt megoldásához szükséges szakirodalom
felkutatása.
- Az összegyűjtött cikkek áttanulmányozása - az azokban
leírt módszerek hogyan használhatók a feladat megoldásához.
- A fentiek alapján meg kell tervezni a projektfeladatot
megoldó algoritmust, melynek főbb lépéseit és az ahhoz
szükséges képleteket/algoritmusokat ki kell dolgozni.
- 2. ellenőrzőpont [15%]:
- A projektfeladatot megoldó végleges algoritmus részletes
kidolgozása.
- Az algoritmus implementálásához felhasználható külső
forráskódok felkutatása, azok funkciójának,
elérhetőségének megjelölésével.
- A saját fejlesztésű algoritmus-részek programozása.
Az algoritmus lényegi elemeit implementálni kell, a programnak
az algoritmus fő részeit hibamentesen kell végrehajtania.
- Projekt zárás, védés [30%]:
- A program végelegesítése, a tervezett algoritmus minden
funkcionalitásának implementálása.
- Az algoritmus tesztelése, a futási eredmények elemzése.
- Az algoritmus erős és gyenge oldalainak feltérképezése,
javaslat a hibák javítására, továbbfejlesztési lehetőségek
kidolgozása.
Project 1: Video background replacement
Replace the background in a video chat with something more fun. For
that purpose, you should:
- Detect the (moving) speaker on the video. This can be done by
either modeling the (static) background or by doing a
motion-based segmentation of each frame.
- Replace the background (so it appears the speaker is at another
place)
Your solution must be able to manipulate a chat video stream in
real-time (a few frame per seconds). Start your research here.
Team
Laczi Balázs, Sovány Pál, Szűcs Péter
Milestones
milestone 1 | Marks: 90%
milestone 2 | Marks: 83%
final | Marks: 70%
Project 2: View morphing
Given two images of an object taken from two different viewpoints,
produce a video sequence by virtually moving the camera between
the two views. Start your research here.
Team
Milestones
Project 3: Match Move
Match Move is a process in the film production community used for
special effects that require merging computer-generated (CG)
models with live action footage. In the movie Jurassic Park, for
instance, ILM used this procedure to register computer-generated
dinosaurs with real footage of Hawaiian landscapes. A key part of
this procedure is estimating the precise camera parameters for
each frame, and rendering the synthetic (computer generated)
characters from the same camera viewpoints.
You should take a few seconds of video (with camera motion),
track features, estimate camera parameters and render the
synthetic object with the same camera parameters then composite
each frame of the output video.
Team
Juhász Endre, Muhi Kornél, Urbán Szabolcs
Milestones
milestone 1 | Marks: 100%
milestone 2 | Marks: 95%
final | Marks: 80%
Project 4: Mobile distance meter
Implement a distance measuring device using a smartphone equiped with a stereo camera. Your solution shoul be capable to tell the distance between the camera and an object seen by the camera. For that purpose, you should calibrate the stereo camera pair and compute disparities.
Team
Berta Gábor, Nagy Péter, Novák Gábor, Somogyi Viktor Imre
Milestones
milestone 1 | Marks: 98%
milestone 2 | Marks: 95%
final | Marks: 85%
Last modified: Wed Jan 25 14:01:45 CET 2012