Számítógépes látás projektek
Kató Zoltán
Egy-egy projekten 3-4 fős csapatok dolgoznak. A projektfeladat
megoldásához szükséges a kiírt probléma megértése, a megfelelő
megoldás (algoritmus) megtervezése és kódolása, egy rövid
projektjelentés megírása és mindezekhez egy weboldal
összeallítása. Szükség lehet angol nyelvű szakirodalom
tanulmányozására is. A projekten folyamatosan kell
dolgozni, a munka előrehaladását a félév folyamán 2
ellenőrzőpontban értékeljük, valamint a félév végén minden csapat
10-15 percben bemutatja a munkáját (védés).
A munka menete és értékelése
- 1. ellenőrzőpont [15%]:
- A projekt megoldásához szükséges szakirodalom
felkutatása.
- Az összegyűjtött cikkek áttanulmányozása - az azokban
leírt módszerek hogyan használhatók a feladat megoldásához.
- A fentiek alapján meg kell tervezni a projektfeladatot
megoldó algoritmust, melynek főbb lépéseit és az ahhoz
szükséges képleteket/algoritmusokat ki kell dolgozni.
- 2. ellenőrzőpont [15%]:
- A projektfeladatot megoldó végleges algoritmus részletes
kidolgozása.
- Az algoritmus implementálásához felhasználható külső
forráskódok felkutatása, azok funkciójának,
elérhetőségének megjelölésével.
- A saját fejlesztésű algoritmus-részek programozása.
Az algoritmus lényegi elemeit implementálni kell, a programnak
az algoritmus fő részeit hibamentesen kell végrehajtania.
- Projekt zárás, védés [30%]:
- A program végelegesítése, a tervezett algoritmus minden
funkcionalitásának implementálása.
- Az algoritmus tesztelése, a futási eredmények elemzése.
- Az algoritmus erős és gyenge oldalainak feltérképezése,
javaslat a hibák javítására, továbbfejlesztési lehetőségek
kidolgozása.
Project 1: Match Move
Match Move is a process in the film production community used for
special effects that require merging computer-generated (CG)
models with live action footage. In the movie Jurassic Park, for
instance, ILM used this procedure to register computer-generated
dinosaurs with real footage of Hawaiian landscapes. A key part of
this procedure is estimating the precise camera parameters for
each frame, and rendering the synthetic (computer generated)
characters from the same camera viewpoints.
You should take a few seconds of video (with camera motion),
track features, estimate camera parameters and render a simple
synthetic object with the same camera parameters then composite
each frame of the output video. Start your research here. Compare
your results with those obtained by one of the freely available
match move softwares.
Team
Milestones
Project 2: Virtual Pointer
Implement a virtual pointer for PowerPoint lectures.
- Install one or two cheap webcameras in the lecture room such that
they can capture the lecturer even if he is moving around (you
can restrict the coverage to near the projection screen)
- detect where the lecturer is pointing (your algorithm should be
as precise as possible in determining the direction)
- and if he is pointing at the projection screen then automatically
highlight the pointed part in the PowerPoint slide.
The behavior of your virtual pointer should be similar to a laser
pointer. However, unlike a laser pointer, the highlighted area
should be much larger hence easier to see.
Team
Milestones
Project 3: Intelligent Alarm Clock
Design an "Intelligent Alarm Clock" that can tell if you have
actually gotten up, and will sound again if you fall
back to sleep. The solution must be robust to motion of other
persons/animals - ie. it should reliably detect whether the
sleeping person is actually moving.
Team
Milestones
Project 4: Virtual Mouse
In this project, you will implement
a system where a camera interprets your hand movements and finger
gestures. These movements are then interpreted as real mouse events,
much like a touch pad would do:
- Index finger motion would be a mouse motion event,
- Index finger tap would be a left click...
The camera position could be the top of the monitor, but other
locations are also possible. Use your imagination!
You can use the CONDENSATION algorithm to track finger movement.
here
Team
Milestones
Last modified: Mon 19 Sep 2022 05:27:08 PM CEST