Alakjellemzők
Az előzőleg tárgyalt egyszerű alakjellemzők önmagukban elég korlátozottan használhatók. Körök, téglalapok, négyzetek, elnyúlt vagy kompakt alakzatok különböztethetők meg. Szimbólumok, számok, betűk osztályozására önmagukban jobbára alkalmatlanok. Definiálhatunk olyan alakjellemzőket, amelyek több elemből állnak, vektort alkotnak. Megfelelően megválasztott alakjellemzők alkalmasak lehetnek arra, hogy segítségükkel képen előforduló alakzatok közötti hasonlóságot vizsgáljunk. Kis számú szimbólumkészlet alakzat-alapú szétválasztására alkalmasak lehetnek, beleértve különféle geometriai transzformációkkal szembeni invarianciát is.
Sokféle lehetőségünk van, néhány példa:
- Normalizált lánckód (kontúr alapján meghatározva)
- Fourier leíró (kontúr alapján meghatározva)
- Momentumok (Hu, Zernike, ...; területi kiterjedés alapján)
Az alakhasonlóság vizsgálatához az alábbi elvárásokat támaszthatjuk a jellemzőkkel szemben (invariancia):
- Legyen invariáns a pozícióra (eltolásra): ne függjön az értéke attól, hogy a képmátrixban hol jelenik meg ugyanaz az alakzat.
- Legyen invariáns az orientációra: az alakzat elforgatott változataira ugyanazon értéket adja.
- Legyen invariáns a(z egyforma mértékű) skálázásra: ugyanazon alakzat kisebb és nagyobb méretű változatai egyforma értéket kapjanak. (Kamera közelítés-távolítás esete.)
- Legyen invariáns a perspektív torzulásra: ilyen változást szenvednek el a síkszerű alakzatok, amiket változó térbeli irányból fotózunk. Általában megelégszünk az ezt közelítő affin-invarianciával (perspektív helyett affin torzulást veszünk).
Az alábbi ábrán kétféle alakzatot láthatunk többféle helyen, méretben, orientációban megjelenni. A célunk az lesz, hogy olyan alakjellemzőket definiáljunk, amelyek:
- Ugyanarra az alakzatra a deformációjától függetlenül ugyanazt a leírót adja. A gyakorlatban a digitális raszterképek diszkrét mintavételezése miatt nem lesznek tökéletesen egyformák az alakzatok, így a leírók esetén is megengedünk kisebb eltéréseket.
- Az is fontos persze, hogy más alakzat esetén más legyen a leíró.
A hasonlóságot vizsgálhatjuk a többelemű vektor-jellemzők vektoriális távolságával (Euklideszi távolság, korreláció (vektorok bezárt szöge), stb.), vagy bemenetként adhatjuk őket mesterséges intelligencia algoritmusoknak (k-means osztályozó, k-nn osztályozó, SVM, mesterséges neuronháló, stb.).
Ebben a részben a momentumok használatát tárgyaljuk alakzatok hasonlóságának vizsgálatára a momentum vektorok távolságának számításával.