Affine Correspondences and Challenges in Multi-Sensor Systems
computer vision
image processing
robust estimation
sensor fusion
3D reconstruction
calibration
depth camera
Time-of-Flight
LiDAR
camera
affine correspondences
Informatika D. I./Az informatika alapjai és módszerei.
számítógépes látás
képfeldolgozás
robusztus becslés
szenzorfúzió
3D rekonstrukció
kalibráció
mélységkamera
Time-of-Flight
LiDAR
kamera
affin megfeleltetések
Abstract:
A kamerák és a különböző mélységérzékelők rendszerei a kutatásban és az ipari alkalmazásokban is széles körben használatosak a környezet felderítésére, elemzésére. Eltérő működési elvükből fakadóan bizonyos körülmények között néhány eszköz jobban teljesít ott, ahol más szenzorok elbuknak (pl. passzív kamerák egy fényszegény környezetben). Különböző nézőpontokból, illetve modalitások segítségével pedig a környezet további részleteit fedhetjük fel, amelyre egy szenzor önmagában képtelen. A szenzoradatok fúziója, valamint a kalibráció és a többnézetű geometria elmélete mind kritikus téma, amelyek ezen disszertáció tárgykörébe tartoznak.
A legtöbb alkalmazás megköveteli, hogy képesek legyünk a különböző érzékelőkre egy közös koordináta-rendszerben hivatkozni. Ezt a célt szolgálja a kalibráció folyamata, amelynek során a szenzornézeteket leíró paraméterek becslése és finomítása történik. Ezen probléma megoldásához – a legtöbb geometriai feladathoz hasonlóan – általában egymásnak megfeleltetett pontokat használunk. A megfeleltetéseken keresztül lehetséges az eltérő referenciarendszerek közötti geometria (pl. az epipoláris geometria) meghatározása. Egy következő lépés a környezet rekonstrukciója lehet: a trianguláció segítségével felületek 3D-s pontjait határozhatjuk meg. A képsík egy jellemző pontját – amelyhez további megfelelőket keresünk – általában egy képi régió középpontjaként határozzuk meg. Ezen felül a régió alakja és tájolása is hasznos geometriailag, mivel kapcsolódik a felület vetületéhez. A számítógépes látás területén végzett kutatások csupán egy kis része foglalkozik a régiók alakjában rejlő további lehetőségekkel; és ezekben az esetekben is az egyszerű lyukkameramodellt alkalmazzák. Az érzékelők fúziója a környezetet vizsgáló modern rendszerek fontos része. Eltérő nézetek és modalitások (pl. mélységképek és színes képek) egészíthetik ki egymást egy-egy kihívást jelentő helyzetben. Az alacsony felbontású ToF mélységkamera képe feljavítható egy hasonló perspektivikus nézettel rendelkező hagyományos, nagyfelbontású kamera képével kombinálva, miközben a mélység felhasználható pl. a színes kép utólagos fókuszváltásához.
Az értekezésben elméleti és algoritmikus értelemben vizsgálom az affin megfeleltetéseket két és több nézetű becslési feladatokban, a gyors, robusztus és jó minőségű eredmények érdekében. Ezután a színes-, valamint az alacsonyabb felbontású ToF mélység-kamerák adatfúzióját tárgyalom képkockapárokra, illetve mozgóképekre. Végül a többérzékelős rendszerek kalibrációját tárgyalom LiDAR-ok és kamerák kombinációi esetén.