基于模型的單目視覺定位方法研究概述
1 引言
本文引用地址:http://www.ex-cimer.com/article/163839.htm視覺是人類認(rèn)識世界的最重要的手段之一,人類獲取的信息百分之八十以上都是通過視覺得到的。隨著計(jì)算機(jī)技術(shù)、傳感器技術(shù)的發(fā)展,使用攝像機(jī)與計(jì)算機(jī)模擬并實(shí)現(xiàn)部分生物視覺成為可能,并已在許多方面得到成功應(yīng)用。同時,如何利用信號處理和計(jì)算機(jī)技術(shù)對圖像信息進(jìn)行處理、分析、理解、識別,并最終做出正確的決策成為一個新的研究領(lǐng)域,由此形成一門新興的學(xué)科,即計(jì)算機(jī)視覺。
可以獲得三維信息的視覺方法有許多,典型的有雙目或多目立體視覺,基于模型的單目視覺等。其中后一種方法是指僅利用一臺攝像機(jī)完成定位工作。因其僅需一臺視覺傳感器,所以該方法的優(yōu)點(diǎn)是結(jié)構(gòu)簡單、相機(jī)標(biāo)定也簡單,同時還避免了立體視覺中的視場小,立體匹配困難的不足。其前提條件是必須已知物體的幾何模型。在計(jì)算機(jī)視覺研究領(lǐng)域,如何在單目視覺的條件下,完成位置與姿態(tài)的求解已成為一個重要的研究方向。
基于模型的單目視覺定位可以應(yīng)用在多方面,包括機(jī)器人自主導(dǎo)航、陸地和空間移動機(jī)器人定位、視覺伺服、攝像機(jī)校正、目標(biāo)跟蹤、視覺監(jiān)測、物體識別、零部件裝配、攝影測量等。
基于模型的單目視覺定位問題所應(yīng)用的幾何特征可分為點(diǎn)、直線與高級幾何特征等幾類。相對來說,目前對基于點(diǎn)特征的單目視覺定位方法研究較多。直線特征具有抗遮擋能力強(qiáng)、圖像處理簡單的優(yōu)點(diǎn),所以有一部分學(xué)者致力于基于直線特征單目視覺定位方法的研究。而基于高級幾何特征的單目視覺定位方法目前研究的還比較少。
本文根據(jù)基于模型的單目視覺定位方法所使用的定位特征類型把單目視覺定位方法分為基于點(diǎn)特征的定位方法,基于直線特征的定位方法,基于高級幾何特征的定位方法,全面介紹了各種特征定位方法的研究現(xiàn)狀。目的是方便讀者了解各種特征定位方法的研究現(xiàn)狀,為未來的研究打下理論基礎(chǔ)。
2 點(diǎn)特征定位
點(diǎn)特征定位又稱為PNP問題[1],它是計(jì)算機(jī)視覺、攝影測量學(xué)乃至數(shù)學(xué)領(lǐng)域的一個經(jīng)典問題。PNP問題是在1981年首先由Fischler和Bolles[2]提出的,即給定N個控制點(diǎn)的相對空間位置以及給定控制點(diǎn)與光心連線所形成的夾角,求出各個控制點(diǎn)到光心的距離,如圖1所示。該問題主要被用來確定攝像機(jī)與目標(biāo)物體之間的相對距離和姿態(tài)。
圖1 點(diǎn)的透視投影
經(jīng)典的問題從本質(zhì)上來說是非線性的,而且具有多解性。目前對PNP問題的研究主要包括兩個方面:設(shè)計(jì)運(yùn)算速度快、穩(wěn)定的算法,來尋找PNP問題的所有解或部分解。對多解現(xiàn)象的研究。即找出在什么條件下有1個、2個、3個或者4個解。
PNP問題的研究集中在對P3P問題、P4P問題、P5P問題的研究上。這是因?yàn)槿绻麅H使用兩個特征點(diǎn)即P2P問題有無限組解,其物理意義是僅有兩個點(diǎn)不能確定兩點(diǎn)在攝像機(jī)坐標(biāo)系下的位置。而特征點(diǎn)的個數(shù)應(yīng)該大于五,PNP問題變成了經(jīng)典的DLT問題,是可以線性求解的。目前,人們對P3P、P4P 問題已研究的比較清楚,并有如下結(jié)論:P3P 問題最多有4個解,且解的上限可以達(dá)到,對于P4P問題,當(dāng)4個控制點(diǎn)共面時,問題有唯一解,當(dāng)4個控制點(diǎn)不共面時,問題最多可能有5個解,且解的上限可以達(dá)到。對于P5P問題,當(dāng)5個控制點(diǎn)中任意3點(diǎn)不共線時,則P5P問題最多可能有兩個解,且解的上限可以達(dá)到。
3 直線特征定位
當(dāng)前,基于模型單目視覺定位的模型特征分為點(diǎn)、直線與高級幾何特征等幾類。相對來說,目前對于基于點(diǎn)特征的單目視覺定位方法研究較多,對于基于直線特征的單目視覺定位方法的研究還比較少。在某些特定的環(huán)境中,采用直線特征進(jìn)行定位比采用點(diǎn)特征進(jìn)行定位具有一定的優(yōu)勢。直線特征的優(yōu)勢表現(xiàn)在以下幾方面:首先,自然環(huán)境的圖像包含很多的直線特征。其次,在圖像上直線特征比點(diǎn)特征的提取精度更高。最后,直線特征抗遮擋能力比較強(qiáng)。同時相對于更高級的幾何特征,直線特征也具有優(yōu)勢,具體表現(xiàn)在以下幾方面:首先,在周圍自然環(huán)境的圖像中,直線比其他的高級幾何特征更常見,同時也更容易提取。其次,直線的數(shù)學(xué)表達(dá)式更簡單,處理起來效率更高。因此綜合來看,在某些方面采用直線特征進(jìn)行視覺定位具有其它特征所不具有的一些優(yōu)勢,在實(shí)現(xiàn)高精度、實(shí)時自主定位方面有著廣泛的應(yīng)用前景。
對于空間恢復(fù),至少需要非共線的三個特征點(diǎn)來獲得唯一解。如果使用直線,則需要三條直線,三條直線不同時平行且不和光心共面。目前,理論上研究最多的是利用三線定位的問題,即Perspective Projection of Three Lines,以下簡稱P3L問題,如圖2所示。
評論