三維掃描儀:機(jī)器視覺簡(jiǎn)介
三維掃描儀機(jī)器視覺是研究用計(jì)算機(jī)來模擬生物外顯或宏觀視覺功能的科學(xué)和技術(shù)。機(jī)器視覺系統(tǒng)的首要目標(biāo)是用圖像創(chuàng)建或恢復(fù)現(xiàn)實(shí)世界模型,然后認(rèn)知現(xiàn)實(shí)世界。機(jī)器視覺系統(tǒng)獲取的場(chǎng)景圖像一般是灰度圖像,即三維場(chǎng)景在二維平面上的投影。此時(shí),場(chǎng)景三維信息只能通過灰度圖像或灰度圖像序列來恢復(fù)處理,這種恢復(fù)需要進(jìn)行多點(diǎn)對(duì)一點(diǎn)的映射逆變換。在信息恢復(fù)過程中,還需要有關(guān)的場(chǎng)景知識(shí)和投影幾何知識(shí)。
三維掃描儀機(jī)器視覺是一個(gè)相當(dāng)新且發(fā)展十分迅速的研究領(lǐng)域,并成為計(jì)算機(jī)科學(xué)的重要研究研究領(lǐng)域之一。機(jī)器視覺是在20 世紀(jì)50 年代從統(tǒng)計(jì)模式識(shí)別開始的,當(dāng)時(shí)的工作主要集中在二維圖像分析和識(shí)別上,如光學(xué)字符識(shí)別、工件表面、顯微圖片和航空?qǐng)D片的分析和解釋等。60 年代,Roberts (1965)通過計(jì)算機(jī)程序從數(shù)字圖像中提取出諸如立方體、楔形體、棱柱體等多面體的三維結(jié)構(gòu),并對(duì)物體形狀及物體的空間關(guān)系進(jìn)行描述。Roberts 的研究工作開創(chuàng)了以理解三維場(chǎng)景為目的的三維機(jī)器視覺的研究。Roberts對(duì)積木世界的創(chuàng)造性研究給人們以極大的啟發(fā),許多人相信,一旦由白色積木玩具組成的三維世界可以被理解,則可以推廣到理解更復(fù)雜的三維場(chǎng)景。于是,人們對(duì)積木世界進(jìn)行了深入的研究。研究的范圍從邊緣、角點(diǎn)等待征提取,到線條、平面、曲面等幾何要素分析,—直到圖像明暗、紋理、運(yùn)動(dòng)以及成像幾何等,并建立了各種數(shù)據(jù)結(jié)構(gòu)和推理規(guī)則。到了70 年代,已經(jīng)出現(xiàn)了一些視覺應(yīng)用系統(tǒng)。
70 年代中期,麻省理工學(xué)院(MIT)人工智能(AI)實(shí)驗(yàn)室正式開設(shè)“機(jī)器視覺”(Machine Vision)課程,由國(guó)際著名學(xué)者B.K.P.Horn 教授講授.同時(shí),MIT AI實(shí)驗(yàn)室吸引了國(guó)際上許多知名學(xué)者參與機(jī)器視覺的理論、算法、系統(tǒng)設(shè)計(jì)的研究。David Marr 教授就是其中的一位。他于1973 年應(yīng)邀在MIT AI 實(shí)驗(yàn)室領(lǐng)導(dǎo)一個(gè)以博士生為主體的研究小組,1977 年提出了不同于“積木世界”分析方法的計(jì)算視覺(computational vision)理論,該理論在80 年代成為機(jī)器視覺研究領(lǐng)域中的一個(gè)十分重要的理論框架。
Marr 視覺計(jì)算理論立足于計(jì)算機(jī)科學(xué),系統(tǒng)地概括了心理生理學(xué)、神經(jīng)生理學(xué)等方面業(yè)已取得的所有重要成果。是三維掃描儀視覺研究中迄今為止最為完善的視覺理論。Marr建立的視覺計(jì)算理論,使計(jì)算機(jī)視覺研究有了一個(gè)比較明確的體系,并大大推動(dòng)了計(jì)算機(jī)視覺研究的發(fā)展。人們普遍認(rèn)為,計(jì)算機(jī)視覺這門學(xué)科的形成與Marr 的視覺理論有著密切的關(guān)系。Marr 視覺計(jì)算理論將整個(gè)視覺過程所要完成的任務(wù)分成三個(gè)過程,而獲得這些表示的過程依次稱為初級(jí)視覺、中級(jí)視覺和高級(jí)視覺,如圖1 所示。
Marr 視覺過程中的三個(gè)階段
補(bǔ)充的Marr 理論框架
評(píng)論