3D手勢識別背后的技術
隨著觸摸屏技術的不斷推廣,用戶已經(jīng)適應并逐漸熟悉了與機器的互動。現(xiàn)在,人機互動技術已邁上了更高的臺階,進入了手勢識別時代,不過這也并不是一帆風順的。手勢識別現(xiàn)已在娛樂及游戲市場出現(xiàn),然而這種技術將對我們的日常生活產(chǎn)生怎樣的影響呢?不妨假想一下,有人坐在沙發(fā)上,只需一揮手就能操控燈光和電視,或者汽車自動檢測附近是否有行人。隨著手勢識別技術支持人機互動的不斷深入發(fā)展,這些及其它功能將很快得以實現(xiàn)。手勢識別技術長期以來一直采用 2D 視覺進行研究,但隨著 3D 傳感器技術的出現(xiàn),其應用將日益廣泛并多樣化。
2D視覺的局限
計算機視覺技術一直在努力向堪比人類智慧的智能方向發(fā)展,以更好地了解場景。如果不能解釋周圍的世界,計算機就無法與人實現(xiàn)自然交流對接。計算機在了解周圍場景方面面臨的主要問題包括細分、對象表征、機器學習與識別等。由于 2D 場景表征本身存在局限性,手勢識別系統(tǒng)必須應用其它各種提示信息才能得到包含更有用信息的更好結果。在可能性信息包含整個身體跟蹤時,盡管將多種提示信息整合在一起,單靠 2D 表征也很難獲得超越手勢識別的任何信息。
“z”(深度)創(chuàng)新
向 3D 視覺及手勢識別發(fā)展過程中的挑戰(zhàn)一直都是第三坐標 —z 軸坐標的獲取。人眼能看到 3D 對象,能自然識別 (x,y,z) 坐標軸,從而能夠看到一切事物,而后大腦能夠以 3D 影像的形式表達這些坐標軸。機器無法獲得 3D 視覺的一大挑戰(zhàn)就在于影像分析技術。目前有 3 種應對 3D 采集問題的常見解決方案,每種方案都有其獨特的功能與特定的用途。這三種方案分別為:立體視覺、結構光模式以及渡越時間 (TOF)。有了這些技術提供的 3D 影像輸出,就可實現(xiàn)手勢識別技術。
立體視覺
立體視覺系統(tǒng)可能是最為人所熟知的 3D 采集系統(tǒng)。該系統(tǒng)使用 2 個攝像機獲得左右立體影像,該影像有些輕微偏移,與人眼同序。計算機通過比較這兩個影像,就可獲得對應于影像中物體位移的不同影像。該不同影像或地圖可以是彩色的,也可以為灰階,具體取決于特定系統(tǒng)的需求。立體視覺系統(tǒng)目前通常用于 3D 電影,能帶來低成本而又震撼人心的娛樂體驗。
結構光模式
結構光模式可用來測量或掃描 3D 對象。在該類系統(tǒng)中,可在整個對象上照射結構光模式,光模式可使用激光照明干擾創(chuàng)建,也可使用投影影像創(chuàng)建。使用類似于立體視覺系統(tǒng)的攝像機,有助于結構光模式系統(tǒng)獲得對象的 3D 坐標。此外,單個 2D 攝像機系統(tǒng)也可用來測量任何單條的移位,然后通過軟件分析獲得坐標。無論使用什么系統(tǒng),都可使用坐標來創(chuàng)建對象外形的數(shù)字 3D 圖形?! ?/p>
渡越時間 (TOF)
渡越時間 (TOF) 傳感器是一種相對較新的深度信息系統(tǒng)。TOF 系統(tǒng)是一種光雷達 (LIDAR) 系統(tǒng),同樣可從發(fā)射極向對象發(fā)射光脈沖。接收器則可通過計算光脈沖從發(fā)射器到對象,再以像素格式返回到接收器的運行時間來確定被測量對象的距離。
TOF 系統(tǒng)不是掃描儀,因為其不支持點對點測量。TOF 系統(tǒng)可同時獲得整個場景,確定 3D 范圍影像。利用測量得到的對象坐標可創(chuàng)建 3D 影像,并可用于機器人、制造、醫(yī)療技術以及數(shù)碼攝影等領域的設備控制。
實施 TOF 系統(tǒng)所需的半導體器件現(xiàn)已開始供貨。目前的器件支持實現(xiàn) TOF 系統(tǒng)所需的處理性能、速度與帶寬。
三維掃描儀相關文章:三維掃描儀原理 全息投影相關文章:全息投影原理
評論