3D手勢識別背后的技術(shù)
3D 視覺技術(shù)的比較
不同的應(yīng)用或市場適用于不同的 3D 視覺技術(shù)。圖 1 顯示了不同 3D 視覺技術(shù)的比較及其相關(guān)響應(yīng)時間、軟件復(fù)雜性、成本及準(zhǔn)確性的相對優(yōu)缺點(diǎn)。
立體視覺技術(shù)需要極高的軟件復(fù)雜性才能獲得高精度 3D 深度數(shù)據(jù),其通常可通過數(shù)字信號處理器 (DSP) 或多內(nèi)核標(biāo)量處理器進(jìn)行處理。立體視覺系統(tǒng)支持小巧的外形與低成本,是移動電話等消費(fèi)類設(shè)備的良好選擇。不過,立體視覺系統(tǒng)的精確度與響應(yīng)時間不及其它技術(shù),因此對于制造質(zhì)量控制系統(tǒng)等要求高精度的系統(tǒng)來說不太理想。
結(jié)構(gòu)光技術(shù)是包括 3D 計算機(jī)輔助設(shè)計 (CAD) 系統(tǒng)在內(nèi)的 3D 對象掃描的良好解決方案。這些系統(tǒng)的相關(guān)軟件復(fù)雜性可通過硬接線邏輯解決(如 ASIC 與 FPGA 等),其需要高昂的開發(fā)及材料成本。此外,該計算復(fù)雜性還可導(dǎo)致較慢的響應(yīng)時間。在實現(xiàn)微觀層面上的高精度方面,結(jié)構(gòu)光模式技術(shù)優(yōu)于其它 3D 視覺技術(shù)。
TOF 系統(tǒng)取得了性能與成本的平衡,非常適用于需要快速響應(yīng)時間的制造與消費(fèi)類電子設(shè)備等應(yīng)用領(lǐng)域的設(shè)備控制。TOF 系統(tǒng)軟件復(fù)雜程度通常較低,不過這些系統(tǒng)需要昂貴的照明部件(LED、激光二極管)以及高速接口相關(guān)部件(快速 ADC、快速串行/并行接口、快速 PWM 驅(qū)動器),這將提升材料成本。圖 1 顯示了這三種 3D 傳感器技術(shù)的對比情況。
“z”(深度)如何影響人機(jī)界面
隨著“z”坐標(biāo)的加入,顯示與影像更接近自然,更貼近人類。人們在顯示屏上能看到人眼從周邊環(huán)境所看到的逼真事物。增加這第三維坐標(biāo)改變了可使用的顯示與應(yīng)用類型。
顯示
立體顯示屏
立體顯示屏通常需要用戶佩戴 3D 眼鏡。這種顯示屏為左右眼提供不同的影像,兩眼看到的影像不同,讓大腦誤以為看到了 3D 影像。這種顯示屏目前廣泛用于眾多 3D 電視與 3D 電影院。
多視點(diǎn)顯示屏
多視點(diǎn)顯視屏不同于立體顯示屏,無需佩戴特殊眼鏡。這些顯示屏可同時投射多個影像,每個影像稍微有些位移,形成適當(dāng)?shù)慕嵌龋層脩艨稍诿總€視點(diǎn)角度看到相同對象的不同投射影像。這些顯示屏支持全息攝影效果,在不久的將來將實現(xiàn)全新的 3D 體驗。
檢測與應(yīng)用
處理并顯示“z”坐標(biāo)的功能將實現(xiàn)全新的應(yīng)用,其中包括游戲、制造控制、安全、互動數(shù)字標(biāo)牌、遠(yuǎn)程醫(yī)療、汽車以及機(jī)器人視覺等。圖 2 是身體骨架與深度映射傳感技術(shù)所支持的某些應(yīng)用領(lǐng)域視圖。
人類手勢識別(消費(fèi)類)
人類手勢識別是一項深受歡迎的新技術(shù),可為游戲、消費(fèi)類以及移動產(chǎn)品帶來新的輸入方式。用戶能夠以極其自然、直觀的方法與設(shè)備進(jìn)行互動,從而可促進(jìn)產(chǎn)品推廣。這些人類手勢識別產(chǎn)品包括從 160 x 120 像素到 640 x 480 像素,30 到 60 fps 的各種分辨率的 3D 數(shù)據(jù)。原始數(shù)據(jù)到z深度解析、雙手跟蹤以及全身跟蹤等軟件模塊需要數(shù)字信號處理器 (DSP) 對 3D 數(shù)據(jù)進(jìn)行高效快速處理,才能實現(xiàn)實時游戲與跟蹤。
工業(yè)
工業(yè)與制造傳感器等大多數(shù) 3D 視覺工業(yè)應(yīng)用都采用至少 1 像素至數(shù) 100k 像素的影像系統(tǒng)。3D 影像可使用 DSP 技術(shù)進(jìn)行控制分析,確定制造瑕疵或者從部件集中選擇正確的部件。
互動數(shù)字標(biāo)牌(精確定位的市場營銷工具)
每天我們都在遭受廣告的轟炸,無論是看電視、開車還是在機(jī)場登機(jī)都是如此。有了互動數(shù)字標(biāo)牌,企業(yè)就可通過精確定位的市場營銷工具提供適合每位消費(fèi)者的內(nèi)容。例如,有人走過一個數(shù)字標(biāo)牌,標(biāo)牌上可能就會馬上顯示額外的消息確認(rèn)該客戶。如果客戶停下來閱讀信息,該標(biāo)牌可能會理解為客戶對產(chǎn)品感興趣,并提供更有針對性的消息。麥克風(fēng)則將讓廣告牌檢測并識別關(guān)鍵短語,進(jìn)一步精確定位所提供的消息。
這些互動數(shù)字標(biāo)牌系統(tǒng)將需要 3D 傳感器進(jìn)行全面的身體跟蹤,2D 傳感器進(jìn)行面部識別,并需要麥克風(fēng)進(jìn)行語音識別。這些系統(tǒng)的軟件將運(yùn)行在更高級的 DSP 及通用處理器 (GPP) 上,不但可實現(xiàn)面部識別、全面的身體跟蹤以及 Flash 媒體播放器等應(yīng)用,而且還可提供諸如 MPEG4 視頻解碼等功能。
醫(yī)療(無故障虛擬/遠(yuǎn)程護(hù)理)
3D 視覺將為醫(yī)療領(lǐng)域帶來前所未有的全新應(yīng)用。醫(yī)生無需跟患者共處一室就可問診。遠(yuǎn)程虛擬護(hù)理采用高精度 3D 傳感器支持的醫(yī)學(xué)機(jī)器人視覺系統(tǒng),可確保為每一位患者提供最優(yōu)質(zhì)的醫(yī)療護(hù)理,無論他們身處何方。
評論