人工智能下一個(gè)前沿:機(jī)器視覺
國外科技網(wǎng)站Venturebeat發(fā)布文章稱,人工智能在過去一年里有著強(qiáng)勁的發(fā)展,給人們帶來越來越多的益處。而未來,機(jī)器視覺將會是人工智能的下一個(gè)前沿領(lǐng)域。隨著該類技術(shù)的發(fā)展,明年將會出現(xiàn)新型人工智能驅(qū)動的設(shè)備。
本文引用地址:http://www.ex-cimer.com/article/284183.htm機(jī)器為什么需要視覺呢?視覺是主要的感官。機(jī)器要能夠理解人類,提供他們所需的支持,那么它們必須能夠在視覺范疇進(jìn)行觀察和表現(xiàn)。具體形式可以是一個(gè)幫助盲人“看見”和理解周遭世界的小攝像頭,又或者能夠準(zhǔn)確區(qū)分流浪貓、在移動的樹枝和竊賊的家庭監(jiān)控系統(tǒng)。
正當(dāng)電子設(shè)備在人們的日常生活中變得日益重要,我們也發(fā)現(xiàn)越來越多的設(shè)備應(yīng)用因?yàn)闆]有足夠強(qiáng)大的視覺功能而失敗,如無人機(jī)在空中發(fā)生碰撞,機(jī)器人吸塵機(jī)吸掉不該吸的東西。
隨著研究人員應(yīng)用專門的神經(jīng)網(wǎng)絡(luò)來幫助機(jī)器識別和理解現(xiàn)實(shí)世界的圖像,機(jī)器視覺在過去幾年取得了巨大的進(jìn)步。如今的計(jì)算機(jī)在視覺識別上能夠做到各種各樣的事情,從識別網(wǎng)絡(luò)上的貓到在諸多的照片中識別特定的面孔。不過,該類技術(shù)還有很長的路要走。
當(dāng)前,機(jī)器視覺在走出數(shù)據(jù)中心,應(yīng)用于各類用途,從無人機(jī)的自動駕駛到食品整理。
基本的圖像分類已經(jīng)簡單多了,但在從復(fù)雜的場景中提取要義或者信息,機(jī)器則面臨著一系列的新問題。錯視問題便是機(jī)器視覺仍長路漫漫的一個(gè)很好的例證。
舉例來說,當(dāng)人看到兩張面對面的臉的輪廓圖像時(shí),他們看到的不僅僅是抽象的形狀。他們的大腦會進(jìn)行進(jìn)一步的解讀,讓他們能夠識別圖像的多個(gè)部分,看到兩張臉,又或者看到一個(gè)花瓶。
但對于機(jī)器來說,這樣的圖像是非常難以理解的。基本的分類器分辨不了兩張臉和花瓶,它看到的會是諸如短柄斧、吊鉤、避彈衣甚至吉他的物體。該系統(tǒng)并不能確定那些物體是在該圖像當(dāng)中,這說明這類圖像的識別對于機(jī)器而言極具挑戰(zhàn)性。
另外,正如復(fù)雜的圖像,現(xiàn)實(shí)世界也十分凌亂。在當(dāng)中正常航行可不是光開發(fā)算法分析數(shù)據(jù)就能夠?qū)崿F(xiàn)的,它需要對真實(shí)場景有清楚的了解,進(jìn)而能夠相應(yīng)作出行動。
機(jī)器人和無人機(jī)面臨著大量這樣的障礙,克服這些挑戰(zhàn)對于參與人工智能革命的人來說便是重中之重。
隨著神經(jīng)網(wǎng)絡(luò)、專門的機(jī)器視覺硬件等技術(shù)的持續(xù)普及,機(jī)器視覺和人類視覺之間的鴻溝正在快速縮小。不久之后,甚至可能會出現(xiàn)視覺能力更勝人類的機(jī)器人,它們能夠執(zhí)行各類錯綜復(fù)雜的任務(wù),能夠完全自動化地運(yùn)作。
評論