科技新勢力:機器視覺讓人類看到的世界更精彩
這五種感知能力中,我們大腦所接收的80%的信息都來自視覺,我問大家一個問題,如果我們不得不放棄四種感知能力,只保留一種,你會保留哪一種?
我相信在座的很多人答案跟我一樣,你會保留視覺信息。大家有沒有想過為什么?我們都知道有這樣一個數據,我們的大腦分成兩半,左腦和右腦,左腦是理性,右腦是感性的,是有創(chuàng)造力的。
還有一個數據可能大家并不知道,我們大腦有接近一千億個神經元,絕大多數只做一件事情,就是處理我們的視覺信息。大家想想當我們休息時,會做什么,通常會閉上我們的眼睛,所以每一天當我們的眼睛睜開時我們在主動或者被動地接受大量的復雜信息。
大家知道,我們人類主要是通過學習來成長,智慧也是在這樣的過程中提高。那么分享知識就非常重要。從幾千年前開始我們人類就把文字編輯成書。但文字承載的信息量是有限的,我們還希望它更加的豐富多彩。
所以到了100多年前有了電話,我們可以遠距離的讓聽到我們的聲音,后來我們就了廣播,終于幾十年前我們有了電視,到了十年前最近這段時間大家知道在網絡帶寬成為可能的情況下視頻網站才成為可能。
為什么從文字,到聲音,到視頻,一步一步到幾千年前,到最近幾年,才能隨時隨地的分享動態(tài)的畫面視頻?沒有其他原因,就是因為動態(tài)的視覺信息是最豐富的,也是最復雜的。
當我們討論人工智能,討論計算機、機器是否有學習能力時,我們首先要問自己一個問題,那就是機器有視覺嗎?我必須要這樣講,在今天絕大多數場合下,對我們絕大多數人來說,機器是沒有視覺的,機器是瞎子。
你們可能會反對我,會說我在用手機拍照,我的電腦上也有攝像頭,大街小巷有這么多攝像頭,難道它們不都是機器的眼睛嗎?難道這不是視覺嗎?但是大家想一想,當我們拍了這些照片視頻,最終計算機看懂這些視頻照片了嗎?
我們把它存下來,不管是單反相機、攝像機,拍完以后,最終還是要人處理這些信息。為什么?因為在絕大多數情況下,電腦是無法處理這種復雜信息的。
機器視覺給予我們一個更加互動的世界
但今天我也要告訴大家,實際上在很多領域,機器視覺已經在改變我們的生活。當我說到這兒時,可能很多人馬上會想到的第一件事情是微軟的體感游戲,當你做各種動作時它會理解你的行為,配合多媒體的體驗,你會感受到互動和豐富的感受。
所以,當機器有視覺的時候,首先帶給我們的就是一個更加互動的世界。在這兒我給大家看一段特別有意思的視頻,我的朋友黃沙,就用微軟的這個傳感器拍了一段動感的視頻。
我們知道,好萊塢電影和美劇在制作過程中會有一個綠色的背景,它就是做一件事情,就是把人和背景區(qū)分開,這樣后期制作時,就可以把綠色背景換成任何的場景,但有了三維計算機視覺,任何在座的每個人都能超越好萊塢特效師,更好地完成精彩的動畫,這只是個簡單的例子。
機器視覺帶給我們一個更加健康的世界
當機器有了視覺以后,還會給我們帶來一個更加健康的世界。舉個例子,在我們做心臟手術時有一件特別痛苦的事。大家知道,人的心臟是唯一不能夠被麻醉藥麻痹使它靜止的器官,只要人活著心臟就會不停的跳動,在跳動的心臟上做手術難度是非常大的。
所以,很多時候當要對心臟做手術的時候,醫(yī)生做的第一件事情就是通過醫(yī)學的手段讓心臟停止跳動,然后用最短的時間做完手術再讓心臟重新起搏,但將有30%心臟將會永遠不能再跳動起來。但如果有一種技術使醫(yī)生在跳動的心臟上做手術將會挽救很多人的人。
大家想一下,人的心臟跳動是非常有規(guī)律的,如果手術刀可以跟心臟同頻率振動,醫(yī)生通過攝像頭看到的就是相對靜止的心臟,那時動手術就相當于在靜止的心臟上做手術。
這個畫面上,白色的網格就是要做手術的區(qū)域,通過計算機深度視覺,已經把它穩(wěn)定下來了。心臟手術很多人看了可能會不舒服,所以我們做了這樣一個演示,醫(yī)生給葡萄剝皮,這在國外已經應用了,我相信不會很久中國也會應用。
機器視覺創(chuàng)造一個更加便捷的世界
剛才余凱博士也談到了自動駕駛汽車,大家想一想,當自動駕駛這一天來臨時,我們將有一個更加便捷的世界。各位極客可能對剛剛過去的2015美國電子消費展CES有更深刻的印象。
除了智能硬件以外,應該說2015年今年是自動駕駛的元年。奔馳、寶馬、尼桑,幾乎所有的車廠都在今年推出了自己自動駕駛汽車的計劃,很多車廠宣稱在2020年,就是五年以后,他們的自動駕駛汽車就會跑在大街小巷。
我在這里有個判斷,我個人覺得,自動駕駛汽車,將會是第一個真正被人類大規(guī)模使用,且對人類生活產生顛覆性影響,真正意義上的機器人。因為當汽車可以自動駕駛時,它對我們來說才是一個真正智能,不需要人為干預的機器人。
大家可能都看到過左邊這輛汽車,它其實就是Google的無人駕駛汽車。Google應該說是到現在為止全世界第一個讓自動駕駛汽車在人類的公路上行駛超過100萬公里的公司。
我曾經跟Google無人駕駛汽車負責人聊過,當時我開了個玩笑,你們Google自動駕駛汽車業(yè)只敢在美國這樣的城市測試,敢來北京測嗎?他當時告訴我,無人駕駛汽車這件事情要成功,最大的障礙和挑戰(zhàn)只有一個,那就是計算機視覺。
評論