院士鄔賀銓:人工智能的魅力是“永遠(yuǎn)在路上”
深度神經(jīng)網(wǎng)絡(luò)實(shí)際上是個(gè)分類器
本文引用地址:http://www.ex-cimer.com/article/201901/396443.htm現(xiàn)在深度神經(jīng)網(wǎng)絡(luò),就算你寫本書告訴計(jì)算機(jī)什么是貓什么是狗,它也學(xué)不會(huì),但如果像對待人類小孩的教學(xué)方式那樣,感性地把一堆貓和狗的視頻送到深度神經(jīng)網(wǎng)絡(luò),它就會(huì)分類,分類結(jié)束后,如果照片視頻上有標(biāo)簽,它就會(huì)知道分的這類是貓。如果籃子里有個(gè)小狗,放進(jìn)去,它照樣會(huì)分類為“狗”。所以深度神經(jīng)網(wǎng)絡(luò)實(shí)際上是個(gè)分類器,當(dāng)你告訴它是什么,它就學(xué)會(huì)了。
機(jī)器學(xué)習(xí)是深度神經(jīng)網(wǎng)絡(luò)的主要技術(shù),從近10年里機(jī)器學(xué)習(xí)的論文里可以發(fā)現(xiàn),現(xiàn)在機(jī)器學(xué)習(xí)的技術(shù)熱點(diǎn),可以看到神經(jīng)網(wǎng)絡(luò)和進(jìn)化編程等計(jì)算密集型算法在機(jī)器學(xué)習(xí)研究中的出色表現(xiàn)。
人每天吃飯大概要輸入2500卡路里的能量,卡路里換算成焦耳大概是1000萬焦耳,下圍棋5個(gè)小時(shí)大概要消耗人類3.3兆焦耳。AlphaGo跟李世石下棋時(shí)用了1000多個(gè)CPU,176個(gè)GPU,一個(gè)CPU功率100W,1個(gè)GPU200W,換算出來是173000W(這是以秒計(jì)的),如果5小時(shí)就是3000兆焦耳,這相當(dāng)于李世石用的能耗是AlphaGo能耗的千分之一,也就是說,人工智能目前還需要很大的能量支持。
后來隔了一年,改進(jìn)了AlphaGo Zero,換算成TPU,它只是AlphaGo原有1/12(能耗),用1/12的能耗跟AlphaGo下棋,100比0,當(dāng)時(shí)AlphaGo還要搜集所有的圍棋棋譜,然后訓(xùn)練三個(gè)月,AlphaGoZero只需要了解圍棋的規(guī)則,兩個(gè)AlphaGoZero互相對應(yīng),能把所有人類沒有走過的棋譜都走完,它就能戰(zhàn)勝了。所以優(yōu)化算法、改進(jìn)硬件,包括GPU替換CPU(提高了三倍),TPU替換GPU(提高了15到30倍)。
最近不單AlphaGo Zero圍棋天下無敵,而且通過自學(xué)2個(gè)小時(shí),還擊敗了日本的將棋(有點(diǎn)像中國的象棋),自學(xué)4個(gè)小時(shí),把國際象棋也全部打贏了。
人工智能能做的事情有太多
在醫(yī)學(xué)上,剛剛過去的三個(gè)月,谷歌在機(jī)器學(xué)習(xí)又開發(fā)了Alpha Fold,Alpha Go的折疊,所謂折疊是來預(yù)測蛋白質(zhì)結(jié)構(gòu)的,在蛋白質(zhì)結(jié)構(gòu)預(yù)測的國際競賽里,打敗了所有由人組成的各種團(tuán)隊(duì),這有什么意義?如果能解釋蛋白質(zhì)的結(jié)構(gòu),我們的很多疾病(包括癌癥)可能就會(huì)找到解決辦法。所以現(xiàn)在很多人工智能用在醫(yī)學(xué)上開發(fā)藥物,美國人工智能能比醫(yī)生提早六年診斷出阿茲海默病,醫(yī)療人工智能的器械也開始投入商用了。除此之外我們看一看蛋白質(zhì)折疊結(jié)構(gòu),我們可以通過人工智能將它解釋出來。
我們知道門捷列夫開發(fā)元素周期表用了很長時(shí)間,現(xiàn)在假設(shè)我們不知道元素周期表,利用人工智能程序,幾個(gè)小時(shí)就可以把元素周期表重新定義出來。也就是說,人工智能確實(shí)能做好多事。
在語音識(shí)別方面,人工智能已經(jīng)超過了人,一般人類語音識(shí)別的錯(cuò)誤率是5.1%,現(xiàn)在百度對漢語的語音識(shí)別,微軟對應(yīng)于的語音識(shí)別已經(jīng)比這個(gè)水平要高了。當(dāng)然,在嘈雜噪聲環(huán)境下,識(shí)別率現(xiàn)在也只有54%,不過人更識(shí)別不了,人還達(dá)不到這個(gè)水平。
包括人臉識(shí)別,中國上海依圖科技的人臉識(shí)別率在萬分之一,誤失率前提下可以通過98%,銀行柜臺(tái)人員用肉眼比對,誤差一般在1%,也就是說機(jī)器準(zhǔn)確性是超過人的眼睛的。
當(dāng)然,動(dòng)態(tài)三維活體檢測更難,下面的圖是小布什的原相,右邊的小部什頭像和原圖一樣,但嘴型和上圖的胖子嘴型一樣,我們聽不出胖子講什么,但小布什可以通過口形恢復(fù)出他講話的聲音,讀懂唇語。
我們知道張學(xué)友在好幾場演唱會(huì)上抓到了逃犯,這不是因?yàn)閺垖W(xué)友,而是演唱會(huì)門口的人臉識(shí)別門口。所以張學(xué)友說“抓逃犯是我的正業(yè),唱歌只是副業(yè)”。
機(jī)器視覺應(yīng)用于什么?這是一個(gè)肺部CT照片,大家可以從中發(fā)現(xiàn)有沒有長瘤子、有沒有癌癥,但CT可以掃描出幾百張圖片,很麻煩。我們通過人工智能把這些CT照片還原成一個(gè)肺,看看有沒有纖維化,再看看肺周邊的器官怎么樣。
語音識(shí)別可以用于醫(yī)學(xué),還有圖像識(shí)別,可以重建三維影像,比如醫(yī)學(xué)教育,包括在增進(jìn)醫(yī)療手術(shù)的輔導(dǎo)可以起到很好的作用。
在產(chǎn)業(yè)上,清華和英業(yè)達(dá)合作(做影像電路板的),影像電路板很復(fù)雜,可以看看該連的線是不是連了,不該連的線是不是沒連,人的肉眼很容易錯(cuò)檢,但利用機(jī)器視覺就可以發(fā)覺人的肉眼沒法兒發(fā)現(xiàn)的問題,每年的經(jīng)濟(jì)效益9000萬。
看好AI在醫(yī)療保健、汽車和金融服務(wù)的應(yīng)用,但挑戰(zhàn)很大
人工智能對經(jīng)濟(jì)效益的貢獻(xiàn),有一些統(tǒng)計(jì),人工智能可以改進(jìn)勞動(dòng)生產(chǎn)率,可以激發(fā)消費(fèi)需求、可以提高產(chǎn)品質(zhì)量,有人預(yù)測2017到2030年,人工智能對勞動(dòng)生產(chǎn)率的貢獻(xiàn)超過GDP的55%,其中中國占了全球?qū)⒔话耄?030年人工智能會(huì)帶來7萬億美元的GDP增長貢獻(xiàn),占GDP的26.1%,這個(gè)數(shù)字來源于普華永道,這里面講了幾個(gè)領(lǐng)域,是最重要的人工智能應(yīng)用領(lǐng)域。
AI指數(shù)比較高的應(yīng)用效果比較好的領(lǐng)域是:一是醫(yī)療保健,二是汽車,三是金融服務(wù)業(yè)。
以自動(dòng)駕駛為例,麥肯錫估計(jì)2025年帶來的經(jīng)濟(jì)規(guī)模將達(dá)到萬億美元,降低交通事故,每年能挽救3到15萬人的生命,減少廢氣排放90%,麥肯錫還認(rèn)為到2030年人工智能可以為全球額外貢獻(xiàn)13萬億美元的GDP增長,普華永道的估計(jì)是15.7萬億,平均年均GDP會(huì)增加1.2%。后面那句話更重要:足以比肩19世紀(jì)的蒸汽機(jī)、20世紀(jì)的工業(yè)機(jī)器人和21世紀(jì)的信息技術(shù)。
自動(dòng)駕駛在簡單路況中是好的,復(fù)雜路況就很難,因?yàn)樾腥撕退緳C(jī)不見到都遵守交通規(guī)則,很難用訓(xùn)練的辦法掌握,還需要駕駛員的經(jīng)驗(yàn)和知識(shí),而且人類犯錯(cuò)是偶然的,機(jī)器一旦犯錯(cuò)可能就是系統(tǒng)性的。
人工智能可以檢測腫瘤,但醫(yī)院還不敢這么用,因?yàn)槿斯ぶ悄鼙旧砜梢愿嬖V你應(yīng)該做什么,但它不會(huì)告訴你為什么,比如人工智能診斷一個(gè)病人,最后得出結(jié)論“鋸掉一條腿”,但不告訴你為什么,那醫(yī)院敢鋸掉腿嗎?
還有很多功能是人工智能難以勝任的,神經(jīng)網(wǎng)絡(luò)是以輸入為導(dǎo)向的算法,首先的前提是大量數(shù)據(jù),而且數(shù)據(jù)要比較準(zhǔn)確,如果受了干擾他就很難,醫(yī)生受干擾可能會(huì)產(chǎn)生很多錯(cuò)誤,比如北加州一個(gè)組織(美國公民自由聯(lián)盟)利用亞馬遜面部識(shí)別算法把美國535位國會(huì)議員的照片和美國警察局掌握的2.5萬名罪犯照片進(jìn)行比對,發(fā)現(xiàn)28個(gè)議員被當(dāng)成了罪犯。分類數(shù)據(jù)終美國的數(shù)據(jù)嚴(yán)重偏向白人男性,所以黑皮膚的可能就容易被錯(cuò)認(rèn)。
目前機(jī)器學(xué)習(xí)還有很多不足,圖靈獎(jiǎng)的獲獎(jiǎng)?wù)哒f,目前機(jī)器學(xué)習(xí)只是曲線的擬合,一個(gè)諾貝爾獎(jiǎng)經(jīng)濟(jì)學(xué)獎(jiǎng)得主(Judea Pear)說“人工智能不過是統(tǒng)計(jì)學(xué)”,也就是說目前還是有很多不夠的地方。
剛才我用的兩張圖映射的貓和狗的區(qū)別有個(gè)曲線,但只要擬合的地方稍微錯(cuò)一點(diǎn),可能就會(huì)發(fā)生錯(cuò)誤。比如本來是熊貓,在照片上加上一些噪音,機(jī)器就可能識(shí)別成長臂猿,所以人工智能識(shí)別目前來講還是比較嬌氣的。
大家看這張圖,有人看是順時(shí)針轉(zhuǎn),有人看是逆時(shí)針轉(zhuǎn),哪怕是同一個(gè)人,一會(huì)兒看著是順時(shí)針轉(zhuǎn),眨眨眼睛卻變成了逆時(shí)針轉(zhuǎn),究竟是順還是逆?其實(shí)只是左腿在前還是右腿在前的問題,是你的錯(cuò)覺。
為什么會(huì)出現(xiàn)這個(gè)錯(cuò)覺?因?yàn)樗锰幱谌斯ぶ悄鼙孀R(shí)(包括人辨識(shí))的分界線,這時(shí)就可能發(fā)生誤導(dǎo)。
比如這個(gè)圖里的圓圈,大家都覺得它是滾動(dòng)的、是圓的,可是真的是這樣嗎?每個(gè)球都這樣走嗎?不一定,我們可以看看。實(shí)際上每個(gè)球走的都是直線,所以人工智能的模型是會(huì)被誤導(dǎo)的。
這張圖中最后一個(gè)打問號(hào)的地方應(yīng)該放(幾個(gè)數(shù)字),人很容易看出來應(yīng)該放哪個(gè),因?yàn)榈谝恍?32,第二行343,第三行應(yīng)該是454,可是人工智能就很難看出來,因?yàn)槿斯ぶ悄芤@得人類常識(shí)不是那么容易的。
人工智能的進(jìn)化與對就業(yè)的沖擊
當(dāng)然,神經(jīng)網(wǎng)絡(luò)現(xiàn)在還在演進(jìn),關(guān)鍵是怎樣選擇正確框架以及訓(xùn)練,清華大學(xué)的張鈸院士說我們要把感知和認(rèn)知放到同一個(gè)空間里,不是簡單用概率統(tǒng)計(jì)的理論,要用模糊級的理論來重新定義它,否則我們沒辦法跟機(jī)器人交流,機(jī)器人之間也沒辦法交流。
機(jī)器學(xué)習(xí)著重于通過數(shù)據(jù)了解環(huán)境,而人類能夠同時(shí)洞悉不同的環(huán)境,群體學(xué)習(xí)是人類與生俱來的本領(lǐng),而電腦是不具備的。我曾經(jīng)跟一個(gè)搞人工智能的公司說,識(shí)別語音、下圍棋都不算什么,能不能組織11人的機(jī)器人足球隊(duì),什么時(shí)候踢贏皇馬了,那你就算厲害了,因?yàn)?1人的機(jī)器人足球隊(duì)是要群體活動(dòng)的。
剛才談到就業(yè),實(shí)際上人工智能確實(shí)會(huì)取代很多現(xiàn)在的就業(yè),49%的勞動(dòng)人口可能會(huì)被取代,但一半以上的人是不會(huì)被取代的,因?yàn)槿斯ぶ悄軟]有情感,有情感創(chuàng)作的文藝工作是不能被取代的,人工智能不能取代文藝,要由人來做。美國高德納咨詢公司以及世界經(jīng)濟(jì)論壇發(fā)布的《2018未來就業(yè)》報(bào)告中都說,實(shí)際上取代了一部分工作,但會(huì)新增一些工作崗位。人工智能會(huì)帶來數(shù)字鴻溝,發(fā)達(dá)國家、先進(jìn)企業(yè),還會(huì)拉大社會(huì)貧富懸殊,高智能崗位會(huì)增加,一般勞動(dòng)崗位會(huì)減少,自動(dòng)駕駛出了問題是誰的責(zé)任?機(jī)器人創(chuàng)作的小說、詩歌是否享有相應(yīng)的知識(shí)產(chǎn)權(quán)?有法律道德的問題,還有安全問題,如果人工智能殺人了怎么辦?
最后,總書記提到,要加快發(fā)展新一代人工智能,是我們贏得全球科技競爭主動(dòng)權(quán)的重要抓略抓手。
清華大學(xué)張鈸院士說,我們現(xiàn)在正在通往AI的路上,現(xiàn)在走得并不遠(yuǎn),在出發(fā)點(diǎn)附近,但人工智能永遠(yuǎn)在路上,大家要有思想準(zhǔn)備,而這也就是人工智能的魅力。
人工智能會(huì)使得我們的生活更美好,或是走到我們的反面,這一切取決于人類自己。
謝謝。
評論