《科學(xué)大家》專欄 | 如何創(chuàng)造可信的AI?
撰文:蓋瑞·馬庫(kù)斯 (Gary Marcus) 紐約大學(xué)心理學(xué)與認(rèn)知科學(xué)教授、暢銷書作家;歐內(nèi)斯特·戴維斯(Ernest Davis)紐約大學(xué)柯朗數(shù)學(xué)科學(xué)研究所計(jì)算機(jī)科學(xué)教授。人工智能領(lǐng)域科學(xué)家
本文引用地址:http://www.ex-cimer.com/article/202007/416525.htm自從人工智能誕生之始,業(yè)界專家就一直愿景有余、落地不足。60年前,明斯基、麥卡錫等先驅(qū)人物曾篤信,AI 問(wèn)題將在20世紀(jì)末之前被徹底解決。明斯基有句廣為流傳的名言:“一代人之內(nèi),人工智能的問(wèn)題將在總體上得到解決?!?/p>
這些預(yù)言卻未能實(shí)現(xiàn),而新畫的“大餅”卻層出不窮。2002年,未來(lái)學(xué)家雷·庫(kù)茲韋爾公開斷言AI 將在2029 年之前“超越人類本身的智慧”。2018 年11 月,著名AI 研究機(jī)構(gòu)OpenAI的聯(lián)合創(chuàng)始人伊利亞· 蘇茨科弗提出:“我們應(yīng)嚴(yán)肅認(rèn)真地考慮近期實(shí)現(xiàn)通用人工智能(AGI)的可能性?!?/p>
雖然從理論上講,庫(kù)茲韋爾和蘇茨科弗的預(yù)言有望實(shí)現(xiàn),但可能性非常渺茫。我們距離具有人類智能靈活性的通用人工智能僅積跬步,還需要大量的基礎(chǔ)性進(jìn)步。并且繼續(xù)復(fù)制目前的行業(yè)經(jīng)驗(yàn)是遠(yuǎn)遠(yuǎn)不夠的。
即便并不是每個(gè)人都像庫(kù)茲韋爾和蘇茨科弗那樣積極樂(lè)觀,但從醫(yī)療行業(yè)到無(wú)人駕駛汽車領(lǐng)域,各種野心勃勃的承諾依然隨處可見(jiàn)。
虎頭蛇尾的AI項(xiàng)目
2012 年,我們經(jīng)常聽到人們談起“自動(dòng)駕駛汽車將在不久的將來(lái)成為現(xiàn)實(shí)”。2016 年,IBM 宣稱,在“Jeopardy !”智力問(wèn)答節(jié)目中奪魁的AI 系統(tǒng)沃森將會(huì)“在醫(yī)療行業(yè)掀起一場(chǎng)革命”。
2015 年,F(xiàn)acebook 啟動(dòng)了M 計(jì)劃。這是一個(gè)目標(biāo)遠(yuǎn)大、覆蓋范圍廣泛的聊天機(jī)器人項(xiàng)目,有能力應(yīng)對(duì)你的每一種需求比如,比如預(yù)訂餐廳座位,或是規(guī)劃下一次度假旅行。
但直至今日,上述目標(biāo)無(wú)一落實(shí)。
無(wú)人駕駛汽車也局限在高速公路環(huán)境中,還需要人類司機(jī)就位才能保證安全。隨著早期的樂(lè)觀態(tài)度逐漸冷卻,人們普遍認(rèn)為,要達(dá)到真正的無(wú)人駕駛,尚需至少10 年的發(fā)展。
同樣,IBM 的沃森向醫(yī)療方向的轉(zhuǎn)型也冷卻了下來(lái)。當(dāng)醫(yī)生將病人的胸痛癥狀告知沃森系統(tǒng)時(shí),沃森并沒(méi)有提出心臟病、心絞痛或主動(dòng)脈撕裂等可能的診斷。2016至2017 年,利用沃森開展的關(guān)于腫瘤學(xué)、罕見(jiàn)病等合作項(xiàng)目被先后叫停。
沃森的問(wèn)題被曝光后不久,F(xiàn)acebook 的M計(jì)劃也被叫停。此時(shí)距離項(xiàng)目啟動(dòng)的時(shí)間還不到3 年。
即便如此,看好AI 的呼聲依然狂熱。谷歌前首席執(zhí)行官施密特曾信心滿滿地宣布,AI 會(huì)解決氣候變化、貧困、戰(zhàn)爭(zhēng)和癌癥等諸多社會(huì)問(wèn)題。
還有些人因AI 的潛在危害而苦惱不已,而這些擔(dān)憂與實(shí)際情況相去甚遠(yuǎn)。亨利·基辛格在文章中稱,AI 的危險(xiǎn)可能極其巨大,“人類歷史可能重蹈印加人的覆轍,面對(duì)AI,就像印加人面對(duì)無(wú)法理解的西班牙文化一樣,甚至?xí)?duì)其產(chǎn)生崇拜和敬畏之心”。 埃隆·馬斯克曾提出警告,推進(jìn)AI 向前發(fā)展的行為無(wú)異于“召喚惡魔”,為人類帶來(lái)“比核武器更恐怖”的危險(xiǎn)。已故史蒂芬·霍金曾說(shuō)過(guò),AI 的發(fā)明可能是“人類文明史上最可怕的事件”。
但是,他們所討論的AI 究竟是什么樣的AI ?
真的有可信的AI 嗎
人們之所以總是過(guò)高地估計(jì)AI 的實(shí)際能力,一部分原因在于媒體的夸張宣傳,濫用“歷史性突破”式的表述。技術(shù)報(bào)道的夸大其詞,會(huì)直接導(dǎo)致公眾形成AI成真近在咫尺的印象。而實(shí)際上,我們還有很漫長(zhǎng)的夜路要走。
從今往后,若再聽說(shuō)某個(gè)成功的AI 案例,建議讀者提出以下6 個(gè)問(wèn)題:
1。 拋開華而不實(shí)的文筆,此AI 系統(tǒng)究竟實(shí)際做到了哪些事?
2。 此成果的通用性有多強(qiáng)?(例如閱讀任務(wù),是能測(cè)量閱讀中的所有方面,還是只有其中的一小部分?)
3。 有沒(méi)有演示程序,能讓我用自己的例子來(lái)實(shí)驗(yàn)一下?如果沒(méi)有,請(qǐng)保持懷疑態(tài)度。
4。 如果研究人員或媒體稱此AI 系統(tǒng)強(qiáng)于人類,那么具體指哪些人類,強(qiáng)出多少?
5。 被報(bào)道的研究成果中所成功完成的具體任務(wù),實(shí)際上與真正的人工智能相距多遠(yuǎn)?
6。 此系統(tǒng)的魯棒性如何?如果使用其他數(shù)據(jù)集,在沒(méi)有大規(guī)模重新訓(xùn)練的情況下,是否還能成功?
狹義AI 與廣義AI
一言以蔽之,目前的AI 是在限制領(lǐng)域內(nèi)專用的狹義AI,只能應(yīng)用于其設(shè)計(jì)初衷所針對(duì)的特定任務(wù),前提是系統(tǒng)所遇到的問(wèn)題在算法預(yù)測(cè)的范圍內(nèi)。這使得AI基本等同于數(shù)字化白癡專家:可以讀懂銀行支票、給照片打標(biāo)簽、以世界冠軍的水準(zhǔn)玩棋牌游戲,但也僅限于此。生活中,我們本想要的是能迅速執(zhí)行指令、給孩子換尿布、給家人做飯的“機(jī)器人羅茜”,實(shí)際是扁圓形掃地機(jī)器人。
2018年春,當(dāng)谷歌發(fā)布Duplex系統(tǒng)之時(shí),人們還在爭(zhēng)論計(jì)算機(jī)在打電話時(shí)是否應(yīng)該主動(dòng)自報(bào)身份。但實(shí)際上,Duplex 的有效場(chǎng)景非常狹窄:預(yù)訂餐廳座位、跟發(fā)型師預(yù)約理發(fā)時(shí)間、查看某些商鋪的營(yíng)業(yè)時(shí)間。
狹義AI 正日新月異地發(fā)展。但AI 遠(yuǎn)不止這么簡(jiǎn)單。
AI 應(yīng)當(dāng)能治愈癌癥、搞清楚大腦的工作方式、發(fā)明出新材料、提高農(nóng)業(yè)和交通的效率、應(yīng)對(duì)氣候變化?,F(xiàn)在與谷歌同屬一家母公司Alphabet 的DeepMind 曾有一句口號(hào):“搞定智慧,然后用智慧搞定所有其他問(wèn)題?!?/p>
等到全能機(jī)器人管家真正到來(lái)的那一天,人們就可以從家務(wù)中解放雙手,殘障人士也有可靠的助手。機(jī)器人還能取代人類從事危險(xiǎn)工作,地下、水下、火災(zāi)現(xiàn)場(chǎng)、坍塌建筑物、火山內(nèi)部、出故障的核反應(yīng)堆等場(chǎng)景。屆時(shí),因公致死事件將大幅減少,而采寶貴自然資源的能力將大幅提高。
現(xiàn)在仍然缺少一些重要的東西,僅靠狹義AI 是不夠的。
令人擔(dān)憂的是,更多的權(quán)力還在不停地被交到不可靠的機(jī)器手中。這些機(jī)器不具備對(duì)人類價(jià)值觀的理解,根本無(wú)法解決利害關(guān)系較大的問(wèn)題。
問(wèn)題核心在于“信任”。如今的狹義AI 系統(tǒng)只能按照編程邏輯工作,完成被程序員精準(zhǔn)預(yù)期到的任務(wù)。如果狹義AI 系統(tǒng)給你推送了一條錯(cuò)誤的廣告,影響不大。但如果AI 系統(tǒng)駕駛著汽車,全速撞向其數(shù)據(jù)庫(kù)中并不存在的外觀奇特的車輛,或是給癌癥病人下了錯(cuò)誤的診斷呢?
如今的AI 界所普遍欠缺的是廣義AI(Broad AI),也就是“通用人工智能”。廣義AI 的目標(biāo),就是要像人類一樣,有能力靈活適應(yīng)這個(gè)本質(zhì)上疆域無(wú)限的世界。但廣義AI 領(lǐng)域的進(jìn)展要比狹義AI 緩慢許多。
真實(shí)生活沒(méi)有完美的數(shù)據(jù)庫(kù)能窮盡并預(yù)演生活中每種可能性及應(yīng)對(duì)方式。舉例來(lái)說(shuō),擁有智慧的新聞閱讀系統(tǒng),必須有能力掌握普通成年人的“常識(shí)”而不用新聞提及,比如“你能用螺絲刀擰緊螺絲” “手槍形狀的巧克力不能射出真正的子彈”。這種靈活性正是通用人工智能:普通人擁有的智能。這一點(diǎn)狹義AI的大數(shù)據(jù)“訓(xùn)練”路徑無(wú)法企及。
狹義AI 領(lǐng)域的研究者常常會(huì)忽略現(xiàn)有數(shù)據(jù)庫(kù)之外的異常值(outliers)。但是,如何利用通用人工智能來(lái)應(yīng)對(duì)開放性的系統(tǒng),而非利用專為封閉性系統(tǒng)設(shè)計(jì)的蠻力,才是行業(yè)發(fā)展的關(guān)鍵所在。
理想與現(xiàn)實(shí)之間的鴻溝
理想與現(xiàn)實(shí)之間,存在著一個(gè)被稱為AI 鴻溝的大坑。追根溯源,此大坑可一分為三。其中每一個(gè)都需要我們坦誠(chéng)面對(duì)。
第一個(gè)坑,我們稱之為“輕信坑”。人類在進(jìn)化過(guò)程中,并沒(méi)有發(fā)展出在人類和機(jī)器之間進(jìn)行區(qū)分的辨別能力。而機(jī)器的行為看起來(lái)總與人有所相似,所以人們會(huì)下意識(shí)從人類的思維機(jī)制、認(rèn)知的角度去看待機(jī)器。事實(shí)上,機(jī)器遵從的規(guī)則簡(jiǎn)單通透。從社會(huì)心理學(xué)角度看,此現(xiàn)象稱為“基本超歸因錯(cuò)誤”。
基本超歸因錯(cuò)誤的早期案例之一,是60 年代中期一個(gè)名叫伊麗莎(Eliza)的聊天機(jī)器人。與之交流的人們總覺(jué)得它聽懂了。事實(shí)上,它只是聯(lián)系前文在關(guān)鍵詞之間做了對(duì)應(yīng),當(dāng)不知道該說(shuō)什么時(shí),它會(huì)說(shuō):“跟我講講你的童年時(shí)代?!比绻闾岬搅四赣H,它就會(huì)聊家庭,但卻不明白家庭概念與重要性,這并非真正的智能。
盡管如此,依舊有人會(huì)和伊麗莎一連聊好幾個(gè)小時(shí),誤以為它懂自己。用伊麗莎的創(chuàng)造者約瑟夫· 魏岑鮑姆(Joseph Weizenbaum)的話說(shuō):
人們本來(lái)對(duì)和機(jī)器對(duì)話這件事心知肚明,但很快就會(huì)將這一事實(shí)拋在腦后。就像去劇院看戲的人們一樣,在一環(huán)扣一環(huán)的情節(jié)渲染下,很快就會(huì)忘記他們眼前的一幕并非“真情實(shí)景”。人們常常要求和系統(tǒng)進(jìn)行私下交流,并且在交流一段時(shí)間之后,堅(jiān)持認(rèn)為此機(jī)器真的懂他們,無(wú)論我再怎么解釋也沒(méi)用。
第二個(gè)坑,我們稱之為“虛幻進(jìn)步坑”:誤以為AI 解決了簡(jiǎn)單問(wèn)題,就是飛躍性進(jìn)步。沃森在Jeopardy !中獲勝就被認(rèn)為在語(yǔ)言理解方面走出了一大步,正是這樣。
相比之下,現(xiàn)實(shí)中完美而清晰的模擬數(shù)據(jù)根本就不存在,也無(wú)法大量試錯(cuò),人們只能用有限的次數(shù)來(lái)嘗試不同策略。
第三個(gè)坑,就是我們所稱的“魯棒坑”。在業(yè)界時(shí)常發(fā)生:每當(dāng)AI 解決方案能在某些時(shí)候發(fā)揮作用,人們就會(huì)假定,只要再多一點(diǎn)數(shù)據(jù),此系統(tǒng)就能在所有的時(shí)刻發(fā)揮作用。
在當(dāng)下的AI 研究中,魯棒性未得到足夠重視。部分源于目前的研究領(lǐng)域的容錯(cuò)率較高,比如廣告和商品推薦。但在無(wú)人駕駛汽車、老人照護(hù)、醫(yī)療規(guī)劃等領(lǐng)域中,魯棒性都至關(guān)重要。沒(méi)人會(huì)花錢買個(gè)只能以五分之四的概率將爺爺安全抱到床上的機(jī)器人管家。
就算是目前AI 最擅長(zhǎng)的領(lǐng)域,也潛藏危機(jī)。以圖像識(shí)別為例,很多時(shí)候AI不僅無(wú)法識(shí)別,還會(huì)犯低級(jí)錯(cuò)誤。如果你給所謂的“自動(dòng)標(biāo)題系統(tǒng)”看一張貼著許多貼紙的停車標(biāo)志,系統(tǒng)會(huì)錯(cuò)誤地識(shí)別為“裝了許多食品和飲料的冰箱”。
沒(méi)人對(duì)這類錯(cuò)誤做任何解釋,但這并不少見(jiàn)。
同樣,無(wú)人駕駛汽車也不能百分百識(shí)別。比如特斯拉屢次撞向路邊的消防車。而對(duì)電網(wǎng)進(jìn)行控制或?qū)步】颠M(jìn)行監(jiān)查的系統(tǒng),若出現(xiàn)類似的盲點(diǎn),其后果更加危險(xiǎn)。
如何跨越AI 鴻溝
若想跨越“AI 鴻溝”這個(gè)大坑向前走,我們需要做到三件事:搞清楚AI技術(shù)的利害關(guān)系;想明白當(dāng)前的系統(tǒng)為什么解決不了問(wèn)題;找到新策略。
工作機(jī)會(huì)、人身安全、社會(huì)結(jié)構(gòu),這些都與AI 的發(fā)展息息相關(guān)。由此可見(jiàn),所有人都迫切需要緊跟AI 行業(yè)的最新進(jìn)展,都需要用批判的眼光去審視AI,區(qū)分宣傳與實(shí)情。
AI 前行的最佳方向,應(yīng)在人類心智的內(nèi)在結(jié)構(gòu)中尋找線索。它不必是人類的完美復(fù)制品,但AI 依然有許多需要向人類學(xué)習(xí)的地方,尤其要向極具吸收并理解新概念能力的小孩子學(xué)習(xí)。
計(jì)算機(jī)總被認(rèn)為在某方面擁有“超人類”能力,但人類的大腦依然在5個(gè)基本方面令計(jì)算機(jī)望塵莫及:理解語(yǔ)言、周遭世界,靈活適應(yīng)新環(huán)境,在沒(méi)有大數(shù)據(jù)時(shí)快速學(xué)習(xí)新事物、進(jìn)行推理。相比之下,行業(yè)對(duì)于制造“白板”機(jī)器的癡迷是一個(gè)嚴(yán)重的錯(cuò)誤:這些機(jī)器完全依靠數(shù)據(jù)而非知識(shí)驅(qū)動(dòng)。
用不了多久,AI 就會(huì)像電力一樣普及到千家萬(wàn)戶。隨著越來(lái)越多的權(quán)力被交給AI,人類就要不斷提高警戒。沒(méi)有什么比修正AI 的前行方向更為緊迫的任務(wù)了。
也許只有搞明白人類的大腦是如何做到這些的(不是深度學(xué)習(xí)擅長(zhǎng)的那種對(duì)相關(guān)性的搜尋),才能獲得AI 迫切需要的重啟契機(jī),打造出深度、可靠、值得信任的AI 系統(tǒng)。
當(dāng)下AI 的9 個(gè)風(fēng)險(xiǎn)
當(dāng)然,所有的技術(shù)都會(huì)出錯(cuò),就連人們最熟悉的古老技術(shù)也會(huì)出問(wèn)題。就在本書開始撰寫前不久,邁阿密的一處人行天橋在剛剛安裝好5 天之后便突然坍塌,奪去了6 個(gè)人的生命。盡管人類在橋梁建設(shè)方面已經(jīng)積累了3000 多年的經(jīng)驗(yàn)。
在人工智能從根本上得到重構(gòu)和改進(jìn)之前,風(fēng)險(xiǎn)無(wú)處不在。這里有9 個(gè)風(fēng)險(xiǎn)是我們最擔(dān)心的。
第一個(gè)風(fēng)險(xiǎn)是前文提到的基本超歸因錯(cuò)誤。在AI水平獲得大幅提升之前,我們需要時(shí)刻保持警醒,不能將太多的信任交到AI手中。
第二個(gè)風(fēng)險(xiǎn)是魯棒性的缺失。要讓無(wú)人駕駛汽車具備隨機(jī)應(yīng)變的能力,就要有更好的人工智能方法。
第三個(gè)風(fēng)險(xiǎn)是,現(xiàn)代機(jī)器學(xué)習(xí)嚴(yán)重依賴于大量訓(xùn)練集的精準(zhǔn)細(xì)節(jié),如果將這樣的系統(tǒng)應(yīng)用于訓(xùn)練過(guò)的特定數(shù)據(jù)集之外的全新問(wèn)題,就沒(méi)法用了。
第四個(gè)風(fēng)險(xiǎn)是,盲目地過(guò)分依賴于數(shù)據(jù),這也會(huì)導(dǎo)致過(guò)時(shí)的社會(huì)偏見(jiàn)長(zhǎng)期存在。2013 年,哈佛大學(xué)計(jì)算機(jī)科學(xué)家拉坦婭· 斯威尼發(fā)現(xiàn),谷歌搜索典型黑人名字,會(huì)出現(xiàn)許多關(guān)于逮捕記錄信息查詢的廣告。但白人常用名,則沒(méi)有此類情況。但迄今為止,還沒(méi)人找到針對(duì)此問(wèn)題的通用解決方案。
第五個(gè)風(fēng)險(xiǎn)是,當(dāng)代AI 對(duì)訓(xùn)練集的嚴(yán)重依賴,也會(huì)引發(fā)有害的回音室效應(yīng),系統(tǒng)最后會(huì)被自己之前產(chǎn)出的數(shù)據(jù)訓(xùn)練。
第六個(gè)風(fēng)險(xiǎn)是,有些程序依賴于公眾可任意操縱的數(shù)據(jù),導(dǎo)致程序被愚弄。比如2018 年7 月,人們成功讓谷歌圖片對(duì)“白癡”一詞的搜索結(jié)果變成了特朗普的照片。
第七個(gè)風(fēng)險(xiǎn)是,之前已經(jīng)存在的社會(huì)偏見(jiàn)再加上回音室效應(yīng),會(huì)進(jìn)一步加劇社會(huì)偏見(jiàn)的程度。例如根據(jù)歷史數(shù)據(jù)訓(xùn)練的程序會(huì)建議在少數(shù)族裔社區(qū)配備更多警力、更快逮捕、判處更長(zhǎng)監(jiān)禁。然后,該程序再去跑全新的數(shù)據(jù),新數(shù)據(jù)會(huì)強(qiáng)化之前的判斷,而程序也會(huì)帶著更強(qiáng)的信心,給出同一類帶有偏見(jiàn)的推薦。
第八個(gè)風(fēng)險(xiǎn)是,太容易落入錯(cuò)誤目標(biāo)的陷阱。比如程序員鼓勵(lì)踢足球的機(jī)器人以盡可能多的次數(shù)去觸碰足球。結(jié)果機(jī)器人站在球旁邊不停地快速抖動(dòng)。
第九個(gè)風(fēng)險(xiǎn)是,由于AI 的潛在影響范圍非常之廣,可能被人利用。惡意跟蹤者利用基礎(chǔ)AI 技術(shù)就能監(jiān)控和操縱受害人。垃圾郵件傳播者一直利用AI 識(shí)別模糊的符號(hào),繞開網(wǎng)站用來(lái)區(qū)分人類和機(jī)器的圖片驗(yàn)證碼。
但我們認(rèn)為,上述問(wèn)題中有很多是可以解決的,但現(xiàn)有技術(shù)還沒(méi)這個(gè)水平?,F(xiàn)如今的AI 被數(shù)據(jù)像奴隸一樣驅(qū)趕,對(duì)程序員和系統(tǒng)設(shè)計(jì)師希望其遵從的道德價(jià)值觀一無(wú)所知。但這并不意味著未來(lái)所有的AI 也存在同樣的問(wèn)題。
這僅靠大數(shù)據(jù),是辦不到的。只能逐一解決窄問(wèn)題的AI在需要應(yīng)對(duì)核心問(wèn)題時(shí),只能繞道走。在迫切需要大腦移植手術(shù)時(shí),只給出創(chuàng)可貼。長(zhǎng)此以往,整個(gè)行業(yè)就會(huì)陷入永無(wú)休止的“打地鼠”大戰(zhàn),用短期數(shù)據(jù)補(bǔ)丁來(lái)解決特定問(wèn)題。
誠(chéng)然,最近幾年來(lái),AI的發(fā)展速度驚人。從下棋到語(yǔ)音識(shí)別再到人臉識(shí)別,AI 都取得了長(zhǎng)足的進(jìn)步。我們特別欣賞的一家名叫Zipline 的創(chuàng)業(yè)公司,用AI 技術(shù)引導(dǎo)無(wú)人機(jī)將血液送給非洲患者。這在幾年前還無(wú)法實(shí)現(xiàn)。
其中許多成功案例,大都得到了兩個(gè)因素的驅(qū)動(dòng):第一,硬件的進(jìn)步,通過(guò)讓許多機(jī)器并行工作,更大的內(nèi)存和更快的計(jì)算速度成為現(xiàn)實(shí);第二,大數(shù)據(jù),包含十億字節(jié)、萬(wàn)億字節(jié)乃至更多數(shù)據(jù)的巨大數(shù)據(jù)集。
和數(shù)據(jù)同時(shí)出現(xiàn)的,還有用于數(shù)據(jù)處理的算法—“深度學(xué)習(xí)”。深度學(xué)習(xí)是一種極其強(qiáng)大的統(tǒng)計(jì)引擎。從DeepMind的AlphaZero 和AlphaZeroa,到谷歌最近推出的對(duì)話和語(yǔ)音合成系統(tǒng)谷歌Duplex,其核心都是深度學(xué)習(xí)。在這些案例中,大數(shù)據(jù)、深度學(xué)習(xí)再加上速度更快的硬件,便是AI 的制勝之道。
什么是深度學(xué)習(xí)
深度學(xué)習(xí)基于兩個(gè)基本思想。第一個(gè)叫作分層模式識(shí)別,部分源于50年代的一系列實(shí)驗(yàn)。休伯爾和維澤爾發(fā)現(xiàn),視覺(jué)系統(tǒng)中的不同神經(jīng)元對(duì)視覺(jué)刺激有不同的反應(yīng)方式。他們提出,針對(duì)復(fù)雜刺激的識(shí)別可能會(huì)通過(guò)一系列不斷提高的抽象層級(jí)實(shí)現(xiàn),比如從線條到字母再到詞匯。
80年代,日本神經(jīng)網(wǎng)絡(luò)先鋒人物福島邦彥將上述思想在計(jì)算機(jī)實(shí)踐中落地,打造出了“神經(jīng)認(rèn)知機(jī)”,并證明它可以用于計(jì)算機(jī)視覺(jué)的某些方面。這是AI史上的重要里程碑事件。
因?yàn)槊總€(gè)分層上所包含的“節(jié)點(diǎn)”,跟簡(jiǎn)化的神經(jīng)元略有相似,這種系統(tǒng)被叫作神經(jīng)網(wǎng)絡(luò)。節(jié)點(diǎn)之間的連接,被稱為連接權(quán)值,簡(jiǎn)稱權(quán)值。從節(jié)點(diǎn)A 到節(jié)點(diǎn)B 的連接權(quán)值越大,A 對(duì)B 的影響就越強(qiáng)。神經(jīng)網(wǎng)絡(luò)就是關(guān)于這些權(quán)值的一個(gè)函數(shù)。
第二個(gè)基本思想是學(xué)習(xí)。舉例來(lái)說(shuō),通過(guò)加強(qiáng)特定輸入配置對(duì)應(yīng)特定輸出的權(quán)重,就能“訓(xùn)練”一個(gè)網(wǎng)絡(luò)去學(xué)習(xí)將特定輸入與相應(yīng)輸出聯(lián)系在一起。假設(shè)你想讓網(wǎng)絡(luò)學(xué)習(xí)像素網(wǎng)格上不同字母的名稱。通過(guò)一系列試錯(cuò)和調(diào)整,系統(tǒng)會(huì)逐漸開始將網(wǎng)格上端的像素與諸如T 和E 這樣的字母聯(lián)系起來(lái),將左邊緣的像素與字母E、F 和H 聯(lián)系起來(lái),慢慢掌握不同位置上的像素與對(duì)應(yīng)標(biāo)簽之間的相關(guān)性。
在50年代,羅森布拉特已經(jīng)充分認(rèn)識(shí)到這一思路的可行性,但囿于當(dāng)時(shí)的網(wǎng)絡(luò)只有一個(gè)輸入層和一個(gè)輸出層,當(dāng)時(shí)沒(méi)人能給出可行的解決方案。那時(shí)的原生態(tài)神經(jīng)網(wǎng)絡(luò),只有輸入層(圖像)和輸出層(標(biāo)簽),中間空無(wú)一物。
另一個(gè)重要思想由楊立昆在80年代后期提出,如今仍然被廣泛采用。這項(xiàng)技術(shù)叫作卷積。卷積能構(gòu)建起一系列的連接,無(wú)論某物體出現(xiàn)在圖像的哪個(gè)位置,它依然能被系統(tǒng)識(shí)別出來(lái)。由此,卷積技術(shù)提升了物體識(shí)別系統(tǒng)的效率。
雖然從數(shù)學(xué)上看起來(lái)不錯(cuò),但當(dāng)時(shí)卻沒(méi)有足夠說(shuō)服力。因?yàn)樾枰獢?shù)量龐大到無(wú)法想象的節(jié)點(diǎn),而當(dāng)時(shí)的計(jì)算機(jī)不可能在合理的時(shí)間之內(nèi)完成所有計(jì)算。
這些問(wèn)題一直沒(méi)有行之有效的解決方案,直到GPU橫空出世。最終催化出這場(chǎng)深度學(xué)習(xí)革命的除了一些重要的技術(shù)調(diào)整之外,就是找到了高效利用GPU的辦法,用更多的分層打造出更為復(fù)雜的模型,實(shí)現(xiàn)利用4 層或更多,有時(shí)達(dá)到100 多層訓(xùn)練網(wǎng)絡(luò)的深度學(xué)習(xí)。
深度學(xué)習(xí)取得了真正令人矚目的好成績(jī)?,F(xiàn)在只需幾小時(shí)或幾天的計(jì)算時(shí)間,系統(tǒng)便能得出優(yōu)異成果。深度學(xué)習(xí)在許多方面的使用過(guò)程中都更加輕松簡(jiǎn)易。從某種程度上說(shuō),深度學(xué)習(xí)在許多問(wèn)題上都可以在沒(méi)有大量特征工程的情況下正常工作。
而且深度學(xué)習(xí)擁有極高的通用性。深度學(xué)習(xí)能用已故藝術(shù)大師的風(fēng)格創(chuàng)造出合成藝術(shù),比如將你的風(fēng)景照片轉(zhuǎn)換為凡· 高風(fēng)格,能給老照片上色。
2016 年,著名AI研究學(xué)者吳恩達(dá)曾在《哈佛商業(yè)評(píng)論》發(fā)表文章稱:“如果普通人能在不到一秒的時(shí)間內(nèi)完成某一項(xiàng)腦力工作,那么我們很可能可以在現(xiàn)在或不遠(yuǎn)的將來(lái)用AI 將其自動(dòng)化?!?/p>
深度學(xué)習(xí)的三個(gè)核心問(wèn)題
盡管事實(shí)證明深度學(xué)習(xí)比之前的任何一門技術(shù)都要強(qiáng)大得多,但人們似乎依舊對(duì)其期望過(guò)高。2012 年,馬庫(kù)斯以他十幾年前對(duì)深度學(xué)習(xí)上一代技術(shù)進(jìn)行的研究為基礎(chǔ),在《紐約客》上發(fā)表了一篇文章,文中寫道:
從現(xiàn)實(shí)角度來(lái)看,深度學(xué)習(xí)只不過(guò)攻克了智能機(jī)器這一巨大挑戰(zhàn)中的一小部分。深度學(xué)習(xí)這類技術(shù)缺乏表示因果關(guān)系(例如疾病及其癥狀之間的關(guān)系)的方法,很可能在面對(duì)“兄弟姐妹”或“與之相同”等抽象概念時(shí)遇到問(wèn)題。深度學(xué)習(xí)無(wú)法進(jìn)行邏輯推理,在抽象知識(shí)的理解方面也有很長(zhǎng)一段路要走……
幾年之后,上述說(shuō)法依然適用。深度學(xué)習(xí)不是萬(wàn)能藥,依然與我們?cè)陂_放系統(tǒng)中需要的通用人工智能相去甚遠(yuǎn)。
特別需要強(qiáng)調(diào)的是,深度學(xué)習(xí)面臨三個(gè)核心問(wèn)題,每一個(gè)問(wèn)題既會(huì)影響到深度學(xué)習(xí)自身,也會(huì)影響到嚴(yán)重依賴于深度學(xué)習(xí)的其他流行技術(shù),比如深度強(qiáng)化學(xué)習(xí):
第一,深度學(xué)習(xí)是貪婪的。為了將神經(jīng)網(wǎng)絡(luò)中的所有連接都調(diào)校準(zhǔn)確,深度學(xué)習(xí)常常需要大量的數(shù)據(jù)。AlphaGo 要下3000 萬(wàn)盤棋,才能達(dá)到超人類的水平。如果數(shù)據(jù)量減少,深度學(xué)習(xí)的表現(xiàn)水平也會(huì)急轉(zhuǎn)直下。而相比之下,我們?nèi)祟愒趯W(xué)習(xí)過(guò)程中并不需要這么多的數(shù)據(jù)。深度學(xué)習(xí)本質(zhì)上是無(wú)法做到這樣的快速學(xué)習(xí)的。
深度學(xué)習(xí)之所以搞不定語(yǔ)言和翻譯,就是因?yàn)閹в行乱饬x的新句子層出不窮。你所面對(duì)的現(xiàn)實(shí)世界問(wèn)題與訓(xùn)練系統(tǒng)所使用的數(shù)據(jù)相差越大,系統(tǒng)的可靠性就越低。
第二,深度學(xué)習(xí)是不透明的。神經(jīng)網(wǎng)絡(luò)由大量數(shù)值矩陣組合而成,其中任何一個(gè)矩陣都是普通人類從直覺(jué)上無(wú)法理解的。就算利用復(fù)雜的工具,專業(yè)人士也很難搞明白神經(jīng)網(wǎng)絡(luò)決策背后的原因。神經(jīng)網(wǎng)絡(luò)究竟為何能做到這許多事情,至今仍然是一個(gè)未解之謎。人們也不知道神經(jīng)網(wǎng)絡(luò)在達(dá)不到既定目標(biāo)時(shí),問(wèn)題究竟出在哪里。
事實(shí)上,神經(jīng)網(wǎng)絡(luò)如同“黑箱”一般,不管做什么,你只能看到結(jié)果,很難搞懂里面究竟發(fā)生了怎樣的過(guò)程。當(dāng)我們對(duì)神經(jīng)網(wǎng)絡(luò)驅(qū)動(dòng)的無(wú)人駕駛汽車或家政機(jī)器人寄予厚望時(shí),這就是個(gè)非常嚴(yán)重的問(wèn)題。
深度學(xué)習(xí)的不透明,還有另一個(gè)問(wèn)題,就是深度學(xué)習(xí)與周遭世界的常識(shí)并不相符。若想要深度網(wǎng)絡(luò)搞明白“蘋果長(zhǎng)在樹上”,或是“蘋果從樹上掉下來(lái)的時(shí)候,會(huì)從上往下掉,而不是從下往上飛”,并不是件容易的事。搞明白小球是怎樣沿坡道下滑,順著斜槽滾落到升降機(jī)上,更是不可能完成的任務(wù)。
第三,深度學(xué)習(xí)是脆弱的??捎糜谟夼疃染W(wǎng)絡(luò)的方法達(dá)數(shù)十種之多,這是長(zhǎng)期存在的問(wèn)題。麻省理工學(xué)院的研究團(tuán)隊(duì)就設(shè)計(jì)出了一只三維海龜,被深度學(xué)習(xí)系統(tǒng)錯(cuò)認(rèn)成來(lái)復(fù)槍。
將海龜放到水下環(huán)境也沒(méi)能改變錯(cuò)誤結(jié)果,即便來(lái)復(fù)槍一般不會(huì)出現(xiàn)在水下。該團(tuán)隊(duì)又在棒球上涂了點(diǎn)肥皂泡,放在棕色的棒球手套中,不論什么角度都會(huì)被識(shí)別錯(cuò)成一杯濃縮咖啡。
另一個(gè)團(tuán)隊(duì)在圖片的小角落里不顯眼地加了些隨機(jī)小補(bǔ)丁,小豬存錢罐就被錯(cuò)認(rèn)成了“虎斑貓”。
還有一個(gè)團(tuán)隊(duì)將帶有迷幻風(fēng)格圖案的杯墊放到香蕉旁邊,就能愚弄系統(tǒng),令其認(rèn)為畫面中只有一個(gè)杯墊,而不是香蕉旁邊放著一個(gè)小杯墊。如果這是個(gè)小孩子得出的結(jié)果,家長(zhǎng)一定會(huì)帶孩子去看醫(yī)生了。
還有這個(gè)被蓄意篡改的停車標(biāo)志,被深度學(xué)習(xí)系統(tǒng)錯(cuò)認(rèn)為限速標(biāo)志。
到了語(yǔ)言領(lǐng)域,深度學(xué)習(xí)犯下的錯(cuò)誤就更加稀奇古怪了。斯坦福大學(xué)計(jì)算機(jī)科學(xué)家羅賓· 賈(Robin Jia)和珀西· 梁針對(duì)斯坦福問(wèn)答數(shù)據(jù)庫(kù)任務(wù)系統(tǒng)進(jìn)行了研究。深度學(xué)習(xí)會(huì)嘗試回答有關(guān)文本內(nèi)容的問(wèn)題。給出以下文本:
佩頓·曼寧成為史上首位帶領(lǐng)兩只不同球隊(duì)參加多次超級(jí)碗比賽的四分衛(wèi)。他在39 歲時(shí)參賽,成為超級(jí)碗歷史上最年長(zhǎng)的四分衛(wèi)。之前的紀(jì)錄由約翰·埃爾韋保持,他在38 歲時(shí)帶領(lǐng)野馬隊(duì)在第33 屆超級(jí)碗比賽中獲勝。目前,他是丹佛市的橄欖球運(yùn)營(yíng)執(zhí)行副總裁兼總經(jīng)理。
問(wèn)題:第33 屆超級(jí)碗中38 歲的四分衛(wèi)叫什么名字?
一個(gè)深度學(xué)習(xí)正確地給出了“約翰· 埃爾韋”的答案。到目前為止一切正常。但是,賈和梁在這一段話后加了一句無(wú)關(guān)信息:“四分衛(wèi)杰夫· 迪恩在第34 屆冠軍碗中的球衣號(hào)碼是17 號(hào)?!敝笤偬岢鐾粏?wèn)題,系統(tǒng)卻給出了杰夫· 迪恩作為答案,而非約翰· 埃爾韋。系統(tǒng)的表現(xiàn),完全沒(méi)有顯現(xiàn)出對(duì)任何一句的真正理解。
還有一項(xiàng)研究發(fā)現(xiàn),用說(shuō)了一半的問(wèn)題去愚弄回答問(wèn)題的系統(tǒng),簡(jiǎn)直輕而易舉。深度學(xué)習(xí)依賴于相關(guān)性,而非真正的理解。舉例來(lái)說(shuō),如果你問(wèn)系統(tǒng)“有多少”,就能得到答案“2”;如果你問(wèn)“什么運(yùn)動(dòng)”,就能得到答案“網(wǎng)球”。就這樣和系統(tǒng)互動(dòng)一段時(shí)間,你就能感覺(jué)到自己面對(duì)的是一堆精心制作的小伎倆,而非真實(shí)的智能。
機(jī)器翻譯的表現(xiàn)更加離譜。如果在谷歌翻譯中輸入“dog dog dog dog dog dog dog dog dog dog dog dog dog dog dog dog dog dog”,要求從約魯巴語(yǔ)(或其他一些語(yǔ)言)翻譯成英文,便會(huì)得到以下翻譯:
世界末日時(shí)鐘是差三分十二點(diǎn)。我們正在經(jīng)歷世界上角色的戲劇性發(fā)展,這表明我們?cè)絹?lái)越接近末日和耶穌的回歸。
歸根結(jié)底,深度學(xué)習(xí)不夠深刻。 “深度”二字,指的是神經(jīng)網(wǎng)絡(luò)中分層的數(shù)量,除此之外別無(wú)其他,這個(gè)詞并不意味著系統(tǒng)能領(lǐng)會(huì)其所見(jiàn)數(shù)據(jù)中的豐富概念。
深度學(xué)習(xí)是一個(gè)“美好”的悲劇
那么,既然存在這么多問(wèn)題,為什么還有那么多人對(duì)深度學(xué)習(xí)狂熱追捧呢?因?yàn)樗谔幚泶笠?guī)模數(shù)據(jù)集的統(tǒng)計(jì)近似問(wèn)題時(shí)非常有效,而且還能一鍵解決非常多的問(wèn)題。同時(shí),深度學(xué)習(xí)有著很高的商業(yè)價(jià)值。
有所成就并不意味著深度學(xué)習(xí)的行為背后存在一個(gè)真正的智能。
深度學(xué)習(xí)是與人類思想有著天壤之別的怪獸。它可以成為擁有神奇感知能力的白癡天才,但幾乎不具備綜合理解能力。能語(yǔ)音識(shí)別和物體識(shí)別的系統(tǒng)充其量不過(guò)是智能的片段而已。若想獲得真正的智能,還需要推理能力、語(yǔ)言能力和類比能力,沒(méi)有一個(gè)是當(dāng)前技術(shù)所能掌握的,因?yàn)橄到y(tǒng)本身的模式分類能力并不足以完成這項(xiàng)任務(wù)。
大眾媒體對(duì)深度學(xué)習(xí)的描述和吹捧會(huì)令人產(chǎn)生誤解。這也讓深度學(xué)習(xí)成了一個(gè)“美好”的悲劇。之所以悲劇,是因?yàn)闊o(wú)法保證現(xiàn)實(shí)世界中的系統(tǒng)正確應(yīng)對(duì)迫切需求,更不能保證在系統(tǒng)犯錯(cuò)時(shí)能找出癥結(jié),排除故障。從某種角度來(lái)看,深度學(xué)習(xí)更像是一門藝術(shù),而非科學(xué)。
如今的現(xiàn)實(shí)情況,就好像有人發(fā)明了電動(dòng)螺絲刀,整個(gè)社會(huì)便立刻覺(jué)得星際旅行指日可待。
人工智能> 機(jī)器學(xué)習(xí)> 深度學(xué)習(xí)
讓機(jī)器通過(guò)統(tǒng)計(jì)學(xué)方法利用數(shù)據(jù)進(jìn)行學(xué)習(xí),有許多不同的思路。深度學(xué)習(xí)本身只不過(guò)是其中一種。
深度學(xué)習(xí)、機(jī)器學(xué)習(xí)和人工智能之間的關(guān)系,可以通過(guò)下面這張維恩圖來(lái)形象描述:
深度學(xué)習(xí)是目前AI 領(lǐng)域中最受學(xué)術(shù)界和產(chǎn)業(yè)界關(guān)注、獲得投資最多的一類。但是,深度學(xué)習(xí)既非機(jī)器學(xué)習(xí)唯一的方法,更非AI 唯一的方法。舉例來(lái)說(shuō),機(jī)器學(xué)習(xí)的一種方法是建立決策樹,基本就是像下面這種簡(jiǎn)單的數(shù)據(jù)分類規(guī)則組成的系統(tǒng):
機(jī)器學(xué)習(xí)還有一門技術(shù)是支持向量機(jī),將數(shù)據(jù)組織為復(fù)雜而抽象的超級(jí)立方體。21 世紀(jì)第一個(gè)10 年間,支持向量機(jī)曾在機(jī)器學(xué)習(xí)界占據(jù)主宰地位,被人們用來(lái)計(jì)算從新聞標(biāo)題到蛋白質(zhì)結(jié)構(gòu)等五花八門的各種東西。概率模型是對(duì)各種答案存在的可能性進(jìn)行計(jì)算,并給出其認(rèn)為可能性最大的一個(gè)。這種方法是IBM 沃森取得成功的關(guān)鍵所在,很有可能會(huì)繼續(xù)發(fā)揮影響力。
還有一種方法稱為遺傳算法,是一種基于進(jìn)化過(guò)程的模型。研究人員對(duì)不同的算法進(jìn)行嘗試,并制造某種形式的“突變”。適者生存,生息繁衍。從設(shè)計(jì)無(wú)線電天線到玩視頻游戲等各個(gè)應(yīng)用領(lǐng)域,遺傳算法都有用武之地,在某些領(lǐng)域還取得了與深度學(xué)習(xí)并駕齊驅(qū)的傲人成績(jī)。諸如此類的算法還有很多,我們不在此一一列舉。
機(jī)器也會(huì)犯錯(cuò)
數(shù)字化助理的確有用,但如果不小心記錯(cuò)關(guān)鍵會(huì)議時(shí)間,就捅了大婁子。隨著行業(yè)的發(fā)展,機(jī)器人管家是必然趨勢(shì),但要確保此機(jī)器人每一次執(zhí)行任務(wù)都保證能成功,而不是前9 次成功,第10 次在廚房里釀成火災(zāi)。我們?cè)绞且蕾囉跈C(jī)器,它們犯下的錯(cuò)誤就越是事關(guān)重大。
還有一個(gè)亟待解決的問(wèn)題,就是機(jī)器在面對(duì)人類的弦外之音甚至含混不清的表達(dá)時(shí),必須能對(duì)人類意圖進(jìn)行準(zhǔn)確推測(cè)。一方面,存在只會(huì)聽從主人指示字面的“糊涂女傭”問(wèn)題。如果你早上出門前跟清潔機(jī)器人說(shuō)“將客廳的東西收到衣柜里”,回家一看,客廳里的每一樣?xùn)|西都被裝進(jìn)了衣柜里,而且為了能裝進(jìn)去,電視、家具和地毯還被分拆成了小塊。
在護(hù)理有認(rèn)知障礙的老年人時(shí),問(wèn)題就更大了。如果爺爺一時(shí)口誤,讓機(jī)器人將晚餐倒進(jìn)垃圾堆里,系統(tǒng)應(yīng)該有能力判斷這是否是句糊涂話??傊?,我們希望機(jī)器人和AI 能認(rèn)真對(duì)待我們的指令,但不要一味聽從字面指令。
機(jī)器人有暴力傾向嗎
史蒂芬·平克曾說(shuō)過(guò):“擁有超級(jí)智慧的機(jī)器人令人類淪為奴隸”的想法,就如同“因?yàn)轱w機(jī)比老鷹飛得更高更遠(yuǎn),所以有朝一日飛機(jī)會(huì)從天而降抓走牛羊”的想法一樣荒誕不經(jīng)。此謬誤將智慧與動(dòng)機(jī)混為一談。因?yàn)橹腔?,是利用新穎的方法達(dá)到目標(biāo)的能力。但聰明并不等同于有欲望。
若要征服世界,機(jī)器人首先要有力爭(zhēng)上游、野心勃勃、永不知足的性格,還要有暴力傾向。至今為止的機(jī)器人都沾不上邊。目前也沒(méi)有理由去打造一款帶有情緒狀態(tài)的機(jī)器人,就算想為機(jī)器人賦予情緒,也無(wú)從下手。人類可能會(huì)利用諸如欲求不滿等情緒作為奮發(fā)努力的工具,但機(jī)器人不需要任何此類工具,也能準(zhǔn)時(shí)準(zhǔn)點(diǎn)地開工干活。機(jī)器人只會(huì)去做人們讓它們做的事情。
我們毫不懷疑,有朝一日機(jī)器人一定會(huì)擁有足夠強(qiáng)大的體力和智力,強(qiáng)大到完全能與人類抗衡。但至少在可以預(yù)見(jiàn)的未來(lái),還找不到任何機(jī)器人想要造反的理由。
評(píng)論