從IBM、谷歌、亞馬遜看當(dāng)下AI的泛化
曾幾何時,AI(人工智能)成為了諸多企業(yè)的口頭禪,不管這個企業(yè)身處什么產(chǎn)業(yè),是什么樣的企業(yè),好像不帶上AI就落伍了,媒體更是天天充斥著各種AI的報道,我們也是聽得耳朵磨出了糨子。在此我們不妨以業(yè)內(nèi)公認(rèn)的AI或技術(shù)或市場中的代表IBM、谷歌和亞馬遜為例,看看AI的技術(shù)和市場究竟如何?
本文引用地址:http://www.ex-cimer.com/article/201707/362145.htmIBM“沃森”(IBM Watson):被疑為噱頭 商業(yè)化成本高企無實效
提及沃森,這個自從 6 年前在美國答題秀節(jié)目Jeopardy 中打敗人類選手,就占據(jù)了無數(shù)的新聞頭條,并最早商業(yè)化(主要用于醫(yī)療領(lǐng)域癌癥的檢測和預(yù)防)的所謂AI系統(tǒng)。不過,隨著時間的推移,近期沃森卻屢屢遭受業(yè)內(nèi)的質(zhì)疑。
例如華爾街投行杰富瑞分析師詹姆斯基斯納(James Kisner)發(fā)布的關(guān)于IBM人工智能“沃森”(IBM Watson)的研究報告就稱:IBM對沃森的投資很難給股東帶來價值回報,并用案例說明了IBM沃森存在的廣泛問題,即該案例來自IBM沃森與MD安德森癌癥中心之間的合作,即在向沃森項目浪費了6000萬美元之后,MD安德森癌癥中心最終停止了與IBM在這方面的合作,并承認(rèn)這項技術(shù)尚未準(zhǔn)備好臨床使用。而MD安德森癌癥中心的情況并非個案。多名人工智能領(lǐng)域的創(chuàng)業(yè)者都表示,他們在金融服務(wù)和生物科技領(lǐng)域的客戶在與IBM打交道時都有過類似經(jīng)歷。
與華爾街投行的分析相比較,今年五月,在CNBC的金融市場觀察欄目“Closing Bell”上,風(fēng)險投資人Chamath Palihapitiy更是語出驚人:“實話實說,Watson就是個笑話。我認(rèn)為,IBM非常擅長利用銷售和營銷手段,來誘導(dǎo)信息不對稱的人掏腰包。”
而美國認(rèn)知科學(xué)會創(chuàng)始人 Roge Schank認(rèn)為 沃森根本不是認(rèn)知計算系統(tǒng),IBM 有夸大吹噓嫌疑,并做了如下論證,即為了展示沃森的超凡智能,IBM 從 2015年以來在熱播電視節(jié)目中投放了沃森的廣告。在廣告中,沃森程序與搖滾靈魂人物鮑勃迪倫進(jìn)行了對話。
對此,Schank 指出,這個廣告恰恰說明沃森完全沒有理解迪倫的作品。盡管“時間流逝”之類的詞匯在迪倫的作品中時常出現(xiàn),但所有熟悉迪倫作品的人都知道,迪倫是一位抗?fàn)幐枋?,他的歌曲最關(guān)心的是民權(quán)、反戰(zhàn)這些主題。不過,迪倫歌的歌詞里并沒有直白地寫著“反戰(zhàn)歌曲”、“民權(quán)運動”。沃森只根據(jù)詞頻統(tǒng)計等方式找到“時間流逝”、“愛情凋零”,而沒有真正理解迪倫作品的真正主題。
谷歌DeepMind:除了圍棋 技術(shù)與商業(yè)化類“沃森”前景不明
至于谷歌,去年AlphaGo依賴人工智能挑戰(zhàn)號稱最難的人類游戲圍棋大獲成功,讓人工智能背后的“深度學(xué)習(xí)”廣為人知,也把谷歌此前收購的AI科技公司DeepMind推到了公眾面前。對此,就像前微軟亞洲研究院常務(wù)副院長芮勇所言,想要實現(xiàn)真正的人工智能還有很長的路要走,今天所有的人工智能幾乎都是來自于人類過去的大數(shù)據(jù),沒有任何一個領(lǐng)域的能力源自自我意識,不管是象棋還是圍棋,計算機(jī)都是從人類過去的棋譜中學(xué)習(xí)。假如讓AlphaGo去下跳棋,它就會完全傻掉。甚至說把圍棋的棋盤稍作修改, AlphaGo都招架不住,但是人類就沒有問題。AlphaGo可以打敗三十多歲的李世石,但它的學(xué)習(xí)能力不及一個5歲的小孩,這二者是有很大區(qū)別的。
與沃森相比,DeepMind則剛剛進(jìn)入商業(yè)領(lǐng)域的應(yīng)用。去年七月,谷歌宣布DeepMind已找到方法將谷歌數(shù)據(jù)中心的制冷用電量減少2/5。它的算法先分析數(shù)據(jù)中心的操作日志來理解任務(wù),然后通過反復(fù)模擬運行來優(yōu)化過程。同樣,DeepMind也已經(jīng)進(jìn)入醫(yī)療行業(yè)。去年11月,公司獲得了首個付費項目,與NHS公立醫(yī)院皇家自由倫敦醫(yī)院(Royal Free London)簽下五年的合同,為其處理170萬份病歷。此外,DeepMind還獲得了訪問其它倫敦醫(yī)院兩個數(shù)據(jù)庫的權(quán)限,即DeepMind利用AI軟件分析了約100萬份視網(wǎng)膜掃描報告成功找到了退行性眼疾的早期征兆,或通過頭頸部癌癥圖像讓AI軟件學(xué)會區(qū)分健康和癌組織之間的不同。
從上述DeepMind的商業(yè)化看,與沃森類似,均需要首先獲取現(xiàn)實世界的大數(shù)據(jù),即使擁有大量數(shù)據(jù)的可供挖掘的谷歌,運用AI及機(jī)器學(xué)習(xí)技術(shù)改進(jìn)醫(yī)院、電網(wǎng)及工廠等系統(tǒng)時,獲取其具體操作數(shù)據(jù)也非常重要。原因很簡單,沒有人類提供的背景數(shù)據(jù),哪怕極為簡單的挑戰(zhàn),現(xiàn)有的AI技術(shù)也無法勝任。因此,當(dāng)前的AI技術(shù)實際上并不“智能”,也不是解決問題的萬能手。
提及數(shù)據(jù),在人機(jī)大戰(zhàn)前,DeepMind耗費了數(shù)年時間學(xué)習(xí)圍棋。參加《危險邊緣》問答的沃森,研發(fā)人員輸入了數(shù)TB有關(guān)問答節(jié)目和自然語言實例的數(shù)據(jù),來幫助它理解這一節(jié)目的問答模式。只有靠人類這樣有針對性的密集“訓(xùn)練”,這些機(jī)器才能表現(xiàn)得如此出色。會議安排助手X.ai這類看似簡單的應(yīng)用程序卻花費了數(shù)年時間學(xué)習(xí)與會議安排相關(guān)的事項,才達(dá)到可投入商用的水平。而它們運作的過程,更類似于基于計算力提升之下的大數(shù)據(jù)分析和輸出,遠(yuǎn)沒有創(chuàng)造性的推理。而眾所周知的事實是,在數(shù)據(jù)的處理(其實就是一種高速的運算),機(jī)器的能力早已經(jīng)遠(yuǎn)遠(yuǎn)超過人類。
對此,有分析稱,DeepMind未來可能無法單單通過利用AI程序解決復(fù)雜問題的方式創(chuàng)造大量營收,但DeepMind AI軟件通過分析數(shù)據(jù)所獲取的有用信息已經(jīng)足夠讓谷歌為當(dāng)初的競標(biāo)所投入的巨資值回票價??吹竭@里,相信業(yè)內(nèi)應(yīng)該知道DeepMind的本質(zhì)以及谷歌打著AI旗號的真實目的了吧。
亞馬遜Alexa:仍屬快速信息檢索 涉及自然語言識別折戟沉沙
最后看亞馬遜。其所謂的AI是隨著采用智能語音技術(shù)Alexa的Echo音箱的熱銷而為業(yè)內(nèi)所知,某種程度上也代表了亞馬遜AI的水平。但從其應(yīng)用看,智能語音服務(wù)范圍大都是在信息檢索,幫助用戶獲得資訊。絕大多數(shù)的內(nèi)容是不牽涉“推理”(對用戶自然語言的理解)的查詢類信息服務(wù)。如果用戶問到在基礎(chǔ)信息以上,一旦牽涉推理的問題,不僅是Alexa,幾乎所有的智能語音識別(包括谷歌、微軟)都無能為力。
以亞馬遜的Alexa為例,去年一名六歲的女孩在跟Echo內(nèi)置人工智能語音助手Alexa聊天時,意外訂下了價值170美元的玩具和一盒重達(dá)四磅的餅干。雖然孩子的媽媽在收到一個不知打哪來的訂單確認(rèn)電話后立刻進(jìn)行了取消操作,但該訂單卻已經(jīng)被處理,且一個跟孩子身高幾乎相同的玩偶就在隔天送來了。最后,他們無奈地決定將這一玩偶捐贈給當(dāng)?shù)貎和t(yī)院。
又如亞馬遜Alexa誤聽指令向孩子提供成人內(nèi)容,即小孩向亞馬遜Alexa下達(dá)指令:“Alexa,請播放‘Digger digger(一首兒童歌曲)’。”之后,亞馬遜個人助手通過算法進(jìn)行識別,竟然認(rèn)為孩子想聽情色內(nèi)容。稍后,孩子的父母才意識到發(fā)生了什么事,可惜他們已經(jīng)無法阻止Alexa繼續(xù)播放聲音。
上述說明自然語言(真正的AI能力)的“難題”離最終的解決依然存有差距。因為不同的應(yīng)用(問答、情感分析、機(jī)器翻譯、部分語音標(biāo)簽)需要有不同的模型架構(gòu):強監(jiān)督式記憶神經(jīng)網(wǎng)絡(luò)、樹形長短記憶網(wǎng)絡(luò)、雙向LSTM限制隨機(jī)域(CRF)、動態(tài)記憶網(wǎng)絡(luò)等。即使在研究中出現(xiàn)一些非常有潛力的新想法,設(shè)計、工程合成、可擴(kuò)展的對話系統(tǒng)與這些想法的結(jié)合依然處于非常復(fù)雜的狀態(tài),離商用還很遙遠(yuǎn)。所以,當(dāng)被問及何時才能通過自然語言與數(shù)字助理交流,并得到滿意的答案時,就連吳恩達(dá)這樣的頂尖科學(xué)家也無法給出確切答案。即便是對最高水平的神經(jīng)網(wǎng)絡(luò)學(xué)家而言,這項技術(shù)仍然有很多謎團(tuán)尚待解開。有很多工作只能通過不斷試錯來改進(jìn),沒有人敢保證某項技術(shù)調(diào)整可能產(chǎn)生什么樣的后果。根據(jù)現(xiàn)有的技術(shù)和方法,這一過程大約要耗費數(shù)年時間。
正是在這些科技大佬的鼓動下,AI正有走向泛化的趨勢。據(jù)統(tǒng)計,到去年年底,在財富500強企業(yè)中,就有180家對外宣稱自己要啟動相關(guān)的人工智能項目。甚至有廣告研究公司大膽預(yù)估,到了 2020 年,人工智能技術(shù)可能會出現(xiàn)在幾乎所有的新科技產(chǎn)品的宣傳之中。另據(jù)Gartner 在研究了 1000 家宣稱自己使用了人工智能的技術(shù)供應(yīng)商后發(fā)現(xiàn),大部分所謂的人工智能技術(shù),采用的依舊是基礎(chǔ)的、基于規(guī)則的機(jī)器學(xué)習(xí)和分析技術(shù)(例如上述的IBM的沃森和谷歌的DeepMind)。這些技術(shù),早在人工智能這個概念被熱炒之前,就已經(jīng)出現(xiàn)并被業(yè)內(nèi)所使用。更為關(guān)鍵的是,這些技術(shù)的能力遠(yuǎn)遠(yuǎn)未達(dá)到可以被稱得上“人工智能”的程度。
恰逢國務(wù)院《新一代人工智能發(fā)展規(guī)劃》頒布之際,在彰顯我國政府對于科技產(chǎn)業(yè)前瞻性和勢在必得決心的同時,也應(yīng)該警惕當(dāng)下產(chǎn)業(yè)界AI泛化的趨勢,尤其是在每逢大的利好的產(chǎn)業(yè)政策或者綱要出臺,總是泥沙俱下的中國,切莫讓真正的AI淹沒在AI的泛化中。
評論