【深度】谷歌人工智能10年之路
盡管迦南德里不相信“機器會殺死我們”這樣的預言,但他認為機器學習系統(tǒng)將成為革命性技術,從醫(yī)療診斷到無人駕駛汽車,各行各業(yè)都將利用這種技術。雖然機器學習不會取代人類,但它卻會改變?nèi)祟悺?/p>本文引用地址:http://www.ex-cimer.com/article/201612/341843.htm
迦南德里以Google Photos為例進行了解釋。這款產(chǎn)品的標志性功能是能夠在圖片中識別出用戶指定的物品,這令人感覺頗為神秘,甚至有些不安。通過學習,電腦可“知道”邊境牧羊犬的樣子,而且可以識別出不同年齡和毛長的邊境牧羊犬。
對于人類來說,這可能十分容易,但沒人能夠從數(shù)百萬張圖片中篩選出來這些照片,同時還能識別出不同的犬種,而機器學習系統(tǒng)就可以做到。如果它了解了一個犬種,便可使用相同的技術識別出另外9999個犬種。迦南德里說:“這才是真正令人感到新奇的地方。在這樣狹小的領域,你甚至可以看到機器學習系統(tǒng)具備超人能力。”
進入熱門產(chǎn)品
谷歌早已了解機器學習的概念,該公司的創(chuàng)始人就是強大人工智能的堅定信奉者。機器學習已經(jīng)被應用到谷歌很多產(chǎn)品中,盡管并非總是采用最近熱門的神經(jīng)網(wǎng)絡技術。
事實上,谷歌10年前就開始通過內(nèi)部培訓,向公司工程師傳授機器學習技術。2005年初,當時負責谷歌搜索業(yè)務的彼得·諾維格(Peter Norvig)向研究科學家大衛(wèi)·帕布洛·科恩(David Pablo Cohn)提議,希望知道谷歌能否采用卡內(nèi)基-梅隆大學組織的相關課程。
而科恩表示,只有谷歌自己才能教授這種內(nèi)部課程,因為谷歌的運營規(guī)模與其他公司都大不相同。所以他改造了谷歌總部43號樓一個大房間,每周三在那里開設兩小時的課程。就連迪恩也參加過幾次。
科恩說:“那是全世界最好的課程。作為工程師,他們都比我優(yōu)秀得多!”這門課程非常受歡迎,幾乎座無虛席。就連班加羅爾辦事處的員工都會特意等到午夜之后,以便接入遠程教學系統(tǒng)。
幾年后,部分谷歌員工把授課內(nèi)容制作成了短片,從而結束了直播授課的歷史。但科恩認為,這門課程算得上是MOOC(大規(guī)模開放在線課程)的先驅。在隨后幾年,谷歌還針對機器學習培訓展開了其他嘗試,但這些嘗試缺乏條理性和連續(xù)性??贫?013年離開谷歌后,機器學習突然間成為谷歌關注的重點領域。
但在2012年以前,機器學習課程的重要性還未獲得充分認識,直到迦南德里決定“吸收大量從事這項工作的人”,并將他們安排到同樣的辦公樓之后。始于Google X部門的“谷歌大腦”也加入進來。
迦南德里說:“我們吸收了很多團隊,將他們安排到同一棟辦公樓內(nèi),還提供了全新的咖啡機。有些人之前只接觸過所謂的感知計算,即聲音和語音識別等技術,而現(xiàn)在他們可以與那些從事語言研究的人共同探討。”
越來越多地,這些工程師們開發(fā)的機器學習技術開始出現(xiàn)在谷歌的熱門產(chǎn)品中。由于視覺、語音識別以及翻譯是機器學習的主要領域,因此無需感到驚訝,這項技術成為谷歌語音搜索、翻譯和Photos等服務的重要組成部分。更重要的是,機器學習技術將被應用到所有產(chǎn)品中。
迪恩表示,隨著他和他的團隊對機器學習的理解逐步深入,他們開始以更具野心的方式探索這項技術。
他說:“我們之前或許會在系統(tǒng)的組件中使用機器學習技術,現(xiàn)在則會使用這項技術替代整套系統(tǒng),而非為每個組件設計更好的機器學習模式。”迪恩表示,如果現(xiàn)在讓他重新編寫谷歌的基礎架構,其中的很多內(nèi)容都不再是預先編好的代碼,而是后期學習而來的。
格雷格·考拉多,谷歌大腦項目聯(lián)合創(chuàng)始人,正在和多個團隊協(xié)作,將人工智能應用到谷歌產(chǎn)品中。
機器學習還能夠將原本無法想象的功能植入到產(chǎn)品中,比如2015年11月推出的Gmail自動回復功能。這個功能源自“谷歌大腦”項目聯(lián)合創(chuàng)始人格雷格·考拉多(Greg Corrado)與Gmail工程師巴林特·米克洛斯(Bálint Miklós)之間的對話。
考拉多之前曾經(jīng)與Gmail團隊合作使用機器學習算法探測垃圾信息、歸類郵件,但米克洛斯提出了更激進的建議:能否利用機器學習技術自動生成回復郵件,省去移動用戶在狹小的鍵盤上輸入文字的麻煩。
考拉多說:“當初我?guī)缀躞@呆了,因為這個建議太瘋狂了。但我后來覺得,借助我們始終都在研究的預測性神經(jīng)網(wǎng)絡技術,或許可能實現(xiàn)。而在意識到這是一個機會的時候,我們就必須去嘗試。”
為了提高成功概率,谷歌讓考拉多及其團隊與Gmail部門展開了密切合作,這種派遣機器學習專家進駐產(chǎn)品部門的做法如今已經(jīng)越來越普遍??祭嗾f:“機器學習既是科學又是藝術,這就像烹飪。雖然烹飪過程發(fā)生了化學反應,但對于真正對烹飪感興趣的人來說,必須要學習如何搭配手中的食材。”
傳統(tǒng)的人工智能技術在理解語言時,需要將語音規(guī)則嵌入系統(tǒng)。但在這個項目中,系統(tǒng)可以利用現(xiàn)代化的機器學習技術,借助足夠的數(shù)據(jù)自主學習,就像兒童自學那樣。
考拉多說:“我并不是跟著語言學家學會說話的,而是通過聽別人說話學來的。”。但真正令智能回復變得切實可行的,是它的成功很容易定義——他們的目的不是創(chuàng)造一個妖艷的虛擬斯嘉麗·約翰遜(Scarlett Johansson,電影《她》中的智能操作系統(tǒng)),而是希望它能回復真正的電子郵件。
考拉多說:“這項服務的成功標志是,用戶覺得機器生成的備選回復有用,可被當作自己的真正回復使用。”因此,只需要知道用戶是否點擊了系統(tǒng)推薦的回復內(nèi)容,便可對其進行訓練。
然而,在開始測試智能回復功能時,用戶卻注意到了怪異事情:系統(tǒng)經(jīng)常會推薦一些不合時宜的浪漫回應??祭嗾f:“其中一種失敗模式是:只要系統(tǒng)感覺困惑,它就會說‘我愛你’。這并不是軟件漏洞,而是我們的錯誤引導它如此做。”這個程序已經(jīng)了解人類行為的某些微妙之處:“比如你感到擔憂是說一句‘我愛你’,其實是一種很好的防御策略。”考拉多幫助該團隊壓制了系統(tǒng)的熱情。
去年11月發(fā)布的智能回復功能取得了巨大成功,Gmail Inbox應用的用戶現(xiàn)在可以直接從系統(tǒng)提供的三條備選內(nèi)容中選擇一條,輕輕碰觸即可進行回復。由于系統(tǒng)提供的回復內(nèi)容非常切題,用戶經(jīng)常感到不可思議。在通過該應用發(fā)送的回復信息中,有1/10都是由機器學習系統(tǒng)生成的??祭嘈χf:“這個項目能夠成功還是令我感到有些驚訝。”
評論