<meter id="pryje"><nav id="pryje"><delect id="pryje"></delect></nav></meter>
          <label id="pryje"></label>

          新聞中心

          EEPW首頁 > 消費電子 > 業(yè)界動態(tài) > 【深度】谷歌人工智能10年之路

          【深度】谷歌人工智能10年之路

          作者: 時間:2016-12-21 來源:科技雜談 收藏

            融入命脈

          本文引用地址:http://www.ex-cimer.com/article/201612/341843.htm

            在證明機器學習高效性的實例組成的稠密圖(dense graph)中,自動回復只是其中的一個數(shù)據(jù)點。但是當機器學習成為搜索業(yè)務的重要組成部分的時候,或許轉(zhuǎn)折點才會最終到來。

            作為的旗艦產(chǎn)品,搜索幾乎為該公司貢獻了所有營收。在某種程度上說,搜索總是基于系統(tǒng)。但多年以來,由于搜索引擎對谷歌過于重要,所以始終沒有融入機器學習算法。迦南德里說:“由于搜索在公司內(nèi)部占據(jù)的份額巨大,高級管理者深度參與其中,所以很多人都懷疑我們無法真正取得進展。”

            這部分阻力源自文化因素,因為谷歌強調(diào)要讓那些有極強控制欲的程序員適應帶有禪宗韻味的機器學習模式。

            長期掌管谷歌搜索業(yè)務的阿密特·辛格(Amit Singhal)曾是傳奇計算機科學家杰拉德·薩爾頓(Gerald Salton)的助手。薩爾頓在文檔檢索方面的開創(chuàng)性工作啟迪辛格幫助謝爾蓋·布林(Sergey Brin)和拉里·佩奇(Larry Page)把研究生時期編寫的代碼,擴展成了可以適應當今網(wǎng)絡時代的程序。

            

          【深度】谷歌人工智能10年之路

           

            他從20世紀的方法中梳理出令人驚訝的結果,但如果要將機器學習系統(tǒng)整合到關系谷歌命脈的復雜系統(tǒng)中,他卻持懷疑態(tài)度。大衛(wèi)·帕布洛·科恩說:“進入谷歌的前兩年,我在搜索質(zhì)量部門工作,并嘗試用機器學習來改進排名。結果證明:阿米特的團隊是全世界最優(yōu)秀的,我們把阿里特腦海中的所有內(nèi)容都變成了硬編碼,并不斷取得進步,我們已經(jīng)找不到超越他的方式。”

            到2014年初,谷歌的機器學習大師們認為需要改變現(xiàn)狀。迪恩說:“我們與排名團隊展開了一系列討論。我們認為至少應該嘗試一下,看看是否有所收獲。”他的團隊所設想的那個實驗,最終被證明對搜索至關重要:即文件排名與搜索請求的匹配程度有多高。迪恩稱:“我們跟他們說,嘗試用神經(jīng)網(wǎng)絡計算額外的分數(shù),看看到底有沒有用。”

            結果顯示這種方法確實有用。這套系統(tǒng)如今已經(jīng)成為谷歌搜索的一部分,被稱作RankBrain。它于2015年4月上線。谷歌繼續(xù)秉持著以往的風格,對如何改進搜索諱莫如深。但迪恩表示,RankBrain“融入到每一個搜索請求中”,雖然未必會影響所有的排名,但的確對很多搜索請求的排名都產(chǎn)生了影響。另外,該系統(tǒng)效果顯著。在谷歌計算排名時所使用的數(shù)百個信號中,RankBrain的使用排名第三。

            迦南德里說:“我們成功利用機器學習改進了搜索結果,這對公司來說意義重大,也引發(fā)了很多人的關注。”華盛頓大學教授佩德羅·多明戈斯則則表示:“檢索派與機器學習派始終都存在著分歧,機器學習派最終贏得了勝利。”

            谷歌認知轉(zhuǎn)換面臨的新挑戰(zhàn)是如何讓所有工程師都熟悉機器學習——哪怕不擅長機器學習。這也是現(xiàn)在其它許多公司也在追求的目標,其中最引人關注的當屬Facebook,該公司與谷歌一樣執(zhí)著于機器學習和深度學習。對這個領域的畢業(yè)生的競爭變得更激烈,而谷歌正在努力維持其對畢業(yè)生的吸引力。

            學術圈多年以來都流傳著一個玩笑:即使不需要頂尖學生,谷歌也會招聘他們,避免人才被競爭對手搶走。

            多明戈斯說:“我的學生無一例外都得到了谷歌的錄用通知。”目前看來,競爭的激烈程度有增無減。就在上周,谷歌宣布將在蘇黎世開設一個新的機器學習實驗室,有很多工作崗位有待填補。但由于學術項目尚未培養(yǎng)大量機器學習專家,所以為員工提供在職培訓面成為了必要措施。

            但這卻并非易事,尤其是對于谷歌這樣的公司而言。這里有很多世界頂尖的工程師,他們畢生都在研究傳統(tǒng)的編程方式。

            機器學習卻需要截然不同的思維模式,人們之所以能變成編程大師,通常是因為他們實現(xiàn)了對編程系統(tǒng)的完全控制。機器學習還需要掌握一些數(shù)學和統(tǒng)計學知識,但是很多程序員卻對此不屑一顧,即便是那些能夠?qū)懗龀L代碼的超級黑客也不例外。

            克里斯汀·羅伯森,職責是在機器學習方面培訓谷歌內(nèi)外的人員。

            這也需要相當程度的耐心。羅伯森說:“機器學習模型不是靜態(tài)代碼,你需要不斷為其提供數(shù)據(jù)。我們一直在不停地更新模型,而且還要不斷學習,增加更多數(shù)據(jù),調(diào)整預測方式等。它就像是一個有生命的東西,這是一種截然不同的開發(fā)模式。”迦南德里說:“實際上這是一個使用不同算法進行實驗的學科,或關于哪個訓練數(shù)據(jù)集在你的使用案例上工作效果最好的學科。”

            盡管迦南德里已是搜索業(yè)務主管,但他仍然認為在內(nèi)部傳播機器學習技術的福音是他工作的一部分。他說:“計算機科學那部分不會有太大變化,但對數(shù)學和統(tǒng)計學的關注會更多,而對編寫五十萬行代碼的關注則會減少。”就谷歌而言,這一障礙可以通過智能再培訓克服。迪恩說:“在訓練的一天結束時,這些模型中所使用的數(shù)學變得不再復雜。對于谷歌雇傭的大部分工程師而言,這都是可以實現(xiàn)的。”

            為了進一步幫助日益增長的機器學習專家團隊,谷歌開發(fā)了一系列強大的工具,在訓練算法時選擇正確的模型,以加快培訓和提煉過程。其中最強大的是TensorFlow,它可以加速神經(jīng)網(wǎng)絡的構建過程。

            TensorFlow源自谷歌大腦項目,由迪恩和他的同事拉加特·芒格(Rajat Monga)共同發(fā)明。它能把構建系統(tǒng)過程中涉及的晦澀難懂的細節(jié)變成標準化的內(nèi)容,特別是在谷歌2015年11月開始將其開放給公眾后,這種做法的效果更快得以顯現(xiàn)。

            擴張停不下來

            盡管谷歌煞費苦心地將傳播技術的行為描述為利他主義行為,但它也承認:如果新一代程序員都能熟悉該公司內(nèi)部的機器學習工具,那對谷歌未來的招聘活動帶來莫大好處。TensorFlow的功能以及谷歌的開源模式很快受到了程序員的歡迎。迦南德里表示,當谷歌首次提供TensorFlow課程時,共有7.5萬人報名參加。

            但谷歌仍為自己的程序員保留了很多好東西。在公司內(nèi)部,員工擁有無可比擬的機器學習工具——Tensor Processing Unit(張量處理單元)。他們雖然使用這項創(chuàng)新已經(jīng)很多年,但直到最近才對外宣布。

            張量處理單元是一種針對機器學習程序優(yōu)化的芯片,就像GPU是專門針對圖形處理優(yōu)化的芯片一樣。該公司的龐大數(shù)據(jù)中心里使用了數(shù)以千計的張量處理單元。通過賦予神經(jīng)網(wǎng)絡以超級計算能力,張量處理單元為谷歌帶來了巨大優(yōu)勢。迪恩說:“如果沒有它,我們無法推出RankBrain。”

            但由于谷歌最需要的還是設計和完善這些系統(tǒng)的人才,就像正在緊鑼密鼓地完善其軟件訓練工具一樣,谷歌也在不斷嘗試各種方式來為工程師提供機器學習方面的培訓。

            這些培訓的規(guī)模大小不等,包括為期兩天的速成班,使用幻燈片和實際操作練習。谷歌希望這只是初步嘗試,工程師隨后還會尋找更多資源來深入學習。迪恩說:“已經(jīng)有數(shù)千人報名,準備參加下一次課程。”

            谷歌還采取其他措施,為外部人才提供機器學習培訓。今年初春,谷歌啟動了BrainResidency項目,利用谷歌大腦項目為有潛力的外部人才提供了為期一年的集訓。羅伯森說:“我們稱之為深度學習職業(yè)生涯的開端。”

            這次集訓共有27名來自不同學科的機器學習學員,其中可能有些人會留在谷歌。但羅伯森表示,谷歌的目的是讓他們自行發(fā)展,利用自己掌握的先進知識在世界各地傳播谷歌的機器學習技術。

            從某種意義上說,機器學習正在逐步走上中心舞臺,谷歌希望以人工智能公司的身份繼續(xù)占據(jù)主導地位,而霍爾蓋特等人在忍者項目中學到的知識正是這一計劃的核心。

            霍爾蓋特的課程最初是為期4周的新兵訓練營,由谷歌最先進的人工智能項目產(chǎn)品負責人提供指導,仔細教給他們?nèi)绾螌C器學習融入項目中。

            羅伯森說:“我們把忍者帶進會議室,考拉多站在白板前解釋何為LSTM(長短期記憶,一種可以打造強大神經(jīng)網(wǎng)絡的技術)。他做著夸張的手勢,講述這種系統(tǒng)的工作原理,利用了哪些數(shù)學原理,如何應用于產(chǎn)品中。在最初的4個星期里,我們幾乎用到了所有技術和所有工具,為的是給他們帶來真正的沉浸式體驗。”

            霍爾蓋特成功地通過了新兵訓練營的訓練,她現(xiàn)在正在使用機器學習工具開發(fā)安卓通訊功能,以幫助谷歌員工彼此交流。她正在調(diào)整超參數(shù)(hyperparameter),整理輸入數(shù)據(jù),去掉休止符。

            現(xiàn)在她已經(jīng)無法停住腳步,因為她知道人工智能技術就是谷歌的現(xiàn)在和未來,甚至可能是所技術和所有事物的未來。她說:“機器學習時代已經(jīng)來臨,前景無比廣闊。”


          上一頁 1 2 3 下一頁

          關鍵詞: 谷歌 人工智能

          評論


          相關推薦

          技術專區(qū)

          關閉
          看屁屁www成人影院,亚洲人妻成人图片,亚洲精品成人午夜在线,日韩在线 欧美成人 (function(){ var bp = document.createElement('script'); var curProtocol = window.location.protocol.split(':')[0]; if (curProtocol === 'https') { bp.src = 'https://zz.bdstatic.com/linksubmit/push.js'; } else { bp.src = 'http://push.zhanzhang.baidu.com/push.js'; } var s = document.getElementsByTagName("script")[0]; s.parentNode.insertBefore(bp, s); })();