未來100年改變世界? 人工智能正在成為新的時代動力
正如電力在過去一個世紀里改變了工業(yè)的運行方式那樣,人工智能將在未來100年里大幅改變社會。AI正被整合應(yīng)用到家用機器人、機器人出租車以及心理健康聊天機器人中。一家創(chuàng)業(yè)公司正在利用AI技術(shù)開發(fā)機器人,讓它們更接近人類的智能水平。AI本身已經(jīng)進入到人們的日常生活中,比如為數(shù)字助理Siri和Alexa的大腦提供動力。它讓消費者能夠更準確、更高效地在網(wǎng)上購物和搜索,以及執(zhí)行其他人們認為理所當然的任務(wù)。
本文引用地址:http://www.ex-cimer.com/article/201711/371434.htmCoursera聯(lián)合創(chuàng)始人、斯坦福大學教授吳恩達(AndrewNg)博士上周在硅谷舉行的AI前沿會議上發(fā)表主題演講時表示:“AI就像是一種新的電力。大約100年前,電力改變了每一個主要行業(yè)。AI已經(jīng)發(fā)展到同樣的水平,有能力在未來幾年改變所有主流行業(yè)?!眳嵌鬟_說,盡管人們認為AI是一種相當新的技術(shù),但它實際上已經(jīng)存在了幾十年。但它之所以現(xiàn)在才實現(xiàn)騰飛,這要歸功于數(shù)據(jù)和計算能力的擴展。
吳恩達表示,目前通過AI創(chuàng)造的大部分價值都是通過監(jiān)督學習完成的。但有兩大波的進步:一波利用深度學習來預測消費者是否會在算法獲得有關(guān)他的信息后點擊在線廣告。而當輸出不再是一個數(shù)字或整數(shù),而是語音識別、另一種語言或音頻的句子結(jié)構(gòu)時,第二波進步就出現(xiàn)了。例如,在無人駕駛汽車中,圖像的輸入會形成其他在路上的車輛位置輸出。
微軟首席科學家黃學東(XuedongHuang)表示,實際上,深度學習(即電腦從數(shù)據(jù)集學習到執(zhí)行功能,而不是執(zhí)行它被編程的特定任務(wù))對實現(xiàn)與人類相媲美的語音識別目標是有幫助的。2016年,黃學東領(lǐng)導微軟團隊取得了歷史性成就,當時他們的系統(tǒng)記錄到5.9%的錯誤率,這與人類轉(zhuǎn)錄員的情況相同。黃學東在會議上說:“多虧了深度學習,我們能夠在20年之后達到人類的程度?!贝撕?,該團隊將錯誤率進一步降低至5.1%。
數(shù)字助理的崛起
從2010年開始,語音識別的質(zhì)量開始改善,最終Siri和Alexa誕生了。吳恩達說:“現(xiàn)在,你幾乎認為這是理所當然的。亞馬遜Alexa總監(jiān)RuhiSarikaya說,除此之外,預計語音將取代觸控輸入。提高準確性的關(guān)鍵是理解上下文語境,例如,如果一個人問Alexa晚餐應(yīng)該做什么,這位數(shù)字助理必須評估他的意圖。他是想讓Alexa去餐館預訂位置、點餐還是尋找食譜?如果他要求Alexa找到《饑餓游戲》(HungerGames),他是想要聽音樂、看視頻亦或是聽有聲讀物?
谷歌的研究科學家迪勒克·哈卡尼-圖爾(DilekHakkani-Tur)表示,數(shù)字助理的下一步研究將是一項更先進的任務(wù),即理解“超越文字的意義”。舉例來說,如果用戶使用“今天晚些時候”這樣的短語,可能意味著晚上7點到9點之間,或者下午3點到5點開會。哈卡尼-圖爾說,下一階段還需要更復雜、更生動的對話、多領(lǐng)域任務(wù)以及超越領(lǐng)域界限的互動。此外,數(shù)字助理應(yīng)該能夠做更多事情,比如輕松閱讀和總結(jié)電子郵件。
語音識別之后,就是“計算機視覺”,即計算機識別圖像并對其進行分類的能力。隨著許多人上傳圖片和視頻,將元數(shù)據(jù)添加到所有內(nèi)容中變得很麻煩,這就需要一種將它們分類的方法。Facebook人工智能研究院可視化識別技術(shù)專家ManoharPaluriLumos說,F(xiàn)acebook開發(fā)了一種能夠理解和大規(guī)模分類視頻的AI,名為Lumos。Facebook利用Lumos進行數(shù)據(jù)收集,例如,收集煙花圖像和視頻。該平臺還可以利用人們的姿勢來識別視頻,比如將人們在沙發(fā)周圍忙碌的場景歸類為“即將外出閑逛”。
谷歌視頻理解主管拉胡爾·蘇山卡爾(RahulSukthankar)補充說,關(guān)鍵是要確定上傳視頻的主要語義內(nèi)容。為了幫助計算機正確識別視頻中的內(nèi)容,蘇山卡爾的團隊在YouTube上挖掘了AI可以學習的類似內(nèi)容,比如針對非專業(yè)內(nèi)容的特定幀率。蘇山卡爾補充說,未來研究的一個重要方向是使用視頻對計算機進行訓練。所以,如果機器人看到一個人把麥片倒進碗里的多個角度視頻,它應(yīng)該能通過觀察視頻來學習。
阿里巴巴用AI來促進銷售。例如,淘寶電商網(wǎng)站上的購物者可以上傳自己想買的產(chǎn)品照片,比如街上某個陌生人的時髦手袋,網(wǎng)站會提供最接近照片的手袋。阿里巴巴還使用了增強現(xiàn)實(AR)/虛擬現(xiàn)實(VR)技術(shù),讓人們可以在Costco這樣的商店里瀏覽和購物。在Youku視頻網(wǎng)站上,阿里巴巴正在開發(fā)一種方法,將虛擬3D物體插入用戶上傳的視頻中,以此來增加收入。這是因為許多視頻網(wǎng)站都在致力于增強盈利能力。阿里巴巴AI首席科學家任曉峰(XiaofengRen)說:“YouTube仍然在虧損?!?/p>
羅西(Rosie)和家庭機器人
盡管AI技術(shù)在不斷進步進步,但它仍然無法與人類的大腦相匹配。Vicarious是一家旨在通過開發(fā)相當于人類智能水平的機器人來縮小AI與人類智商差距的創(chuàng)業(yè)公司。其聯(lián)合創(chuàng)始人狄麗普·喬治(DileepGeorge)說,這些組件都是用于組裝智能機器人的。他說:“我們有廉價的馬達、傳感器、電池、塑料以及處理器……我們?yōu)槭裁床荒軗碛辛_西呢?”他指的是20世紀60年代太空時代卡通片《杰森一家》(TheJetsons)中的多用途機器人女傭。喬治說,目前AI的水平就像他所說的“老大腦”,類似于老鼠的認知能力。而“新大腦”更發(fā)達,比如在靈長類和鯨魚身上看到的東西。
喬治說,當較小的輸入被改變時,“老大腦”會感到困惑。舉例來說,一個可以玩電子游戲的機器人,當顏色變得更亮時,就會出錯。他說:“今天的AI還沒有準備好!”Vicarious利用深度學習技術(shù)讓機器人更接近人類的認知能力。在同樣的測試中,盡管亮度發(fā)生了變化,但有擁有VicariousAI的機器人始終能夠堅持玩這個游戲。另一個讓“老大腦”混淆的東西是把兩個物體放在一起。人們可以看到兩件東西疊加在一起,比如咖啡杯在照片中遮住了一個花瓶,機器人常會把它誤認為是一個身份不明的物體。Vicarious的目標就是解決這類問題,且Facebook首席執(zhí)行官馬克·扎克伯格(MarkZuckerberg)也是它的投資者。
作為機器人伴侶和視頻攝影師,Kuri的情況有所不同。Kuri的開發(fā)公司MayfieldRobotics首席技術(shù)官KaijenHsiao表示,在機器人的左眼后面有一個攝像頭,可以在高清格式下收集視頻。Kuri有深度傳感器來繪制房屋地圖,并使用圖像來改善導航。她也有寵物和人類檢測功能,這樣當他們出現(xiàn)在周圍的時候,Kuri就可以展露微笑或做出反應(yīng)。Kuri也擁有識別能力,所以即使燈光發(fā)生了變化,她也能記得自己曾去過的地方,比如白天或晚上的廚房?!八查g選擇”是這個機器人的另一項功能,它可以讓Kuri識別她記錄的類似視頻,比如爸爸在客廳逗弄嬰兒等,同時還能清除多余的視頻。
KaijenHsiao解釋稱:“Kuri的工作就是給你的家庭帶來生活氣息。它還能提供娛樂服務(wù),比如播放音樂、播客、有聲讀物等。你可以在任何地方查看你的家?!盞uri是這個家庭的錄像制作人,它在屋子里四處走動。Kuri使用了愿景和深度學習算法,KaijenHsiao說:“Kuri最大的特點是有自己的個性,可以作為可愛的伴侶?!盞uri將于12月份上市,售價799美元。
商業(yè)對AI回應(yīng)
麥肯錫全球研究所主席兼董事詹姆斯·曼伊卡(JamesManyika)認為,美國和中國在AI領(lǐng)域的投資居于世界領(lǐng)先地位。去年,北美地區(qū)的AI投資從150億美元到230億美元不等,而亞洲(主要是中國)的投資額為80億美元至120億美元,歐洲則僅有30億美元至40億美元,處于落后狀態(tài)??萍季揞^是AI領(lǐng)域的主要投資者,其資金規(guī)模在90億美元至300億美元之間,另外還有60億至200億美元,投資方包括風險資本家和私人股本公司。
他們把錢投到哪里去了?機器學習占投資總額的56%,計算機視覺位居其次,占28%。自然語言占7%,無人駕駛汽車占6%,其余部分則被虛擬助理瓜分。不過,曼伊卡表示,盡管投資不斷增加,但AI的實際應(yīng)用仍然有限,即使是那些知道其能力的公司也是如此。大約40%的公司都在考慮部署AI,40%的公司進行了實驗,只有20%的公司在某些領(lǐng)域采用了AI。
之所以保持沉默,是因為41%的受訪企業(yè)認為自己的投資回報不高,30%的受訪企業(yè)表示,它們的商業(yè)價值還不夠充分,其他公司則表示,它們沒有掌握AI技能。然而,麥肯錫認為,AI可以將其他分析的影響提高一倍以上,并有可能大幅提升企業(yè)業(yè)績。
有些公司能做到這一點,比如在AI領(lǐng)域領(lǐng)先的行業(yè)包括電信和科技公司、金融機構(gòu)以及汽車制造商。曼伊卡說,這些早期采用者往往是更大的、數(shù)字化成熟的公司,它們將AI融入到核心活動中,專注于增長和創(chuàng)新,而不是節(jié)省成本,并需要首席執(zhí)行官的力挺。最慢的采用者是醫(yī)療保健、旅游、專業(yè)服務(wù)、教育以及建筑行業(yè)的公司。然而,專家表示,隨著AI的普及,企業(yè)大規(guī)模采用AI也只是時間問題。
評論