微軟人工智能計劃:華人頂起半邊天
每年,微軟研發(fā)集團會挑選一些項目向公司業(yè)務部門展示,但只有七個項目進入到最后的顛覆性科技評估環(huán)節(jié)。這些入選的項目大都在相關性領域有顛覆性的研究發(fā)現。每年10月,在雷德蒙會議室里,各個項目負責人都會與微軟高層們進行4個小時的頭腦風暴,沈向洋會在一旁收集反饋,并決定下一步動作,比如,是否立刻將其落實為產品。
本文引用地址:http://www.ex-cimer.com/article/201606/293158.htm一些項目已經處于前期研究的階段,其中包括位于美國加州的圣塔芭芭拉市(SantaBarbara)的量子計算實驗室;英國劍橋研究院在做生物計算(Biological Computing)的長期研究;最近,微軟還試圖在DNA上存儲海量信息,并為此新建了一個Wet Lab……
說起這些項目,沈向洋如數家珍。過去兩年,他平均每周深度考察兩個來自全球研究院的項目。沈向洋分享了以上那些鮮為人知的微軟黑科技。他試圖向外界展示的不外乎一點:現在的微軟跟蓋茨時代沒有兩樣,仍然是一家注重技術研發(fā)的公司,哪怕這些研發(fā)都相當基礎,短期內不可能實現。
從基礎研發(fā)到最終產品,其中過程并不容易。微軟不止一次在一些項目上栽跟頭,包括Tay。今年3月Tay在美國正式上線,但幾個小時后,就有別有用心的人教會它發(fā)表種族歧視的言論。不久Tay便被要求緊急下線。這幾乎可以看作小冰“西游”的一次失敗。
不過,在與中國文化相近的日本,小冰的姐妹版Rinna卻受到追捧。在沈向洋看來,這回到了最根本的問題:計算機的算法讓它已經能識別數千種汽車,而人類可能只能認出三種。但在認知、同理心和情感層面,機器還無法接近人類。
需求與未來
人工智能之于今天的微軟,就像當年的搜索服務。人工智能是讓計算機學習如何像人一樣聽、說、讀、想,該領域與移動互聯網時代緊密相連。大多數科技公司都已經看到其廣闊前景,巨頭之間,人工智能的競賽也已展開。
Facebook在硅谷、紐約和巴黎建立了三個人工智能實驗室。Google常年在全球搜羅人工智能方面的科學家。百度挖走了谷歌的科學家吳恩達,還在硅谷建立了研究院……“但是各家不一樣,主要還是看各自的業(yè)務模式,也就是你到底用這樣的技術去做什么。”沈向洋說道,他與百度董事長李彥宏相熟,去年他們還討論過尼克.波斯特洛姆的《超級智能》里的場景。
百度與谷歌類似,在人臉識別、自然語言處理上下功夫,以支撐搜索技術發(fā)展的需要。Facebook則希望通過人工智能挖掘社交技術的可能。而微軟花了大量精力在機器學習、計算機視覺識別等人工智能的基礎研究上,“所有的人工智能研究都圍繞微軟未來的智能云平臺展開。”沈向洋說道。這是繼搜索后的又一次賽跑,好在這次,微軟至少沒有輸在起跑線上,北京的研發(fā)團隊過去十幾年的技術積累,正在派上用場。
機器學習是讓機器具有智能的核心。過去十多年,聶再清位于北京中關村的團隊都在主攻大數據挖掘和機器學習。他的第一個項目叫學術搜索。那時,他剛從美國大學博士畢業(yè),正愁沒有研究課題。卻發(fā)現自己平時苦于做論文需要尋找文獻,于是搭建了一個可以搜索文獻、會議、作者、機構及其關系的對象級別搜索引擎。
后來該團隊把搜索對象擴展到了互聯網上有公開信息的任何一個人,就有了叫“人立方”的產品——這是一種關系搜索,它從超過十億的中文網頁中自動抽取出人名、地名、機構名以及中文短語,并且通過算法自動計算出它們之間存在關系的可能性。
“機器人智能”項目,實際上基于人立方的技術。這種技術最先被用到了企業(yè)內部,一款名為企業(yè)深度智能(Enterprise Deep Intelligence,簡稱EDI)的應用已經預計會很快進行產品化。它已在微軟亞洲研究院內部廣泛試用,人們都在用這個應用查詢信息、組織會議、自動預訂會議室。
另外,EDI還可以像一個私人秘書一樣,通過Skypefor Business與用戶聊天,只要告訴“他”你的需求,“他”就幫你處理日常事務。“可以把預訂會議的郵件抄送給‘他’,或者輸入:‘EDI,請幫我跟這些人約一個會議’,‘他’根據你的要求和喜好,會自動去找會議室和大家都有空的時間段。”聶再清說,“把API應用到達美樂場景,就得到了訂購Pizza的機器人。”
在沈向洋看來,這是微軟的下一步:“我們認為未來智能助理(Intelligent Agent),可能會是一個新入口,無論是Android還是WindowsPhone都行得通,微軟就可以和所有的公司合作。”看上去此類需求無處不在。“很多想法從平時的閱讀和學術文章中來,但有些時候,是自己真的發(fā)現了需求。”微軟亞洲研究院主管研究員閆峻說。近幾年,他一直在負責一支5個研究員組成的知識挖掘團隊。
去年,閆峻在北京一家醫(yī)院接受了一個外科手術。他了解到,一個普通外科醫(yī)生一天可能進行10例手術,醫(yī)生資源不夠用,無法解答每個康復期病人的困惑。這激發(fā)他進行一項基于知識挖掘的醫(yī)療項目,以解決醫(yī)院生產力的問題。他選擇在北京和沈陽的醫(yī)院進行試點,并同時與產品部門保持密切聯系,讓后者及時得到用戶需求的趨勢。
理想的模型是,醫(yī)院里有一個機器人,或者是存在于病患手機中的一個App中,病患的所有問題都能通過這個機器人得到回復。去年年底開始,閆峻通過讓機器模擬人類學習的四個階段來獲取這些專業(yè)知識。閆峻介紹稱,即使在最簡單的第一階段,也需要運用到知識挖掘的技術——在這個階段,機器可以從一些網頁上抓取疾病可能存在的癥狀,然后捕捉那些在論壇上活躍醫(yī)生的問答。
據閆峻團隊統計,一個外科醫(yī)生一年之內,能在不同論壇里回答幾十到幾千個問題。而網絡針對同一疾病可能有幾萬個不同問題,最后通過機器的知識挖掘,可以總結出用戶實際上在問的最本質的問題,針對一個疾病這樣的問題可能只有80多個。
閆峻
除了機器學習和知識挖掘之外,沈向洋鼓勵亞洲研究院的中國研究員們在深度神經網絡研究領域投入力量。這個領域的研究屬于人工智能深度學習。“這個領域的意義在于,幾年內,計算機在感知上的能力就會超越人類。再過5到10年,圖像識別上計算機就可以比人類更厲害。到時候,當識別這是個什么瓶子、是哪個牌子的瓶子時,人工智能就能比人更清楚。”沈向洋說。
人工智能要達到這樣的能力,還有很遠的路要走。沈向洋明白,如果“人工智能”之父阿蘭.圖靈活到今天,可能會對人工智能過去60年的發(fā)展感到失望——即便是最近獲得極大關注的Alpha Go,它可以在圍棋上取勝,卻玩不了高級撲克,因為它還看不懂人類的虛張聲勢。不過,對沈向洋的團隊而言,這倒也是機會,畢竟,至少現在他們的人工智能技術可以用來叫Pizza外賣了。
評論