中國工程院院士李德毅:大數據突破點在于聚類
非大數據時代,做一個人臉的識別,我們可以提取它十個特征,第二類先結構化存起來,你想一想,如果十個特征都一樣的話,兩個人是不是同一個人呢?當然,這也是不可能的,但是我們再想一想,人類智能來看,它忽略了什么呢?我認為它忽略了太多,這種人臉識別僅僅是幾何結構的聚類,落入集合學框架,忽略了聚類的不確定性,忽略了聚類的多樣性等等。
本文引用地址:http://www.ex-cimer.com/article/275351.htm再舉個例子,大數據寫詩,人們熟讀眾多詩詞,記住了針對各種意境的大量字串。例如說李白一生寫詩1010首,把他所有詩句進行機械切割。李白給毛主席誕辰100周年寫一首詩,就是這樣。
大數據對形式化方法的挑戰(zhàn)是非常嚴峻的,在數據密集型的網絡時代,任何傳統(tǒng)學科,或者傳統(tǒng)的行業(yè),它的公理、原理和定理組成的語境,遇到互聯網的挑戰(zhàn)之后,這樣一來,傳統(tǒng)的學科行業(yè),或者是交叉學科,成為一個大數據、小模型、小定律、交叉學科的時代,模型和程序要圍繞數據轉。
創(chuàng)新,表示在創(chuàng)造一個新的語境,新的坐標系,在這個坐標系下研究大數據,在互聯網情況下,如何創(chuàng)造你新的坐標系,新的語境,否則難以有新的發(fā)現。
實踐中的研究,由下而上要深入,數據要勝過程序,價值要勝過知識,關聯要勝過因果,更多要關注有意義的小眾,把這些小眾累積起來才成為大眾。
通過大數據聚類即時發(fā)現價值,要充分認識大數據中的不確定性和價值的隱蔽性。
機器人如何認知是我講的第二個問題,這七個字,可以有兩種劃分,一種是機器人如何認知,你要把這個弄清楚,我覺得實際上是在弄這個,機器人在想,人如何認知,智能機器人是集新材料、新工藝、新能源、機械、電子、移動通信、全球定位導航、移動互聯網、云計算、大數據、自動化、人工智能、認知科學、乃至人文藝術等多個學科、多種技術于一身的人造精靈,是人聯網、物聯網不可或缺的端設備,是人類社會走向智慧生活的重要伴侶。
機器人既是使用大數據也產生大數據,既是大數據的產物,也是大數據的推動者,機器人是大數據的認知的典型代表,機器人時代真的來了,我們希望我們以后的黃牛退休、鐵牛耕地,這個鐵牛就是機器人,農民進城,機器人耕地,醫(yī)療與健康機器人,服務機器人更是上上下下,當然還有太空機器人等。
我先講一下服務機器人,高考機器人,就是由知識的碎片化,大數據來認知,就說明我們的教育不能光是填知識,我們現在做一個報告,我們可以用機器人來撰稿,機器人導航,機器人手術等。
如果語言、文本、歌曲、劇本,都可以用虛擬機器人,訓練他的形象、情感、動作、語音、語調、風格,利用大數據,發(fā)出新的歌聲。
機器人革命是世界性的、時代性的,機器人換人首先不是換掉理發(fā)師之類的勞動者,而可能是產業(yè)工人、文秘人員、醫(yī)生、服務員、甚至士兵,他們將升級轉型成為機器人的創(chuàng)造者和使用者,成為懂得集成、維修、管理機器人的專業(yè)人才。跨界滲透和跨界創(chuàng)新誕生的智能制造也是我國抓住歷史機遇的又一次崛起。
我想做一個可穿戴設備的案例,如果你能做一個人和人的衣服,動力驅動,研制一個可穿戴的機械,幫助負重、助行、轉體、條約的話,不僅可以讓機器人站起來走路,還可以讓特種兵成為飛人、超人。
這就是這樣一些機器人,可穿戴的外部增強的機器人,這是我想做的家庭服務機器人,今天企業(yè)家很多,我在這投一個標,我想做這邊這一個機器人,誰能做下面的輪子,從餐廳到臥室,從臥室到書房,希望大家有興趣能夠談一談。
機器人還將進一步刮起穿戴風,蘋果做了手表,這個手表里面有一個檢查老年癡呆的,蘋果發(fā)表了5個APP商家,啟動全新醫(yī)療應用,我們想一想,如果有一天讓手機或者手表成為醫(yī)療診斷的工具,成為用于慢性管理的醫(yī)患視頻互動平臺,成為醫(yī)療互聯網個人健康與醫(yī)療的數據發(fā)生器,成為遠程診療的開始,成為某種流行病的社會調查,成為病友社交網絡,甚至會顛覆傳統(tǒng)看病模式,顛覆傳統(tǒng)醫(yī)學研究。
生物機器人遐想,我們人的想象中,生命的多種形象,如果器官移植越來越發(fā)達,那么移花接木就屢見不鮮。將來,誰是誰搞不清楚了,如果這個人的臉換到另一個人的身上去,怎么界定?從定制治療到定制嬰兒,改造人類胚胎DNA,會不會避免遺傳性疾病?如果將人的思維移植到機器人,那么思想是不是不朽的呢?
我現在想做一個東西,我想做一個機器駕駛腦。在腦科學取得重大突破前,能不能做得出來?人腦很復雜,我跟一個美國科學院士,是個華人,在科技部開的咨詢會上,他告訴我一句話,讓我很吃驚,他回答我的問題,腦里要花一個腦袋功能結構圖,100年都畫不出,他說你看一看生命科學的書,那叫人腦的組織結構圖,全球已經發(fā)現500多種腦部疾病。
科學界正把腦科學和認知科學作為當前的重大研究領域,我們熱切期待生物腦的出現。
難道認知科學就是研究生物腦的自然屬性嗎?怎樣把社會屬性研究進去呢?我提出來要研究文字、文明和傳承,我們各種高端生物都會有語言、文字的,因為有了文字,才有了文明。要研究腦認知的后天屬性,研究腦發(fā)育、可塑性與自然環(huán)境的關系,認知也是后天學習和積累的結果,是與社會環(huán)境、社會實踐、群體交互等密切相關的,要建立人腦認知的成長機制:如何創(chuàng)建神經元之間新的連接和新的認知。
我們想一下,人的智能,除了記憶之外,在學習和思維上,到底有什么能耐?客觀地說,或者概括地說,一個是邏輯思維,一個是形象思維,形象思維最主要的是兩個,一個是類比,一個是聯想,主要解決的是圖象。
因此我的技術觀點是如果人腦的認知能力不能夠全部、完整、統(tǒng)一地形式化、但特定的情境下的認知能力是否可以先局部地形式化,例如算術運算、簡單游戲、博弈、定點開車等。
就在此時此刻,美國的一個汽車公司,真的從洛杉磯往紐約開,他要開5000多公里。我們有很多攝像頭,還有汽車本身的運動參數,再一個就是我們的導航地圖,還有雷達傳感器,我們利用一次規(guī)劃,和駕駛地圖,形成一個初位化。我們認為,我們的駕駛腦主要涵蓋了人腦關于駕駛行為的主要功能,長期記憶、短期記憶,還有瞬間記憶,就是感覺記憶,從感知到認知,到行動。我今天在博覽會上找了好幾個廠家,希望跟他們合作,X1芯片,我們能不能做出我們自己的XPA,讓我們的汽車工業(yè)在智能時代到來中不錯失又一次機遇。謝謝大家!
中國腦計劃馬上要啟動了,我個人認為是要將三項研究同步進行,因為大數據三化來認識腦袋,保護腦,模擬腦,謝謝!
評論