AI學術浪潮已來,解讀頂尖AI學術會議上中國科技企業(yè)的角色
同時,KDD在近幾年和中國的合作也非常密切,除了楊強教授領銜的SIGKDD China,在7月21日,由京東金融承辦的2018 KDD Summer School暨KDD18 Pre-Conference在四川召開,而在今年3月,京東金融就已經(jīng)參與承辦了國際數(shù)據(jù)挖掘領域頂級賽事KDD Cup 2018。
本文引用地址:http://www.ex-cimer.com/article/201807/389724.htm圖 | 2018 KDD Summer School活動現(xiàn)場的Poster交流環(huán)節(jié)
值得注意的是,今年京東金融也有四篇論文被KDD大會收錄,作者均來自京東金融城市計算事業(yè)部(京東金融于2018年成立的全新一級事業(yè)部),占京東集團論文收錄總數(shù)量的接近一半。
其四篇論文主題分別為《共享單車動態(tài)調(diào)度:時空數(shù)據(jù)上的強化學習模型》、《基于深度分布式融合網(wǎng)絡的空氣質(zhì)量預測》、《利用共享單車軌跡數(shù)據(jù)的違章停車檢測》、《基于對等和時間感知的表示學習的駕駛行為分析》,都是依托城市計算這一多學科融合的新興領域,通過不斷獲取、整合和分析城市中多種大數(shù)據(jù)來解決城市所面臨的交通、環(huán)境等挑戰(zhàn)。
頂級學術會議上的中國企業(yè)之光
· 做學術也要“接地氣”
如前文所述,KDD作為數(shù)據(jù)挖掘和數(shù)據(jù)科學領域最頂級的學術年會,來自學術界,工業(yè)界和政府部門的研究人員都希望在KDD上發(fā)表和展示自己的有影響力的工作,因而每年的投稿量都特別大,所以KDD的接收率一直非常低。
據(jù)了解,以KDD的應用數(shù)據(jù)科學論文為例,每篇投稿文章由至少3到4名審稿人評審及1名相應領域的高級程序委員協(xié)調(diào)討論并推薦,最終由程序委員會主席決定是否錄取。
所以國內(nèi)企業(yè)能夠從其中脫穎而出,更是實屬不易,這背后反映的不僅僅是科研能力的提升,也是企業(yè)解決實際問題的能力。
以每一年KDD的重要競賽環(huán)節(jié)KDD CUP為例,其題目范圍基本上圍繞與數(shù)據(jù)科學相關的現(xiàn)實問題,許多試題都有很強的應用背景。
比如簡單統(tǒng)計了歷年了KDD CUP的賽題:
學術研究最終還是要落地到解決實際問題,像KDD這樣的頂級學術會議,也非常注重企業(yè)用數(shù)據(jù)去解決現(xiàn)實問題的能力,這也凸顯了學術在“束之高閣”的同時,也不斷地向產(chǎn)業(yè)落地延伸。
從京東金融被收錄的四篇論文也能明顯看出這個趨勢。
· 企業(yè)科研的強落地能力
仔細研讀今年京東金融被收錄的四篇論文,就很好體現(xiàn)了學術研究和產(chǎn)業(yè)落地的緊密融合。比如《利用共享單車軌跡數(shù)據(jù)的違章停車檢測》這篇論文,研究背景就是國內(nèi)共享單車爆發(fā)所產(chǎn)生的騎行軌跡數(shù)據(jù),給檢測違章停車帶來新機遇。
論文中提到的基于共享單車軌跡數(shù)據(jù)的違章停車檢測技術通過預處理和檢測模塊,綜合軌跡清洗、路網(wǎng)匹配、軌跡索引方案等技術,已經(jīng)成功應用在部分地區(qū)的違停檢測上。據(jù)悉,京東金融也已經(jīng)和北京摩拜科技公司完成內(nèi)部部署,并展示給交管部門,為交警進行違停管理提供幫助,并為停車場的增建提供建議。
而在21日舉辦的2018 KDD Summer School上,京東金融副總裁、首席數(shù)據(jù)科學家、城市計算事業(yè)部總經(jīng)理鄭宇提到“城市計算是用大數(shù)據(jù)和人工智能打造未來城市,具體也就是對數(shù)據(jù)不斷的采集、管理、分析、挖掘,來解決城市的痛點,比如交通擁堵和環(huán)境污染。從城市的規(guī)劃、運維到預測,形成一個閉環(huán),推動城市可持續(xù)發(fā)展。”
圖 | 京東金融副總裁、首席數(shù)據(jù)科學家、城市計算事業(yè)部總經(jīng)理鄭宇
這也是學術研究到產(chǎn)業(yè)落地的完美閉環(huán)。
從企業(yè)的角度來看,在推動城市可持續(xù)發(fā)展中,一方面是企業(yè)對經(jīng)濟利益的追求,更重要的也是對社會利益的重視。
以當前嚴重的空氣污染問題為例,預測未來空氣質(zhì)量不僅可以幫政府更好地做出決策,也可以幫助人們規(guī)劃未來出行計劃。
在KDD收錄的四篇論文中,京東金融就提出了一種基于深度學習的預測方法DeepAir來預測未來48小時細粒度空氣質(zhì)量。其采用深度分布式架構(gòu)來融合異構(gòu)數(shù)據(jù),對所有影響空氣質(zhì)量的直接和間接因素進行建模。對比于傳統(tǒng)預測模型的結(jié)果(2014.10.1-2016.12.30),DeepAir的模型準確率比它們高22%。
當然,這也是現(xiàn)在科技企業(yè)做學術研究的一大趨勢——體現(xiàn)他們的強科研落地能力。比如今年騰訊旗下醫(yī)療AI實驗室共有3篇論文分別被KDD 2018、SIGIR 2018、COLING 2018三個國際頂尖學術會議收錄,其論文的主要研究方向為醫(yī)療知識圖譜中實體關系的發(fā)現(xiàn)和應用,就是通過大數(shù)據(jù)以及知識圖譜,輔助臨床決策,賦能基于AI的醫(yī)療產(chǎn)品。
· 學術研究,決定了企業(yè)的另一面
越來越多的企業(yè)注重技術研發(fā)以及學術研究,也表現(xiàn)了大公司在擴大商業(yè)版圖的同時,非常注重技術的深耕和持續(xù)研究等等,這是一個雙向互利的過程。
此前馬斯克曾發(fā)表過90%的學術論文無用的言論,一石激起千層浪。誠然,在一些商人眼里,寫論文是燒錢的事情,沒有什么價值。但是如業(yè)內(nèi)專家所說,一篇論文,經(jīng)過同行評議、修改、發(fā)表出來。這個過程本身就是一種價值,光看最后的論文,當然90%賺不到錢。但也是為研究從量變到質(zhì)變添了一塊磚。
同樣,就像浙江工業(yè)大學計算機科學與技術學院院長王萬良所說,要明確認識企業(yè)做論文的正確作用,“論文不是設計圖紙,許多只是實用技術的前期研究中間結(jié)果,企業(yè)的研發(fā)和高校科研院所的研發(fā)是不同的研發(fā)階段,難以互相取代。許多事情關鍵是正確認識?!?/p>
而企業(yè)在頂級學術會議中扮演著越來越關鍵的角色,同樣以京東金融為例,其城市計算事業(yè)部的一篇論文此前也被人工智能領域國際頂級學術會議IJCAI2018錄用。
頂級的學術會議不僅僅是學術界展示自身學術實力的機會,也正在成為大公司展現(xiàn)科研實力的重要舞臺。
以深度學習為例,在平臺、算力和數(shù)據(jù)系統(tǒng)的基礎之上,無論高校還是企業(yè)的實驗室,做出來的研發(fā)成果近乎可以在產(chǎn)業(yè)端即插即用,這也是為什么大公司需要在AI時代參加這些學術會議發(fā)表論文、以及技術比賽。
據(jù)了解,在科研成果的應用轉(zhuǎn)化方面,京東金融城市計算事業(yè)部就已經(jīng)為國家發(fā)改委城市和小城鎮(zhèn)改革發(fā)展中心、環(huán)保部、水利部、交通部等多個中央部委提供科技服務,并與國家能源集團、中國聯(lián)通、北控集團、摩拜、鏈家等企業(yè)開展深度合作。
最后
在英國政府與圖靈研究院發(fā)布的《2017AI產(chǎn)業(yè)報告》中,就指出過這樣一個問題:今天整個AI產(chǎn)業(yè)中,最急切需要的,是學術與產(chǎn)業(yè)多個端口之間的流通與聚合能力。
無論是KDD,還是IJCAI,亦或是其他AI頂級學術會議上,國內(nèi)高校和企業(yè)的身影越來越多,一方面這是中國AI學術能力的體現(xiàn),另一方面也凸顯了在學術和科研上,大家都在一步步穩(wěn)扎穩(wěn)打,共同助推產(chǎn)學研一體化,用AI解放生產(chǎn)力、創(chuàng)造更多的社會價值。
評論