科大訊飛的人工智能之路
今年,李世石與Alpha Go的人機(jī)圍棋大戰(zhàn)吸睛無數(shù),人工智能的話題始料未及地席卷了世界每處。今年也恰逢人工智能學(xué)科誕生一甲子,歷經(jīng)波折的人工智能發(fā)展終于掀起全球熱潮,各國政府紛紛提出人工智能發(fā)展研究相關(guān)計劃,蘋果、谷歌等國際IT產(chǎn)業(yè)巨頭也相繼推出一系列人工智能應(yīng)用,希望在新一輪人工智能技術(shù)競爭中取得先機(jī)。
本文引用地址:http://www.ex-cimer.com/article/201611/339519.htm科大訊飛作為亞太地區(qū)最大的智能語音和人工智能上市公司,也是中國智能語音與人工智能產(chǎn)業(yè)的領(lǐng)導(dǎo)者,在語音合成、語音識別、口語評測、自然語言處理等多項技術(shù)上擁有國際領(lǐng)先成果。目前,科大訊飛已經(jīng)占有中文語音技術(shù)市場70%以上的市場份額。
在人工智能技術(shù)鉆研與產(chǎn)業(yè)布局上,科大訊飛也較早提出了明確的思路與方向。2014年,“訊飛超腦”計劃應(yīng)運(yùn)而生,目標(biāo)是讓機(jī)器實現(xiàn)從“能聽會說”到“能理解會思考”;2015年,科大訊飛發(fā)布的具有里程碑意義的人機(jī)交互界面AIUI現(xiàn)在聚合了超過18萬的開發(fā)伙伴和8億的終端用戶,以科大訊飛為中心的人工智能產(chǎn)業(yè)生態(tài)已經(jīng)逐步構(gòu)建。科大訊飛力求在人工智能時代真正到來時全面開花,搶占人工智能產(chǎn)業(yè)高點(diǎn)。
科大訊飛是如何發(fā)展的?
1999年,還在中國科學(xué)技術(shù)大學(xué)就讀的劉慶峰面對當(dāng)時中文語音市場由國際巨頭把持的現(xiàn)狀,懷揣“中文語音技術(shù)必須由中國人做到全球最好,中文語音產(chǎn)業(yè)必須掌握在自己手上”的信念,毅然創(chuàng)立了科大訊飛。
從6個人的團(tuán)隊到后來18個人創(chuàng)業(yè),一度并沒有人相信這個“草臺班子”能夠與國際巨頭抗衡。初期的科大訊飛遭逢創(chuàng)業(yè)的種種艱難,直至5年后,公司才終于實現(xiàn)盈虧平衡。在盈利的博弈與權(quán)衡中,語音技術(shù)與產(chǎn)業(yè)當(dāng)時被牢牢確立為公司的發(fā)展目標(biāo)和方向。巨大的壓力之下,磨礪出的是堅持創(chuàng)新和堅忍不拔的寶貴品質(zhì),這也成為科大訊飛一貫堅守和傳承的核心精神。
創(chuàng)立近10年后,科大訊飛迎來了一個發(fā)展拐點(diǎn):上市。2008年的中國風(fēng)云變幻,科大訊飛上市猶如浪潮中的一簇小水花,卻激起了自身的滔天巨浪。技術(shù)仍然是核心,產(chǎn)品和市場意識逐漸走上舞臺。劉慶峰帶領(lǐng)團(tuán)隊進(jìn)一步梳理了公司的愿景和使命,立志要讓事業(yè)影響中國未來,影響到每一個普通人的生活中。
功夫不負(fù)有心人。憑借核心技術(shù)的絕對優(yōu)勢,科大訊飛在歷次的國內(nèi)外語音合成評測中,各項關(guān)鍵指標(biāo)均名列第一,2008年至今連續(xù)在國際語種識別評測大賽中名列前茅,2003年和2011年兩次榮獲“國家科技進(jìn)步獎”,2005年和2011年兩次獲得中國信息產(chǎn)業(yè)自主創(chuàng)新最高榮譽(yù)“信息產(chǎn)業(yè)重大技術(shù)發(fā)明獎”。
2010年,科大訊飛發(fā)布了語音云平臺和輸入法,云平臺面向所有創(chuàng)業(yè)者免費(fèi)開放,為海量用戶提供服務(wù)。數(shù)據(jù)的抓取、資源的整合,顯示的是科大訊飛決策未來的戰(zhàn)略決心。在此基礎(chǔ)上,隨著人工智能時代的來臨,科大訊飛連續(xù)發(fā)力:2014年發(fā)布“訊飛超腦”計劃,核心就是讓機(jī)器從“能聽會說”到“能理解會思考”;2015年發(fā)布對人工智能產(chǎn)業(yè)具有里程碑意義的人機(jī)交互界面——AIUI。在教育、家居、客服、車載、醫(yī)療等細(xì)分領(lǐng)域,科大訊飛依托人工智能技術(shù)達(dá)成廣泛合作,推出品類豐富的產(chǎn)品體系覆蓋市場。
2016年5月,ResearchMarkets最新發(fā)布的報告稱在全球語音市場,谷歌、微軟、蘋果和科大訊飛獲得了迅速增長,全球市場份額分別為20.7%、13.4%、12.9%和6.7%,科大訊飛已經(jīng)代表中國民族創(chuàng)新企業(yè)站上了國際舞臺,在全球競爭中占據(jù)一席之地。放眼未來,科大訊飛將繼續(xù)推動萬物互聯(lián),并推動整個IT產(chǎn)業(yè)第六次浪潮的到來。
“訊飛超腦”——科大訊飛的人工智能布局
美國、歐盟等發(fā)達(dá)國家分別提出了“Brain Initiative”和“Human Brain Project”等人腦研究計劃,投入巨資并將其提升到與“人類基因圖譜”重大工程并重的高度。蘋果、谷歌等國際IT產(chǎn)業(yè)巨頭亦相繼推出了Siri、Google Now語音搜索等一系列人工智能應(yīng)用。全球政府、企業(yè)都已將目光投向人工智能行業(yè),各顯神通。
人工智能的突破與“認(rèn)知革命”緊密相關(guān)。七萬年前,人類發(fā)生了“認(rèn)知革命”,核心是智人擁有豐富的語言,可以更好的描述自然世界、執(zhí)行更加復(fù)雜的計劃,關(guān)鍵是可以描述夢中和想象的東西,從而產(chǎn)生虛構(gòu)、宗教和各種概念。正因如此,目前很多正在做人工智能研究的專家,包括Michael Jordan和Yann Lecun等都已經(jīng)意識到,自然語言理解對于人工智能來說是一個突破口。
科大訊飛目前正在執(zhí)行的“訊飛超腦計劃”,就是希望實現(xiàn)包括感知智能和認(rèn)知智能在內(nèi)的全面突破,也是在人工智能領(lǐng)域的核心布局內(nèi)容。在感知智能領(lǐng)域,語音識別、手寫識別方面每年保證30%-50%的錯誤率的下降;在識別普通話的基礎(chǔ)之上,進(jìn)一步識別方言;不僅能夠理解人類和機(jī)器的對話,還能理解人和人之間的對話;不僅能夠識別聯(lián)機(jī)手寫的字符,還能識別離線手寫的字符。在認(rèn)知智能上的研究目標(biāo),關(guān)鍵是讓機(jī)器能理解會思考,這必須要突破語言理解、知識表示、聯(lián)想推理,自主學(xué)習(xí)等多個方面。
目前,科大訊飛的“訊飛超腦”已取得了階段性的進(jìn)展。作為計劃的重要組成部分,科大訊飛正牽頭進(jìn)行國家科技部863重大專項——“類人答題機(jī)器人項目”,未來要讓機(jī)器人參加高考并考上一本,甚至是清華、北大、科大這樣水平的高校。而在口語翻譯和評測方面,目前科大訊飛口語翻譯技術(shù)已達(dá)到英語六級水平,在國際機(jī)器翻譯評測(IWSLT2014,NIST2015)等大賽中奪得冠軍,口語作文評測機(jī)器已可替代老師進(jìn)行自動評測,在廣東高考英語口語作文考試中得以全面應(yīng)用。在主觀題閱卷上,科大訊飛將業(yè)界獨(dú)家的人工智能核心技術(shù)應(yīng)用于考試以及傳統(tǒng)線下作業(yè)的自動批閱,不論是手寫識別的還是選擇題涂抹,都可以先通過OCR轉(zhuǎn)變成計算機(jī)可以理解的文本和圖像,再讓計算機(jī)自動對答案的正確程度進(jìn)行評判,這其實是感知智能和認(rèn)知智能的結(jié)合?,F(xiàn)在安徽省合肥市和安慶市的會考中,英文和中文的考試已經(jīng)全部使用了整套感知智能和認(rèn)知智能技術(shù)進(jìn)行自動評分,取得了非常好的效果,以后此技術(shù)將會被全面推廣到包括文科和理科的所有課程。
在產(chǎn)品應(yīng)用之外,基于多年積累,目前科大訊飛在各項大賽中都取得了優(yōu)異的成果。以今年為例,在年初舉行的國際語音合成大賽上,科大訊飛通過承建的語音及語言信息處理國家工程實驗室報送的參賽系統(tǒng),不僅繼續(xù)在自然度、相似度、可懂度等傳統(tǒng)指標(biāo)上保持國際領(lǐng)先,還在語篇段落表現(xiàn)測試中所有7項測試指標(biāo)位列第一。這是科大訊飛自2006年首次參賽以來,第十一次參與該項賽事,持續(xù)鞏固了在智能語音技術(shù)的全球領(lǐng)先地位。
隨后,在今年的全球人工智能比賽Winograd Schema Challenge中,科大訊飛再次榮獲第一。Winograd Schema Challenge作為意圖取代圖靈測試(Turingtest)的人工智能測試項目,著重考察認(rèn)知、推理和常識判斷能力。
此外在美國當(dāng)?shù)貢r間9月13日,科大訊飛領(lǐng)銜的中國技術(shù)團(tuán)隊又在國際多通道語音分離和識別大賽(CHiME)中包攬了賽事全部三個項目的冠軍。據(jù)介紹,CHiME比賽重點(diǎn)解決的是真實、復(fù)雜場景下的語音識別,因此是語音識別領(lǐng)域最高難度的比賽之一。參賽的各個語音系統(tǒng)需要克服高噪聲、混響等干擾,在咖啡廳、公交車、街道等日常生活場景中,準(zhǔn)確地識別和處理英文語音。
以各項賽事成績名列前茅的技術(shù)為保障,“訊飛超腦計劃”的目標(biāo)就是讓各類智能終端實現(xiàn)從“能聽會說”到“能理解會思考”的演進(jìn),進(jìn)而實現(xiàn)全球第一個中文認(rèn)知智能計算引擎,在語音合成、識別和人工智能等各項領(lǐng)域引領(lǐng)智能應(yīng)用潮流的發(fā)展。
評論