聽懂”人話 智能語音爭奪人工智能皇冠上的“明珠”
吼一吼就可登App?近日,云知聲聲紋登錄系統(tǒng),成功率可達99%。與智能語音先行者科大訊飛相似,兩家公司創(chuàng)始人師出同門。
本文引用地址:http://www.ex-cimer.com/article/201903/398189.htm除了專業(yè)的語音技術(shù)廠商,互聯(lián)網(wǎng)科技巨頭也紛紛涌入語音賽道中來。2月20日,在小米的新品發(fā)布上,小愛觸屏音箱亮相,而在這兩天前,騰訊也出面澄清,聽聽(音箱)一直在正常研發(fā)和銷售運營,面向行業(yè)輸出全棧語音人工智能解決方案能力。
智能語音被譽為人工智能皇冠上的“明珠”,近段時間以來熱度不減,隨著深度學(xué)習技術(shù)的突破,大數(shù)據(jù)技術(shù)以及自然語言理解能力的提升,帶動了一波產(chǎn)業(yè)熱潮,除了在教育、客服、電信等傳統(tǒng)行業(yè)之外,還開辟出了車載、家居、醫(yī)療、智能硬件等語音技術(shù)應(yīng)用新天地。
“聽懂”人話,語音方案“百花齊放”
走進廣州迅羽通信技術(shù)公司的客服中心,敲擊鍵盤的聲音不再此起彼伏,客服人員更多在傾聽和安靜地回復(fù)來電。
迅羽先后承運了香港快運、電訊盈科、和記電訊、東亞銀行、亞航以及廣東省12348司法、廣東電力與國稅熱線等國內(nèi)外超大型客服服務(wù)。一直以來,傳統(tǒng)的客服呼叫中心是勞動密集型產(chǎn)業(yè),由于內(nèi)地人力成本優(yōu)勢,香港一些電信業(yè)、銀行業(yè)、航空業(yè)等將呼叫中心外包,但隨著人力成本的提升,呼叫中心的利潤進一步被壓縮。
從去年9月起,迅羽聯(lián)合哈工大共同成立人工智能自動問答技術(shù)研發(fā)實驗室,著手引入AI。經(jīng)測算,有七成動作是可替代的——客服人員大部分時間都在文字錄入和反復(fù)確認,而如今,每當客戶一報完身份證號碼、家庭地址等信息時,就已經(jīng)自動錄入系統(tǒng),而客服人員則可專注聽取客戶的反饋。在臺風等極端天氣下,面對激增的訂改機票業(yè)務(wù)也更從容,避免了人員配備過多。
機器能“聽懂”人話,已經(jīng)深入各種場景??拼笥嶏w與上海高院合作的刑事案件輔助辦案系統(tǒng)投用后,目前已開始在全國范圍內(nèi)擴展,輔助辦案系統(tǒng)有望在國內(nèi)法院系統(tǒng)全面鋪開,并向更多罪種、民商行政案件等方向延伸,截至今年初,審訊產(chǎn)品于法庭拓展迅速,已覆蓋815個法院、4200個法庭。
陪你聊,陪你跳,會管家,會傳情……深圳狗尾草智能科技公司不僅推出了呆萌又暖心的情感社交機器人,還打造出全球首個3D全息AI虛擬生命“琥珀”,在日趨白熱化的語音市場中走出了一條差異化道路。
“幫我調(diào)下明天上午7點的鬧鐘?!闭Z音識別距離大眾并不遙遠,在移動終端上,用戶可以實現(xiàn)手機讀短信、介紹餐廳、詢問天氣、語音設(shè)置鬧鐘等,智能音箱更被認為是控制智能家居的自然入口,從“百箱大戰(zhàn)”到現(xiàn)在的語音方案“百花齊放”,互聯(lián)網(wǎng)平臺商、語音技術(shù)硬件服務(wù)商、內(nèi)容和云服務(wù)商、芯片商等,都相繼推出了各自支持設(shè)備智能化升級的方案。
不是替代人,而是更好發(fā)揮人的價值
通過人工智能語音交互,機器不僅能聽懂人話,還能更好地發(fā)掘人的價值。
通過匯聚學(xué)生的家庭作業(yè)、課堂訓(xùn)練數(shù)據(jù),科大訊飛用語音識別對內(nèi)容進行語義理解分析,判斷作業(yè)對錯,提供改進方案?!叭斯ぶ悄?大數(shù)據(jù)結(jié)合因材施教,比如同一個班學(xué)生對內(nèi)容接受度是不一樣的,每個人的知識點情況掌握又是怎樣的,單個學(xué)生上一個知識點有沒有掌握,都可以有針對性地改進。”科大訊飛高級副總裁杜蘭說。
杜蘭說,AI賦能教育產(chǎn)業(yè)不是要取代老師這個職業(yè),而是可替代批改等瑣碎事務(wù),解放老師更多時間。
迅羽副總經(jīng)理黃勉超也同樣認為,AI的出現(xiàn),并不是要用機器人來取代人,而是與機器有更好分工,“有一半用戶是帶著情緒或投訴打進電話來,但如果他們面對的是一臺毫無表情的機器,只會繼續(xù)帶著憤怒掛掉電話”。
黃勉超還發(fā)現(xiàn),引入AI后,客服業(yè)務(wù)有了更多科技含量,品牌形象大為提升,公司在招人時也更有底氣,“以前這行業(yè)的人會覺得,大好青春就在這1平米的格子間日復(fù)一日從事簡單枯燥的事情,他們會覺得沒有前途,而現(xiàn)在工作沒有那么枯燥后,人員流動沒有那么頻繁,而且人員培訓(xùn)周期也大為縮短,新手很快就可以進入角色,在整個過程中,人的價值就發(fā)揮出來了”。
向B端發(fā)力,與產(chǎn)業(yè)結(jié)合構(gòu)筑生態(tài)
盡管智能音箱大戰(zhàn)火熱,但不少人始終認為,目前AI產(chǎn)品尤其是語音產(chǎn)品還只是一種年輕人的科技玩具,實用性并不強。
狗尾草創(chuàng)始人、CEO邱楠對此表示,任何一個代表未來方向的科技類產(chǎn)品的流行,比如手機、電腦、智能手表等,一定是從年輕人開始。年輕人對AI有想象力,他們知道自己需要的場景是怎樣的。盡管現(xiàn)有AI技術(shù)還不足夠成熟,但這就和電腦早期發(fā)展一樣,技術(shù)本身是需要時間去發(fā)展的。當年P(guān)C也同樣是從最開始的性能不足到后面慢慢被消費者接受。
C端產(chǎn)品火過一陣后,越來越多的玩家開始深入B端,與行業(yè)相結(jié)合。黃勉超說,C端產(chǎn)品可以戲謔、搞笑的方式與用戶溝通,當用戶說我要在附近找吃時,智能音箱回答不了就會說,“哎呀,你是個吃貨”,但客服語音對答就不能有絲毫調(diào)侃,用戶查詢明天下午3:30是否有飛往大阪的航班,有就是有,沒有就是沒有,不可能存在第三個答案。
不過,整體移動互聯(lián)網(wǎng)用戶增長見頂,以及BAT等行家也紛紛入局,語音技術(shù)日趨成熟,客戶變對手,讓科大訊飛的技術(shù)優(yōu)勢漸消。但杜蘭認為,BAT的到來會讓語音技術(shù)變得更好,這片海域是非常寬闊的,并不存在相互競爭的問題。
而科大訊飛也在加快構(gòu)建一個融合共享的人工智能產(chǎn)業(yè)生態(tài)。有這樣一個經(jīng)典的故事:一位四川人石城川,11歲那年高燒因失去聽覺,2015年,他發(fā)現(xiàn)科大訊飛有一種語音識別技術(shù),盡管自己聽不到自己的發(fā)音,但是可以通過這種技術(shù)矯正自己發(fā)音,并識別正常人的語音轉(zhuǎn)換成文字,這樣就可以實現(xiàn)自己和正常人的對話。在咿咿呀呀的發(fā)音中,他重拾語言能力。后來,他創(chuàng)立了“音書”App,為聽障者和健聽者之間建立溝通的橋梁。
目前,科大訊飛開放平臺已為超過90萬開發(fā)者提供服務(wù),2018年,共有55.8%的創(chuàng)業(yè)團隊借助科大訊飛技術(shù)實現(xiàn)創(chuàng)業(yè)夢想。
隨著技術(shù)迭代更新越來越快,語音識別準確率方面的提升越來越難,在眾多玩家之間,競爭差距是更大還是更小?“企業(yè)間并不存在太大的技術(shù)差距,早期都是同一個技術(shù)公司,隨著技術(shù)紅利和技術(shù)壁壘的下降,后期推動開源,不只是看單一的技術(shù)能力。”邱楠說,論技術(shù),有哪一家企業(yè)能競爭過中科院?但企業(yè)是給技術(shù)找到技術(shù)場景,在此基礎(chǔ)上不斷延展,競爭的維度一定是多元的,語音技術(shù)的壁壘也不會一直持續(xù)下去。
“我把企業(yè)分成兩大類,分別是技術(shù)輸出型和產(chǎn)品創(chuàng)新型,前者如谷歌,輸出安卓系統(tǒng);后者如蘋果,其技術(shù)能力是為自己定義差異化、尋找差異化服務(wù)。”邱楠說,我給我們的定位就是追求產(chǎn)品的差異化和創(chuàng)新性。
專家點評:智能語音市場整體處于啟動期
智能語音是最早落地的人工智能技術(shù)。隨著行業(yè)數(shù)據(jù)資源的積累,深度學(xué)習算法的進步,以及與其他人工智能技術(shù)之間的整合,語音識別、語義理解、語音合成技術(shù)將取得進一步突破,語音交互有望成為新一代人機交互的主要方式。
目前,國內(nèi)外幾乎所有的科技巨頭都相繼進入了智能語音市場,國外有IBM的Watson、GoogleNow、蘋果的Siri、微軟的Cortana、Facebook的MessagePlatform、亞馬遜的Aleax等,國內(nèi)有阿里的天貓精靈、百度的度秘、騰訊的微信語音,以及科大訊飛、華為、小米、云知聲、依圖等發(fā)展的智能語音技術(shù)和產(chǎn)品。據(jù)《2017-2018中國智能語音產(chǎn)業(yè)白皮書》的數(shù)據(jù)顯示,2014年至2018年,中國智能語音產(chǎn)業(yè)規(guī)模由30億元增長至159.7億元,五年間增長了五倍。雖然有這么多的科技巨頭和新創(chuàng)AI企業(yè)進入智能語音領(lǐng)域,產(chǎn)業(yè)規(guī)模也快速增長,但智能語音市場整體依然處于啟動期,智能語音產(chǎn)品和技術(shù)變現(xiàn)尚處于起步階段,真正成熟的語音產(chǎn)品還需要時間的打磨。
國家高度重視新一代人工智能產(chǎn)業(yè)的發(fā)展,隨著新一代人工智能發(fā)展規(guī)劃的啟動實施,加快產(chǎn)業(yè)化和應(yīng)用是著力點。工信部將進一步推動以智能語音為代表的人工智能核心技術(shù)發(fā)展,加強技術(shù)攻關(guān)、促進行業(yè)融合應(yīng)用、優(yōu)化發(fā)展環(huán)境,務(wù)實推動智能語音產(chǎn)業(yè)規(guī)模發(fā)展??梢灶A(yù)見,隨著行業(yè)應(yīng)用和場景的大規(guī)模切入,智能語音產(chǎn)品將快速迭代,產(chǎn)品的性能和用戶體驗也會不斷提升,智能語音的發(fā)展大有可期。
評論