智能家居市場 語音識別這一密鑰何時才能被激活?
在80年代,以數(shù)理邏輯為核心的體制瓦解后,人工智能分化出了五大獨立學科。在這五大學科中,由深度學習推動,并順利從科研實驗室走到人們身邊的智能語音,某種程度上承擔了人工智能這兩年的大部分熱度。智能語音在2016年被美國權(quán)威雜志《麻省理工科技評論》評為當年的十大突破科技,根據(jù)易觀·工信部數(shù)據(jù),2017年中國語音產(chǎn)業(yè)規(guī)模就將突破百億。
本文引用地址:http://www.ex-cimer.com/article/201806/381288.htm說到智能語音就不能不提智能家居。在當下的智能家居行業(yè),語音基于其交互的自然性,被認為是未來人與家居交互的主要入口路徑,以致業(yè)內(nèi)普遍認為,“以語音為入口連接各種服務,構(gòu)建智家生態(tài)”。
作為人工智能應用最成熟的技術(shù)之一,目前語音交互的核心環(huán)節(jié)也取得重大突破,語音識別環(huán)節(jié)突破了單點能力,從遠場識別,到語音分析和語義理解有了重大突破,呈現(xiàn)一種整體的交互方案。自動語音識別(ASR)和前端語音處理的最新發(fā)展已使得語音控制相當成熟和有效。ASR引擎可以理解多種語言和口音,而語音生物辨識可用于辨識系統(tǒng)中預先登錄的特定用戶,以在智能家居環(huán)境中提供不同的權(quán)限。
不過,雖然大多數(shù)家居可以用語音開啟導航,進行信息查詢,實現(xiàn)一些諸如空調(diào)、開燈等功能控制,但距離“以語音為入口連接各種服務,構(gòu)建智家生態(tài)”的理想仍然較遠。目前的技術(shù)仍然限制在5公尺的范圍內(nèi),并且難以在多人同時交談或吵雜的環(huán)境中操作。
影響語音控制技術(shù)進入到智能家居或其他應用領域的原因很多,包括使用者的習慣是否被建立、是否提供更多“控制”功能以外的附加價值、是否有更“特別”的應用出現(xiàn),以及安全性的問題。其中,安全性可說是消費者最為關(guān)注的部分。
就像著名電影《蜘蛛俠》中的那句臺詞:“力量越大,責任越重?!?a class="contentlabel" href="http://www.ex-cimer.com/news/listbylabel/label/語音識別">語音識別能量越大,就越需要安全閥門。首先是聲紋的采集。不管是人工識別,還是依靠深度學習算法進行自動化識別,聲紋庫的建立都是進行一切行動的前提。當前,公安的聲紋鑒別庫最全,但如果是企業(yè)要想研究聲紋識別,從公安處入手顯然不可能,因而,企業(yè)智能自行收集聲紋并建立聲紋庫,這是一項十分艱巨的任務。更重要的是,企業(yè)還要注意如何保障聲紋不被非法利用。
其次,我們都聽說過“無用輸入,無用輸出”的說法,但你想過這句話同樣適用于負責業(yè)務的語音識別嗎?企業(yè)是否有建立污染數(shù)據(jù)安全策略(它能確保攻擊者不會利用篡改過的數(shù)據(jù)欺騙人工智能并讓它推薦錯誤的決策)嗎?如果設備根據(jù)錯誤的數(shù)據(jù)做出了錯誤的決策,那么,企業(yè)需要多長時間才能發(fā)現(xiàn)?數(shù)據(jù)污染已經(jīng)是網(wǎng)絡安全世界中的一個關(guān)注點。例如,反惡意軟件根據(jù)多重來源提交的標記和樣本進行工作,而反惡意軟件供應商必須保持警惕,防止攻擊者愚弄這一系統(tǒng)。
盡管如此,與其他生物特征相比,聲紋識別的應用仍然具有特殊優(yōu)勢,比如聲紋提取可在不知不覺中完成,因此使用者的接受程度也相對較高目前,聲紋識別在全球市場中的占有率達到15.8%,僅次于指紋和掌紋識別,并呈現(xiàn)出不斷上升的趨勢,因此,我們有理由相信,聲紋識別或?qū)⒊蔀檎Z音交互的下一個風口。
結(jié)語:在今天這個快節(jié)奏的社會中,語音識別技術(shù)的誕生,可以說是一次偉大的技術(shù)變革。隨著高質(zhì)量數(shù)據(jù)的不斷積累、技術(shù)的不斷突破及硬件平臺算力的提升,語音識別正在向我們期待的方向快速發(fā)展。
評論