智能語(yǔ)音識(shí)別AI市場(chǎng)即將井噴,關(guān)鍵“芯元素”成引爆點(diǎn)
與去年阿法狗(AlphaGo)輕松擊敗李世石后人們紛紛驚嘆人類被機(jī)器人超越不同的是,前不久全球排位第一的柯潔再次完敗于人工智能(AI)的機(jī)器人后,人們明顯已經(jīng)逐漸接受了人工智能在很多領(lǐng)域超越人類的事實(shí),更多地從理性角度探討以人工智能為基礎(chǔ)的科技對(duì)人類社會(huì)的改變機(jī)遇。據(jù)今日頭條首份人工智能影響力報(bào)告表明,中國(guó)國(guó)民AI信心指數(shù)高達(dá)83,中國(guó)消費(fèi)者對(duì)人工智能的態(tài)度變得十分積極。
本文引用地址:http://www.ex-cimer.com/article/201706/360571.htm“事實(shí)上,人工智能正在逐漸走入我們生活,尤其作為人工智能非常重要的語(yǔ)音智能識(shí)別的研究上,世界范圍內(nèi)已經(jīng)做出了非常成功的創(chuàng)新應(yīng)用,而中國(guó)同樣也走在了前列?!?nbsp;以電源和模擬半導(dǎo)體技術(shù)領(lǐng)先的深圳芯智匯科技有限公司(X-Powers Technology)產(chǎn)品經(jīng)理徐正弟近日對(duì)媒體表示。由于非常看好基于語(yǔ)音的人工智能技術(shù)的應(yīng)用,芯智匯科技近日在國(guó)內(nèi)率先發(fā)布了專門針對(duì)人工智能熱門應(yīng)用的語(yǔ)音識(shí)別多陣列麥克風(fēng)前端ADC芯片AC108?!白鳛橹悄苷Z(yǔ)音應(yīng)用中非常關(guān)鍵的入口信號(hào)拾取的AC108推出,我們期待以突破性的SNR(信噪比,108dB)性能和更優(yōu)化的設(shè)計(jì)助推企業(yè)在人工智能應(yīng)用領(lǐng)域搶占市場(chǎng)先機(jī)?!?nbsp;徐正弟指出。
圖1:中國(guó)國(guó)民AI信心指數(shù)高達(dá)83
消費(fèi)者正習(xí)慣語(yǔ)音交互,Smart Home是首個(gè)突破口
最新發(fā)布的《2017年互聯(lián)網(wǎng)趨勢(shì)報(bào)告》指出,在使用Google Assistant(谷歌語(yǔ)音助手)的智能手機(jī)用戶中,2016年5月僅20%的移動(dòng)查詢通過(guò)語(yǔ)音方式完成,而至2017年5月已有近7成的詢問(wèn)是通過(guò)自然/交談?wù)Z言進(jìn)行的。僅僅一年時(shí)間已經(jīng)發(fā)生巨大改變,多數(shù)消費(fèi)者的移動(dòng)查詢習(xí)慣已開(kāi)始偏向智能語(yǔ)音交互。
圖2:消費(fèi)者正在習(xí)慣使用語(yǔ)音交互完成查詢等操作
“智能語(yǔ)音首先會(huì)在垂直市場(chǎng)落地,在交互相對(duì)單一、場(chǎng)景相對(duì)固定,且用戶有剛需的應(yīng)用場(chǎng)景中,比如家電控制、車載電子就有大量的發(fā)展機(jī)會(huì)?!毙煺茉诮邮懿稍L時(shí)介紹道。這類場(chǎng)景的需求相對(duì)簡(jiǎn)單,最需要的是一系列命令詞的識(shí)別,技術(shù)相對(duì)容易實(shí)現(xiàn)。與此同時(shí),在自動(dòng)駕駛成熟之前,車內(nèi)駕駛者都無(wú)法釋放出雙手,因此車內(nèi)語(yǔ)音控制也是剛需。就目前而言,智慧家居的語(yǔ)音控制顯然走得更前些,很明顯的例子就是Amazon Echo的風(fēng)靡!
圖3:語(yǔ)音識(shí)別成物聯(lián)網(wǎng)智能化入口之一
2016年下半年,Amazon將Echo Dot的售價(jià)從99美元下降到49美元,這意味著未來(lái)一年Echo相關(guān)產(chǎn)品的出貨量將大幅度提升。與此同時(shí),上游供應(yīng)鏈透露的消息稱,2017年Amazon已將智能音箱的訂單量增加至1,000萬(wàn)臺(tái),為2016年的三倍!在這場(chǎng)智能音箱的競(jìng)賽中,Amazon、Google和Apple等全球領(lǐng)導(dǎo)企業(yè)正在推動(dòng)越來(lái)越多的互聯(lián)網(wǎng)公司發(fā)布類似的智能音箱產(chǎn)品,其中也不乏中國(guó)企業(yè)加入競(jìng)逐,如京東智能的叮咚系列,這也為上下游各環(huán)節(jié)的供應(yīng)商帶來(lái)了巨大的機(jī)會(huì)。
信號(hào)拾取前端處理很關(guān)鍵,108dB SNR解決遠(yuǎn)場(chǎng)語(yǔ)音設(shè)計(jì)最大挑戰(zhàn)
事實(shí)上,像智能手機(jī)上Siri、Google Assistant這樣近距離的智能語(yǔ)音應(yīng)用已經(jīng)相對(duì)成熟(因?yàn)楦蛩惴?,“而目前最主要的智能語(yǔ)音應(yīng)用通常交互距離在3~5米,更遠(yuǎn)距離或者環(huán)境更嘈雜的遠(yuǎn)場(chǎng)智能語(yǔ)音信號(hào)處理是Smart Home應(yīng)用的關(guān)鍵,這是AC108推出的主要目標(biāo)市場(chǎng)?!?nbsp;徐正弟表示,“這些應(yīng)用需要多陣列麥克風(fēng),必須解決多通道語(yǔ)音采集、高信噪比(SNR)以及低復(fù)雜度設(shè)計(jì)要求?!?/p>
智能語(yǔ)音應(yīng)用的實(shí)現(xiàn)需要三個(gè)環(huán)節(jié):首先是拾取——將自然的語(yǔ)音信號(hào)轉(zhuǎn)化為數(shù)字信號(hào);緊接是前處理——對(duì)采集到的語(yǔ)音信號(hào)進(jìn)行降噪、消回聲、去混響等處理,形成“干凈”的音頻信號(hào);最后是本地或云端的語(yǔ)音識(shí)別引擎對(duì)“干凈”的語(yǔ)音信號(hào)進(jìn)行識(shí)別和語(yǔ)義分析,從而實(shí)現(xiàn)智能反饋。顯然,在完成算法層面的語(yǔ)音識(shí)別之前需要進(jìn)行遠(yuǎn)距離拾音,首當(dāng)其沖必須使用麥克風(fēng)陣列,配套語(yǔ)音前處理算法,如NS、AEC、De-reverb等,才能實(shí)現(xiàn)自然語(yǔ)言人機(jī)交互。
在整套智能語(yǔ)音系統(tǒng)中,前端語(yǔ)音采集和處理,對(duì)語(yǔ)音識(shí)別高準(zhǔn)確率起到了決定性作用。從硬件元器件的層面分析,前端語(yǔ)音ADC芯片的性能表現(xiàn)是關(guān)鍵因素!一般而言,決定ADC芯片性能優(yōu)劣的其中一個(gè)重要參數(shù)是信噪比SNR,它表征了最大不失真聲音信號(hào)、即主觀上認(rèn)為的有用信號(hào)強(qiáng)度與噪音強(qiáng)度之間的比率,信噪比SNR越高,噪音越小,芯片性能表現(xiàn)越好。
分析市場(chǎng)上幾款主流智能音箱產(chǎn)品的相關(guān)報(bào)告可以發(fā)現(xiàn)其前端語(yǔ)音ADC芯片SNR為98dB、101dB,而AC108宣稱的108dB是目前業(yè)內(nèi)同類產(chǎn)品中達(dá)到最高信噪比的ADC芯片?!癆C108型號(hào)名稱凸顯了其性能優(yōu)勢(shì)——‘Audio Codec 108dB(SNR)’,108dB是目前滿足麥克風(fēng)陣列應(yīng)用的最高性能。同時(shí)AC108嚴(yán)格按照家電級(jí)標(biāo)準(zhǔn)進(jìn)行設(shè)計(jì)、生產(chǎn)、測(cè)試,從而保證良好品質(zhì)要求?!毙煺芙榻B道。
圖4:基于智能語(yǔ)音識(shí)別技術(shù)的國(guó)內(nèi)部分消費(fèi)電子產(chǎn)品
全生態(tài)產(chǎn)業(yè)鏈已經(jīng)成熟,市場(chǎng)引爆在即
毫無(wú)疑問(wèn),語(yǔ)音智能應(yīng)用正在飛速發(fā)展?!皬奈覀兣c國(guó)內(nèi)外企業(yè)接觸來(lái)看,這個(gè)市場(chǎng)目前正面臨一波井噴的大發(fā)展機(jī)遇,目前包括格力、美的、海爾、長(zhǎng)虹等主要的家電企業(yè)已經(jīng)密集布局智能語(yǔ)音控制產(chǎn)品,從空調(diào)、冰箱、彩電,甚至到小家電都有相關(guān)產(chǎn)品布局,部分產(chǎn)品已經(jīng)推出市場(chǎng)?!毙煺苤赋?,“特別是隨著包括成本、方案成熟度、設(shè)計(jì)復(fù)雜度的改變,市場(chǎng)爆發(fā)性增長(zhǎng)指日可待?!?/p>
據(jù)徐正弟的分析,在空調(diào)等大件家電應(yīng)用中,目前語(yǔ)音識(shí)別方案增加的成本約占整體成本的5%~10%,成本壓力還是比較大?!斑@部分成本存在很大的壓縮空間,芯智匯科技與國(guó)內(nèi)語(yǔ)音識(shí)別產(chǎn)業(yè)鏈的合作廠商正在快速促進(jìn)低成本、高性能的解決方案?!?nbsp;徐正弟進(jìn)一步解釋道:“目前多數(shù)智能語(yǔ)音應(yīng)用的SoC一般保留標(biāo)準(zhǔn)的I2S接口,傳統(tǒng)上支持多路ADC輸入的做法是采用FPGA或MCU實(shí)現(xiàn)通道變換而AC108在設(shè)計(jì)中即考慮了該因素,通過(guò)將多路語(yǔ)音信號(hào)通過(guò)升采樣率的方式,實(shí)現(xiàn)了標(biāo)準(zhǔn)的I2S支持多路音頻數(shù)據(jù)傳輸,使得方案中可以節(jié)省FPGA或MCU,大大降低方案設(shè)計(jì)成本和復(fù)雜度?!贝送猓c部分方案需要采用多片ADC支持麥克風(fēng)陣列不同,基于AC108級(jí)聯(lián)兩顆芯片(最多可四片級(jí)聯(lián))即可實(shí)現(xiàn)多陣列麥克風(fēng)方案。
圖5:AC108高性能、低成本的遠(yuǎn)場(chǎng)語(yǔ)音拾取方案
這種定制化的優(yōu)化解決方案在大大降低成本的同時(shí),還能加快廠商的產(chǎn)品上市進(jìn)度,而這對(duì)于快速發(fā)展的消費(fèi)市場(chǎng)來(lái)說(shuō)尤為關(guān)鍵。據(jù)了解,目前芯智匯AC108已向潛在客戶提供EVM Board和使用友好的配套PC工具,方便工程師快速對(duì)ADC進(jìn)行選型評(píng)估?!拔覀冞€提供專業(yè)詳細(xì)的指導(dǎo)文檔和參考驅(qū)動(dòng),以及保姆式的服務(wù),幫助客戶快速完成設(shè)計(jì)開(kāi)發(fā),加速產(chǎn)品上市?!毙煺芙榻B道。高性能模擬信號(hào)處理通常是工程師的噩夢(mèng),對(duì)于消費(fèi)電子市場(chǎng)為主的智能語(yǔ)音識(shí)別應(yīng)用來(lái)說(shuō),這樣的“保姆式”技術(shù)服務(wù)對(duì)實(shí)現(xiàn)產(chǎn)品高性能和快速面市非常重要。
無(wú)論ADC還是SoC,都只是語(yǔ)音識(shí)別生態(tài)鏈中的一環(huán),整個(gè)生態(tài)鏈的成熟發(fā)展至關(guān)重要。目前麥克風(fēng)陣列算法、配套語(yǔ)音前處理算法、云端語(yǔ)義平臺(tái)等已經(jīng)發(fā)展成熟?!皹I(yè)內(nèi)的大量研發(fā)工作還在快速提升語(yǔ)音識(shí)別效果,包括大量AI訓(xùn)練下的多語(yǔ)種支持,快速可復(fù)制量產(chǎn)多環(huán)節(jié)配合,等等。AC108的推出再次彌補(bǔ)了針對(duì)麥克風(fēng)陣列的高性能ADC的短板,我們已經(jīng)與國(guó)內(nèi)主要的平臺(tái)方案商合作,并與亞馬遜Alexa等國(guó)際平臺(tái)合作,這些產(chǎn)業(yè)鏈的良好互動(dòng)正在助推智能語(yǔ)音識(shí)別爆發(fā)性增長(zhǎng),預(yù)期一年內(nèi)將看到越來(lái)越多的相關(guān)產(chǎn)品面市?!毙煺軜?lè)觀地指出。
評(píng)論