<meter id="pryje"><nav id="pryje"><delect id="pryje"></delect></nav></meter>
          <label id="pryje"></label>

          新聞中心

          EEPW首頁 > 嵌入式系統(tǒng) > 設(shè)計(jì)應(yīng)用 > 麥克風(fēng)陣列技術(shù)語音交互應(yīng)該選用怎樣的方案?

          麥克風(fēng)陣列技術(shù)語音交互應(yīng)該選用怎樣的方案?

          作者: 時(shí)間:2018-07-25 來源:網(wǎng)絡(luò) 收藏

          聲源測(cè)向:這里沒有用聲源定位,測(cè)向和定位是不太一樣的,而消費(fèi)級(jí)陣列做到測(cè)向就可以了,沒必要在這方面投入太多成本。聲源測(cè)向的主要作用就是偵測(cè)到與之對(duì)話人類的聲音以便后續(xù)的波束形成。聲源測(cè)向可以基于能量方法,也可以基于譜估計(jì),陣列也常用TDOA技術(shù)。聲源測(cè)向一般在語音喚醒階段實(shí)現(xiàn),VAD技術(shù)其實(shí)就可以包含到這個(gè)范疇,也是未來功耗降低的關(guān)鍵研究?jī)?nèi)容。

          本文引用地址:http://www.ex-cimer.com/article/201807/383792.htm

          波束形成:波束形成是通用的信號(hào)處理方法,這里是指將一定幾何結(jié)構(gòu)排列的陣列的各輸出信號(hào)經(jīng)過處理(例如加權(quán)、時(shí)延、求和等)形成空間指向性的方法。波束形成主要是抑制主瓣以外的聲音干擾,這里也包括人聲,比如幾個(gè)人圍繞Echo談話的時(shí)候,Echo只會(huì)識(shí)別其中一個(gè)人的聲音。

          陣列增益:這個(gè)比較容易理解,主要是解決拾音距離的問題,若信號(hào)較小,語音識(shí)別同樣不能保證,通過陣列處理可以適當(dāng)加大語音信號(hào)的能量。

          模型匹配:這個(gè)主要是和語音識(shí)別以及語義理解進(jìn)行匹配,是一個(gè)完整的信號(hào)鏈,從麥克風(fēng)陣列開始的語音流不可能割裂的存在,必然需要模型匹配在一起。實(shí)際上,效果較好的專用麥克風(fēng)陣列,通常是兩套算法,一套內(nèi)嵌于硬件實(shí)時(shí)處理,另外一套服務(wù)于云端匹配語音處理。

          麥克風(fēng)陣列的技術(shù)趨勢(shì)

          語音信號(hào)其實(shí)是不好處理的,我們知道信號(hào)處理大多基于平穩(wěn)信號(hào)的假設(shè),但是語音信號(hào)的特征參數(shù)均是隨時(shí)間而變化的,是典型的非平穩(wěn)態(tài)過程。幸運(yùn)的是語音信號(hào)在一個(gè)較短時(shí)間內(nèi)的特性相對(duì)穩(wěn)定(語音分幀),因而可以將其看作是一個(gè)準(zhǔn)穩(wěn)態(tài)過程,也就是說語音信號(hào)具有短時(shí)平穩(wěn)的特性,這才能用主流信號(hào)處理方法對(duì)其處理。從這點(diǎn)來看,麥克風(fēng)陣列的基本原理和模型方面就存在較大的局限,也包括聲學(xué)的非線性處理(現(xiàn)在基本忽略非線性效應(yīng)),因此基礎(chǔ)研究的突破才是未來的根本。希望能有更多熱愛人工智能的學(xué)生關(guān)注聲學(xué),報(bào)考我們中科院聲學(xué)所。

          另外一個(gè)趨勢(shì)就是麥克風(fēng)陣列的小型化,麥克風(fēng)陣列受制于半波長(zhǎng)理論的限制,現(xiàn)在的口徑還是較大,聲智科技現(xiàn)在可以做到2cm-8cm的間距,但是結(jié)構(gòu)布局仍然還是限制了ID設(shè)計(jì)的自由性。很多產(chǎn)品采用2個(gè)麥克風(fēng)其實(shí)并非成本問題,而是ID設(shè)計(jì)的考慮。實(shí)際上,借鑒雷達(dá)領(lǐng)域的合成孔徑方法,麥克風(fēng)陣列可以做的更小,而且這種方法已經(jīng)在軍工領(lǐng)域成熟驗(yàn)證,移植到消費(fèi)領(lǐng)域只是時(shí)間問題。

          還有一個(gè)趨勢(shì)是麥克風(fēng)陣列的低成本化,當(dāng)前無論是2個(gè)麥克風(fēng)還是4、6個(gè)麥克風(fēng)陣列,成本都是比較高的,這影響了麥克風(fēng)陣列的普及。低成本化不是簡(jiǎn)單的更換芯片器件,而是整個(gè)結(jié)構(gòu)的重新設(shè)計(jì),包括器件、芯片、算法和云端。這里要強(qiáng)調(diào)一下,并非2個(gè)麥克風(fēng)的陣列成本就便宜,實(shí)際上2個(gè)和4個(gè)麥克風(fēng)陣列的相差不大,2個(gè)麥克風(fēng)陣列的成本也要在60元左右,但是這還不包含進(jìn)行回聲抵消的硬件成本,若綜合比較,實(shí)際上成本相差不大。特別是今年由于新技術(shù)的應(yīng)用,多麥克風(fēng)陣列


          上一頁 1 2 下一頁

          評(píng)論


          相關(guān)推薦

          技術(shù)專區(qū)

          關(guān)閉
          看屁屁www成人影院,亚洲人妻成人图片,亚洲精品成人午夜在线,日韩在线 欧美成人 (function(){ var bp = document.createElement('script'); var curProtocol = window.location.protocol.split(':')[0]; if (curProtocol === 'https') { bp.src = 'https://zz.bdstatic.com/linksubmit/push.js'; } else { bp.src = 'http://push.zhanzhang.baidu.com/push.js'; } var s = document.getElementsByTagName("script")[0]; s.parentNode.insertBefore(bp, s); })();