<meter id="pryje"><nav id="pryje"><delect id="pryje"></delect></nav></meter>

<label id="pryje"></label>

新聞中心

EEPW首頁 > 嵌入式系統(tǒng) > 設計應用 > 麥克風陣列技術(shù)語音交互應該選用怎樣的方案？

麥克風陣列技術(shù)語音交互應該選用怎樣的方案？

作者：時間：2018-07-25 來源：網(wǎng)絡

加入技術(shù)交流群
- 掃碼加入
  和技術(shù)大咖面對面交流
  海量資料庫查詢

收藏

亞馬遜Echo和谷歌Home爭奇斗艷，除了云端服務，他們在硬件上到底有哪些差異?我們先將Echo和Home兩款音箱拆開來看，區(qū)別最大的還是麥克風陣列技術(shù)。Amazon Echo采用的是環(huán)形6+1麥克風陣列，而Google Home(包括Surface Studio)只采用了2麥克風陣列。這里想稍微深入談談麥克風陣列技術(shù)，以及智能語音交互設備到底應該選用怎樣的方案。

本文引用地址：http://www.ex-cimer.com/article/201807/383792.htm

什么是麥克風陣列技術(shù)?

學術(shù)上有個概念是“傳聲器陣列”，主要由一定數(shù)目的聲學傳感器組成，用來對聲場的空間特性進行采樣并處理的系統(tǒng)。而這篇文章講到的麥克風陣列是其中一個狹義概念，特指應用于語音處理的按一定規(guī)則排列的多個麥克風系統(tǒng)，也可以簡單理解為2個以上麥克風組成的錄音系統(tǒng)。

麥克風陣列一般來說有線形、環(huán)形和球形之分，嚴謹?shù)膽撜f成一字、十字、平面、螺旋、球形及無規(guī)則陣列等。至于麥克風陣列的陣元數(shù)量，也就是麥克風數(shù)量，可以從2個到上千個不等。這樣說來，麥克風陣列真的好復雜，別擔心，復雜的麥克風陣列主要應用于工業(yè)和國防領域，消費領域考慮到成本會簡化很多。

為什么需要麥克風陣列?

消費級麥克風陣列的興起得益于語音交互的市場火熱，主要解決遠距離語音識別的問題，以保證真實場景下的語音識別率。這涉及了語音交互用戶場景的變化，當用戶從手機切換到類似Echo智能音箱或者機器人的時候，實際上麥克風面臨的環(huán)境就完全變了，這就如同兩個人竊竊私語和大聲嘶喊的區(qū)別。

前幾年，語音交互應用最為普遍的就是以Siri為代表的智能手機，這個場景一般都是采用單麥克風系統(tǒng)。單麥克風系統(tǒng)可以在低噪聲、無混響、距離聲源很近的情況下獲得符合語音識別需求的聲音信號。但是，若聲源距離麥克風距離較遠，并且真實環(huán)境存在大量的噪聲、多徑反射和混響，導致拾取信號的質(zhì)量下降，這會嚴重影響語音識別率。而且，單麥克風接收的信號，是由多個聲源和環(huán)境噪聲疊加的，很難實現(xiàn)各個聲源的分離。這樣就無法實現(xiàn)聲源定位和分離，這很重要，因為還有一類聲音的疊加并非噪聲，但是在語音識別中也要抑制，就是人聲的干擾，語音識別顯然不能同時識別兩個以上的聲音。

顯然，當語音交互的場景過渡到以Echo、機器人或者汽車為主要場景的時候，單麥克風的局限就凸顯出來。為了解決單麥克風的這些局限性，利用麥克風陣列進行語音處理的方法應時而生。麥克風陣列由一組按一定幾何結(jié)構(gòu)(常用線形、環(huán)形)擺放的麥克風組成，對采集的不同空間方向的聲音信號進行空時處理，實現(xiàn)噪聲抑制、混響去除、人聲干擾抑制、聲源測向、聲源跟蹤、陣列增益等功能，進而提高語音信號處理質(zhì)量，以提高真實環(huán)境下的語音識別率。

事實上，僅靠麥克風陣列也很難保證語音識別率的指標。麥克風陣列還僅是物理入口，只是完成了物理世界的聲音信號處理，得到了語音識別想要的聲音，但是語音識別率卻是在云端測試得到的結(jié)果，因此這兩個系統(tǒng)必須匹配在一起才能得到最好的效果。不僅如此，麥克風陣列處理信號的質(zhì)量還無法定義標準。因為當前的語音識別基本都是深度學習訓練的結(jié)果，而深度學習有個局限就是嚴重依賴于輸入訓練的樣本庫，若處理后的聲音與樣本庫不匹配則識別效果也不會太好。從這個角度應該非常容易理解，物理世界的信號處理也并非越是純凈越好，而是越接近于訓練樣本庫的特征越好，即便這個樣本庫的訓練信號很差。顯然，這是一個非常難于實現(xiàn)的過程，至少要聲學處理和深度學習的兩個團隊配合才能做好這個事情，另外聲學信號處理這個層次輸出的信號特征對語義理解也非常重要?？磥恚⌒〉柠溈孙L陣列還真的不是那么簡單，為了更好地顯示這種差別，我們測試了某語音識別引擎在單麥克風和四麥克風環(huán)形陣列的識別率對比。另外也要提醒，語音識別率并非只有一個WER指標，還有個重要的虛警率指標，稍微有點聲音就亂識別也不行，另外還要考慮閾值的影響，這都是麥克風陣列技術(shù)中的陷阱。

麥克風陣列的關鍵技術(shù)

消費級的麥克風陣列主要面臨環(huán)境噪聲、房間混響、人聲疊加、模型噪聲、陣列結(jié)構(gòu)等問題，若使用到語音識別場景，還要考慮針對語音識別的優(yōu)化和匹配等問題。為了解決上述問題，特別是在消費領域的垂直場景應用環(huán)境中，關鍵技術(shù)就顯得尤為重要。

噪聲抑制：語音識別倒不需要完全去除噪聲，相對來說通話系統(tǒng)中需要的技術(shù)則是噪聲去除。這里說的噪聲一般指環(huán)境噪聲，比如空調(diào)噪聲，這類噪聲通常不具有空間指向性，能量也不是特別大，不會掩蓋正常的語音，只是影響了語音的清晰度和可懂度。這種方法不適合強噪聲環(huán)境下的處理，但是應付日常場景的語音交互足夠了。

混響消除：混響在語音識別中是個蠻討厭的因素，混響去除的效果很大程度影響了語音識別的效果。我們知道，當聲源停止發(fā)聲后，聲波在房間內(nèi)要經(jīng)過多次反射和吸收，似乎若干個聲波混合持續(xù)一段時間，這種現(xiàn)象叫做混響?；祉憰乐赜绊懻Z音信號處理，比如互相關函數(shù)或者波束主瓣，降低測向精度。

回聲抵消：嚴格來說，這里不應該叫回聲，應該叫“自噪聲”?；芈暿腔祉懙难由旄拍?，這兩者的區(qū)別就是回聲的時延更長。一般來說，超過100毫秒時延的混響，人類能夠明顯區(qū)分出，似乎一個聲音同時出現(xiàn)了兩次，我們就叫做回聲，比如天壇著名的回聲壁。實際上，這里所指的是語音交互設備自己發(fā)出的聲音，比如Echo音箱，當播放歌曲的時候若叫Alexa，這時候麥克風陣列實際上采集了正在播放的音樂和用戶所叫的Alexa聲音，顯然語音識別無法識別這兩類聲音?；芈暤窒褪且サ羝渲械囊魳沸畔⒍槐Ａ粲脩舻娜寺?，之所以叫回聲抵消，只是延續(xù)大家的習慣而已，其實是不恰當?shù)摹?

上一頁 1 2 下一頁

<a target='_blank'><img src='https://ad.eepw.com.cn/www/delivery/avw.php?zoneid=114&cb=INSERT_RANDOM_NUMBER_HERE&n=a7a83b30' border='0' alt='' /></a>
<a target='_blank'><img src='https://ad.eepw.com.cn/www/delivery/avw.php?zoneid=115&cb=INSERT_RANDOM_NUMBER_HERE&n=a3d98779' border='0' alt='' /></a>
<a target='_blank'><img src='https://ad.eepw.com.cn/www/delivery/avw.php?zoneid=116&cb=INSERT_RANDOM_NUMBER_HERE&n=abca108c' border='0' alt='' /></a>
<a target='_blank'><img src='https://ad.eepw.com.cn/www/delivery/avw.php?zoneid=117&cb=INSERT_RANDOM_NUMBER_HERE&n=a1775170' border='0' alt='' /></a>
<a target='_blank'><img src='https://ad.eepw.com.cn/www/delivery/avw.php?zoneid=118&cb=INSERT_RANDOM_NUMBER_HERE&n=a449048b' border='0' alt='' /></a>

關鍵詞： 麥克風 陣列技術(shù) 語音交互

評論

相關推薦

最近想做一微型麥克風電路

jackwang | 2006-09-17

解決方案-一種面向語音交互應用的雙屏分體電視系統(tǒng)方案

視頻語音交互，電視，解決方案，設計應用，雙屏分體電視系統(tǒng) | 2024-05-24

基于三重采樣Δ-Σ ADC的數(shù)字電容式MEMS麥克風，可有效提高信噪比

元件/連接器 MEMS 麥克風 | 2022-11-03

$GRAS推出全新?\$

GRAS推出全新?\"、多場景、高靈敏度麥克風-46BC

消費電子 GRAS 麥克風 | 2023-04-27

生成式人工智能音頻快速發(fā)展：高信噪比MEMS麥克風功不可沒

消費電子 NLP STT SNR MEMS 麥克風 | 2024-06-21

利用MEMS麥克風改善移動設備聲學性能

資源下載 MEMS 麥克風聲學性能 | 2007-10-17

INA217構(gòu)成的專業(yè)級微型話筒(麥克風)前置放大典型電路圖

設計方案 INA217 構(gòu)成專業(yè) 微型話筒麥克風前置放大典 | 2009-08-06

樓氏聲學啟用蘇州制造廠，MEMS麥克風已開始出貨

jisedse | 2006-01-10

基于麥克風陣列的語音增強和定位系統(tǒng)電路圖

設計方案基于麥克風陣列語音增強定位系統(tǒng) 電路圖 | 2010-01-27

外包一個電容式麥克風放大電路，高手請進?。?

jackwang | 2006-09-17

基礎知識之麥克風

元件/連接器麥克風 | 2024-03-27

萊維特全新發(fā)布PURE TUBE高端電子管麥克風

物聯(lián)網(wǎng)與傳感器萊維特 PURE TUBE 高端電子管麥克風 | 2023-06-02

PCB拼板規(guī)范、標準

資源下載 PCB拼板 I/O接口麥克風電池接口微動開關耳機接口馬達 | 2007-05-29

計算機麥克風電路圖

設計方案計算機麥克風電路圖 | 2009-07-06

高信噪比麥克風正在將筆記本電腦變成全方位通信中心

消費電子英飛凌.麥克風 | 2023-05-08

MEMS麥克風可增強音頻系統(tǒng)的質(zhì)量和可靠性

資源下載 ADI 麥克風 MEMS | 2011-11-30

手持應用推動，MEMS麥克風和揚聲器市場繁榮

liuysd | 2005-11-24

一種基于語音交互應用的全時AI電視系統(tǒng)設計方案

消費電子語音交互全時AI 電視 202201 | 2022-01-24

廣義旁瓣對消語音處理系統(tǒng)的設計與實現(xiàn)

資源下載麥克風濾波器 | 2012-02-10

關于立體聲麥克風前置放大器

jackwang | 2006-09-17

GRAS進一步推動生產(chǎn)線測試麥克風的發(fā)展

測試測量 GRAS 生產(chǎn)線麥克風 | 2023-10-18

一種面向語音交互應用的雙屏分體電視系統(tǒng)方案

語音交互雙屏分體超高清電視 202203 | 2022-04-11

英飛凌推出新一代高性能 XENSIV? MEMS 麥克風，為消費電子產(chǎn)品帶來出色的音頻捕捉能力

消費電子麥克風音頻 | 2022-06-07

基于話筒屏蔽的測試

資源下載 Logitech 麥克風屏蔽 VIRTINS | 2009-03-07

由INA217構(gòu)成的專業(yè)級微型話筒(麥克風)前置放大典型電路

設計方案 INA217 構(gòu)成專業(yè) 微型話筒麥克風前置放大典 | 2009-07-06

麥克風輸入電路

設計方案麥克風輸入 | 2009-07-06

焦點

推薦視頻

技術(shù)專區(qū)

關閉

看屁屁www成人影院,亚洲人妻成人图片,亚洲精品成人午夜在线,日韩在线欧美成人 (function(){ var bp = document.createElement('script'); var curProtocol = window.location.protocol.split(':')[0]; if (curProtocol === 'https') { bp.src = 'https://zz.bdstatic.com/linksubmit/push.js'; } else { bp.src = 'http://push.zhanzhang.baidu.com/push.js'; } var s = document.getElementsByTagName("script")[0]; s.parentNode.insertBefore(bp, s); })();