利用MEMS麥克風(fēng)陣列定位并識(shí)別音頻或語音信源的技
麥克風(fēng)陣列通過RJ45以太風(fēng)接口或USB OTG FS接口連接其它器件,與其它器件交互是通過可控制基本板設(shè)置的DIP開關(guān)實(shí)現(xiàn)。
如下圖所示,每個(gè)MEMS麥克風(fēng)都是由同一個(gè)時(shí)鐘源觸發(fā),時(shí)鐘源由專用振蕩器驅(qū)動(dòng),對(duì)每個(gè)GPIO端口的一個(gè)引腳輸出1位PDM 高頻信號(hào)。輸出PDM數(shù)據(jù)頻率與輸入時(shí)鐘同步,因此,DMA控制器以同一頻率即音頻捕捉頻率對(duì)GPIO端口進(jìn)行讀操作,然后將1 ms音頻數(shù)據(jù)(每次)保存在存儲(chǔ)器緩沖電路。這時(shí),該緩沖器包含麥克風(fēng)交叉信號(hào),然后軟件利用優(yōu)化的快速解碼函數(shù)對(duì)數(shù)據(jù)進(jìn)行解復(fù)用處理。最后,PDM 數(shù)據(jù)通過數(shù)字信號(hào)處理環(huán)節(jié),再進(jìn)行PDM轉(zhuǎn)PCM處理。
圖 5.每個(gè)MEMS麥克風(fēng)都是由同一個(gè)時(shí)鐘源觸發(fā),時(shí)鐘源由專用振蕩器驅(qū)動(dòng),對(duì)每個(gè)GPIO端口的一個(gè)引腳輸出1位PDM 高頻信號(hào)
麥克風(fēng)傳來的PDM信號(hào)經(jīng)過過濾和十分之一降采樣率處理,以取得所需頻率和分辨率的信號(hào)。麥克風(fēng)輸出的PDM數(shù)據(jù)頻率(麥克風(fēng)的輸入時(shí)鐘)必須是系統(tǒng)最終音頻輸出的倍數(shù),濾波器管道輸出是一個(gè)16位值,我們將 [-32768, 32767]視為一個(gè)單位增益(0 dB)的輸出范圍。
原先濾波管道產(chǎn)生的數(shù)字音頻信號(hào)在信號(hào)調(diào)理前被進(jìn)一步處理。管道第一級(jí)是一個(gè)高通濾波器,主要用于除掉信號(hào)DC失調(diào)。為保護(hù)信號(hào)質(zhì)量,該濾波級(jí)是使用一個(gè)截止頻率不在可聽頻率范圍內(nèi)的 IIR濾波器,管道第二級(jí)是一個(gè)基于IIR濾波器的低通濾波器。兩個(gè)濾波器有啟用和禁用以及配置功能;可通過外部整數(shù)變量控制增益。
如上文所述,數(shù)據(jù)采集有兩個(gè)比特流解決方案,通過DP開關(guān)選擇使用哪一個(gè)方案。當(dāng)選用 USB且在主機(jī)USB插入麥克風(fēng)陣列時(shí),主機(jī)將STM32_MEMS_Microphones視為一個(gè)標(biāo)準(zhǔn)的USB音頻設(shè)備。因此,主機(jī)系統(tǒng)無需安裝驅(qū)動(dòng)軟件。例如, STM32_MEMS_Microphones可直接連接第三方PC音頻采集軟件。當(dāng)選用以太網(wǎng)時(shí),STM32_MEMS_Microphones發(fā)送 RTP數(shù)據(jù)包。在網(wǎng)絡(luò)服務(wù)器的以太網(wǎng)設(shè)置頁對(duì)目的地IP、設(shè)備單播地址和采集參數(shù)進(jìn)行配置。
4.結(jié)論
音源定位識(shí)別是語音識(shí)別技術(shù)中的一個(gè)重要的語音預(yù)處理環(huán)節(jié),對(duì)提高音頻應(yīng)用和聲控應(yīng)用性能具有重要意義。音源定位主要用于自動(dòng)語音識(shí)別、音頻模式識(shí)別、說話人發(fā)現(xiàn)及識(shí)別。MEMS技術(shù)的問世讓麥克風(fēng)陣列能夠嵌入在上述應(yīng)用設(shè)計(jì)中,執(zhí)行音頻信號(hào)預(yù)處理過程,為應(yīng)用級(jí)提供最好的信息。
該嵌入式單個(gè)說話人及其語音定位識(shí)別方案基于一個(gè)集成ARM處理器和一組MEMS麥克風(fēng)的原型板。初步測(cè)試結(jié)果證明了這一集成方案的可行性,且系統(tǒng)級(jí)模塊可以做語音、音頻識(shí)別目標(biāo)板,滿足人機(jī)、人與周圍環(huán)境的自然用戶界面的功能要求。
評(píng)論