利用麥克風(fēng)數(shù)組抑制背景噪聲
第二部分
麥克風(fēng)數(shù)組的解決方案
根據(jù)選用的方法,麥克風(fēng)數(shù)組解決方案可以成為抑制穩(wěn)態(tài)及非穩(wěn)態(tài)噪聲的一項(xiàng)非常高效的技術(shù)。
配合適當(dāng)?shù)乃惴?,?shù)組中的個(gè)別麥克風(fēng)信號(hào)經(jīng)過濾波后再組合,以便達(dá)到波束成形或空間濾波的效果,進(jìn)而產(chǎn)生一個(gè)復(fù)雜的麥克風(fēng)數(shù)組極性響應(yīng)模式,能夠指向或遠(yuǎn)離某個(gè)聲音位置。因此,可以將某個(gè)位置的聲音隔離或加強(qiáng),又或可將其抑制或拒絕。同樣地,麥克風(fēng)聲道中的信號(hào)相關(guān)性可找出主要信號(hào)的方向及其正確位置。
視乎數(shù)組的復(fù)雜度及應(yīng)用,該數(shù)組可經(jīng)由一個(gè)配備了數(shù)字信號(hào)處理器的模擬電路,再加上適當(dāng)?shù)挠?jì)算機(jī)軟件和一系列方法去控制。
波束成形
波束成形分為兩種技術(shù):自適應(yīng)及定向。
在自適應(yīng)波束成形技術(shù)中,可通過數(shù)據(jù)相關(guān)濾波及改變對數(shù)據(jù)的時(shí)間響應(yīng)去調(diào)節(jié)波束的方向,在自適應(yīng)波束成形方面已有幾種方法被開發(fā)出來。雖然在信號(hào)的處理上比較繁復(fù),但好處是設(shè)計(jì)靈活度更高,包括麥克風(fēng)的數(shù)量、類型及間隔距離。自適應(yīng)波束成形一般需要數(shù)字信號(hào)處理器或計(jì)算機(jī)軟件來實(shí)現(xiàn)。
至于定向波束成形方面,波束的行走方向會(huì)按照相關(guān)聲源的方位而優(yōu)化,并且同時(shí)排除來自其它方向的噪聲。一般來說,排列緊密兼具備固有方向性的差分式麥克風(fēng)端射數(shù)組都是依靠固定時(shí)間延遲或其它方法來改變波束的方向。對于這類應(yīng)用,任何濾波及信號(hào)處理的方法均須對特別的機(jī)械設(shè)計(jì)加以優(yōu)化。定向波束成形一般需要模擬電路、數(shù)字信號(hào)處理器或計(jì)算機(jī)軟件來實(shí)現(xiàn)。
對于語音應(yīng)用來說,采用定向波束成形解決方案會(huì)比較好,尤其當(dāng)應(yīng)用牽涉到語音辨識(shí)。假如以模擬電路來實(shí)現(xiàn),它們便應(yīng)該:
● 對噪聲輸入有實(shí)時(shí)的響應(yīng)
● 容易實(shí)現(xiàn)而且無需開發(fā)任何的算法程序
● 為抑制穩(wěn)態(tài)及非穩(wěn)態(tài)噪聲提供一個(gè)可接受的信/噪比改進(jìn)(SNRI)值
● 在無語音時(shí)表現(xiàn)極低的失真,并且可改善語音質(zhì)量測試(ITU-T P.835)的整體平均意見分?jǐn)?shù)(mean opinion score)
● 運(yùn)算復(fù)雜度低并具備低信號(hào)延遲
● 功耗比其它解決方案小
與定向方案比較,采用數(shù)字信號(hào)處理器或軟件實(shí)現(xiàn)的自適應(yīng)波束成形的缺點(diǎn)為:
● 當(dāng)實(shí)施及調(diào)節(jié)抑制算法時(shí),需要時(shí)間去重復(fù)辨識(shí)及收斂噪聲
● 雖然可提供較佳的SNRI值,但通常也會(huì)為語音輸出信號(hào)帶來較多的問題,包括因噪聲收斂時(shí)間所引起的延遲、卡嗒聲和砰啪聲、非意愿靜音、頻率失真、回聲或與子頻帶頻率信號(hào)處理方法有關(guān)的不定期信號(hào)級(jí)變化
● 由于需要另行開發(fā)演算程序,因此在實(shí)現(xiàn)上比較困難
● 需要更大的功耗
所有波束成形解決方案都是采用很小的數(shù)組,它們對誤差都非常敏感,包括由麥克風(fēng)增益與相位失配所引起的誤差,以及由于音頻信號(hào)路徑嵌入于產(chǎn)品內(nèi)而非設(shè)于大氣中所導(dǎo)致的路徑偏差。因此,波束解決方案必須具備某種形式的補(bǔ)償,而這種補(bǔ)償可以設(shè)于波束成形系統(tǒng)之內(nèi),又或是在系統(tǒng)之外加設(shè)適合的麥克風(fēng)和音頻信號(hào)路徑。
麥克風(fēng)間隔
奈奎斯特空間采樣率為相關(guān)最高頻率的二分之一個(gè)波長(d=λ/2)。為了從空間取得相關(guān)頻率的一個(gè)波長樣品,兩個(gè)傳感器(即麥克風(fēng))必須相隔二分之一個(gè)波長。
然而,當(dāng)傳感器的間隔少于二分之一個(gè)波長時(shí)(d 1/2λ),過采樣便會(huì)發(fā)生,使波長被采樣超過兩次。相反地,如距離大于二分之一個(gè)波長(d > 1/2λ),空間性欠采樣便會(huì)發(fā)生,這時(shí)第一個(gè)傳感器在完成一個(gè)波長的采樣后,會(huì)在第二個(gè)傳感器進(jìn)行采樣之前再重新啟動(dòng)。空間性欠采樣可將較高頻的信號(hào)混迭到相關(guān)的頻帶,導(dǎo)致結(jié)果出現(xiàn)混亂。為了防止出現(xiàn)假頻,采樣器的頻寬必須限制在最高相關(guān)頻率以上。
不少研究指出假如能夠盡量縮少傳感器之間的距離便可打造出高效的麥克風(fēng)數(shù)組,距離可以比奈奎斯特速率的最低要求小很多。現(xiàn)再舉一個(gè)例子,其中傳感器的間隔為相關(guān)聲波的八分之一個(gè)波長。
在一個(gè)純語音系統(tǒng)中,頻率范圍為300Hz 到 3500Hz,而最大聲音能量可出現(xiàn)在500Hz 到 2500Hz之間。在此條件下,λ/8的間隔在3500Hz下為1.18公分,而于2500Hz下為1.65公分。
由于波長增加,在3500Hz 及2500Hz頻率以下的音頻信號(hào)仍然會(huì)被過采樣,因此1.18公分或1.65公分的間隔能有效地取得更多的信號(hào)樣品。
另一個(gè)計(jì)算方法將間隔定為兩公分,如此當(dāng)頻率為2500Hz時(shí),波長的間隔(λ)/(c/df)便為:
λ/(331.1/0.02*2500)=λ/6.62
假如空間采樣率在最高相關(guān)頻率下仍然低于λ/2,則需要調(diào)節(jié)麥克風(fēng)的間隔以滿足產(chǎn)品的應(yīng)用要求。但隨著間隔越來越擠(空間采樣率越來越高),麥克風(fēng)數(shù)組中的遠(yuǎn)場信號(hào)之間的相干性變大,使得數(shù)組在各頻率下均可發(fā)揮更佳的整體背景噪聲抑制效能。相反地,假如間隔變得較寬闊,數(shù)組的整體抑制能力便會(huì)下降,變得難以對較低頻信號(hào)作出反應(yīng)。
一旦決定了傳感器的間隔,便可對應(yīng)頻率的需求將數(shù)組優(yōu)化。假如采用的是定向波束成形方案,數(shù)組的響應(yīng)模式也需同時(shí)被固定。
不論是任何的產(chǎn)品,在設(shè)計(jì)的過程中必須要作出一些折衷決定,包括在操作頻率范圍與所需噪聲抑制級(jí)之間、理論與實(shí)際麥克風(fēng)間隔之間、以及整體的數(shù)組系統(tǒng)成本和復(fù)雜性之間等。
麥克風(fēng)數(shù)組解決方案的例子
以下采用美國國家半導(dǎo)體的遠(yuǎn)場抑制麥克風(fēng)數(shù)組放大器LMV1088作為麥克風(fēng)數(shù)組解決方案的一個(gè)例子,它可為語音應(yīng)用提供高至20 dB的背景噪聲抑制。LMV1088是一個(gè)模擬定向波束成形解決方案,適用于采用全指向性麥克風(fēng)的差分式雙麥克風(fēng)端射數(shù)組。
圖中兩個(gè)麥克風(fēng)分別位于兩條相距約1.5公分至2.5公分的線上,或保持等同的聲波路徑距離。說話者與手機(jī)或耳機(jī)的麥克風(fēng)距離最好保持2公分至10公分,通過使用圖1和圖2便可計(jì)算出語音信號(hào)隨距離變化的損耗。
LMV1088不僅可為兩條聲道上的聲音、麥克風(fēng)和放大器信號(hào)路徑之間的差別提供初始性補(bǔ)償,并且可執(zhí)行修正濾波令語音輸出更加自然,還可提供頻寬限制濾波功能。
由于內(nèi)部放大器增益可通過I2C指令調(diào)節(jié),因此可使用不同靈敏度的麥克風(fēng),并促使LMV1088的輸出信號(hào)級(jí)能配合模擬輸入信道信號(hào)的要求,以針對各式各樣的通信處理器及設(shè)備。
評(píng)論