利用麥克風數組抑制背景噪聲
當距離“x” 增加一倍時,兩條曲線的SPL均下降6dB 。圖1距離聲源200公分,而圖2則是距離聲源50公分的局部放大圖,從圖中可見聲音壓力會因與聲源距離的增加而急速下降,即使距離很短的情況下也一樣。例如,當與聲源的距離為10公分時,SPL便減少了20 dB,即由96dB下降到約76dB。
近場對遠場聲音
聲源的近場是指該位置處于相關最低頻信號的一個波長范圍之內。假設相關語音的最低頻為300Hz,如此波長λ便等于c/f 或 331.1/300 ,又或是 1.104 米,其中c代表聲波于零度攝氏下的水平速度。當頻率為3500Hz時,λ便等于c/f或 331.1/3500,又或是 0.0946米 (9.46公分)。因此,語音信號的典型近場范圍即由聲源距離約9.5公分到1.1米。
超過1米的距離,語音信號便會被考慮成語音聲源的遠場。對于麥克風間隔較近的數組,近場聲源會呈現出一個圓球狀的波陣面,并擁有很強的信號振幅、壓力梯度,以及對應數組中各麥克風與聲源之間的距離而出現的頻率相關差別。
現在假設兩個麥克風的間隔距離為3公分,而最接近聲源的一個麥克風,其與聲源的距離為5公分。圖2表示出第一個麥克風(即最接近聲源的一個),其感受到一個SPL為82dB的音頻信號,而第二個麥克風(即與聲源相距8公分)所感受到的信號為78dB SPL。即使兩者間只有4 dB的差別,但相對于整體的信號級,這差別仍相當大。
從頻譜含量的角度看,麥克風數組內的所有近場語音信號均關系密切。與最接近聲源的麥克風比較,與聲源距離最遠的麥克風信號的振幅將會減少,并且會出現信號由最近麥克風傳送到最遠麥克風的時間延遲。然而,要恢復該個案中的語音信號并不困難。
在麥克風數組語音近場范圍以外的聲源將被看作是遠場聲源,并對數組中排列緊密的麥克風展現出實質平面的波陣面。數組中每一個麥克風均感受到幾乎一樣的聲波能量及隨機相位信號,但該些信號并沒有對應關系,除非麥克風之間的距離非常接近。假如這些信號與麥克風的距離較遠,那麥克風的絕對SPL值便會進一步下降。
現舉出另一個例子,假若將相同的麥克風數組放置到與聲源距離150公分(即1.5米)的位置,最近聲源的麥克風的SPL值便會下降到52.5 dB,而距離聲源153公分的最遠麥克風的SPL值則稍微下降到52.3dB。雖然兩者僅有0.2dB的差距,但從聲源到最近麥克風的整體信號級將出現30dB的下降。
麥克風輸出之間的不同信號,在進行了適當的處理及濾波后,可將遠場噪聲消除,使兩個麥克風的復合輸出及處理電路能提供高清晰度的語音信號。
聲音噪聲的特質
這里的噪聲場可分為三種,分別是相干噪聲、非相干噪聲及擴散噪聲。
相干噪聲是指當聲波傳到麥克風時,在該過程中沒有因環(huán)境中的障礙物而出現任何形式的反射、散射或衰減。
非相干噪聲是指某一位置的噪聲與其它位置的噪聲沒有任何關系,并且被看成空間白噪音。
擴散噪聲是指擁有相同能量的噪聲同時軸射到所有方向。例子包括辦公室內的噪音、機場候機樓及交通噪音等,換句話說就是指所有充滿噪音的環(huán)境。
這里所指的聲音噪聲有兩種,分別是穩(wěn)態(tài)噪聲及非穩(wěn)態(tài)噪聲。
穩(wěn)態(tài)噪聲是指噪聲的能量相對地穩(wěn)定,并具備已知及變化緩慢的頻譜含量,并且是可預知的。例子包括由引擎發(fā)出的噪音、空調風扇、隨機或 “白” 噪音等等。噪聲抑制算法能有效抑制這類噪音。
非穩(wěn)態(tài)噪聲是指音量及聲音內容會在短時間內變化,例如高聲說話或叫喊、汽車經過的聲音或拍手等,其發(fā)生是不可預知的。假若出現這類噪音,它們可能在被辨識及抑制前便會自動地消失掉,非穩(wěn)態(tài)噪聲一般都包含在穩(wěn)態(tài)噪聲之內。
最麻煩的情況是當噪聲源與語音信號擁有相同的出現時間、頻譜及相干特性,這種情況當背景噪聲屬于非穩(wěn)態(tài),且旁邊有其它人說話時便會出現,如在餐館和酒吧,車站及派對上等。
評論