語音處理系統(tǒng)中的周期性沖激噪聲及其消除
人們對(duì)噪聲已經(jīng)作了深入研究[1].一般應(yīng)用較為廣泛的抗噪措施包括:互補(bǔ)式動(dòng)態(tài)壓括降噪、非互補(bǔ)式動(dòng)態(tài)壓括降噪、濾波降噪、電源處理降噪、軟件處理降噪等.對(duì)語音處理系統(tǒng)而言,不是所有的降噪系統(tǒng)在所有情況下效果都良好,例如,有些全聲頻段的降噪系統(tǒng)(杜比C就是其中的一種),反而對(duì)低頻段的噪聲消除很不得力.因此,我們應(yīng)針對(duì)語音處理系統(tǒng)的具體情況,有的放矢地進(jìn)行噪聲分析以找出消除方法.
系統(tǒng)噪聲消除,首要問題在于找出存在的或隱含潛在的主要噪聲源,然后設(shè)法消除該噪聲源,這是治本的方法.對(duì)于噪聲來源不很明確或不好解決的情況,則應(yīng)分析噪聲特性,采用相應(yīng)措施降低噪聲,提高系統(tǒng)最終信噪比,這是治標(biāo)的方法.
目前的語音處理系統(tǒng)一般應(yīng)用微處理器處理語音數(shù)據(jù),其基本構(gòu)造如圖1所示.系統(tǒng)包含兩個(gè)模塊:模擬模塊和數(shù)字模塊.這種結(jié)構(gòu)使帶微處理器的語音系統(tǒng)的噪聲問題具有一定的特殊性.事實(shí)上,數(shù)字模塊工作所引發(fā)的周期性沖激噪聲,是語音系統(tǒng)噪聲的一個(gè)重要來源.
克服這種周期性沖激噪聲可以在不同層次上采取措施.該噪聲是以電源通道為傳播途徑的,對(duì)電源的處理應(yīng)放在首要位置,這就是前面所說的“治本”;而“治標(biāo)”也不能忽視,因?yàn)殡娫匆话悴⒉豢赡芴幚淼帽M善盡美.為減小已經(jīng)混入了待處理語音數(shù)據(jù)中的沖激噪聲的影響,可以采用數(shù)字中值濾波或LOR濾波.在信號(hào)最終的輸出端,采用模擬的窄帶濾波降噪以及動(dòng)態(tài)降噪,可以收到很好的效果.
下面通過對(duì)一種具體語音處理系統(tǒng)樣機(jī)的實(shí)驗(yàn)和理論分析,討論這一具有普遍意義的問題.
1 帶微處理器語音系統(tǒng)的沖激噪聲
帶微處理器的語音系統(tǒng)的噪聲源中,周期性沖激噪聲是具有共性的一項(xiàng).沖激噪聲來自兩方面,其一為TTL邏輯電路引發(fā)的小浪涌沖激電流,其二為微處理器數(shù)據(jù)傳輸?shù)拇罄擞繘_激電流.
1.1 TTL邏輯電路引發(fā)的小浪涌噪聲分析
一般的數(shù)字系統(tǒng),主要由TTL邏輯電路構(gòu)成.在TTL電路中,局部電流狀態(tài)取決于器件的邏輯狀態(tài)、外接負(fù)載電阻電容以及輸出瞬時(shí)導(dǎo)通等因素.圖2給出了TTL電路輸出結(jié)構(gòu)和瞬態(tài)電流產(chǎn)生示意圖,其中,Vcc為電路電壓,Vo為輸出電壓,Icc為電源供給該局部電路的電流,I為該局部電路輸出(輸入)電流.注意到,輸出電壓從低電平到高電平轉(zhuǎn)換時(shí)將產(chǎn)生較大的瞬態(tài)電流值,圖2a就是這種情況;特別地,高速TTL電路的浪涌電流因其持續(xù)時(shí)間較短而具有更大值.大多數(shù)情況下,負(fù)載電容充放電引起的浪涌電流比其他因素產(chǎn)生的浪涌電流對(duì)電源的影響大得多.因此,對(duì)設(shè)計(jì)者而言,主要應(yīng)控制負(fù)載電容,在電路布線時(shí)應(yīng)盡量減少不必要的散雜電容.
當(dāng)然,由于大量TTL微電路一般并不可能恰好協(xié)調(diào)一致,從而導(dǎo)致局部浪涌電流匯聚為大的沖激電流,所以TTL邏輯電路引發(fā)的散布的小浪涌沖激電流的影響并不很大,可以通過加濾波電容的方法濾除(下面將具體描述).但是,這可以作為其他沖激電流的基礎(chǔ)原理模型.
1.2 微處理器數(shù)據(jù)傳輸引發(fā)的周期性沖激噪聲
該語音處理系統(tǒng)采用現(xiàn)代DSP芯片為微處理器,配備了SRAM為外置存儲(chǔ)器,系統(tǒng)帶A/D采集器,語音信號(hào)經(jīng)A/D之前先經(jīng)過預(yù)放大.系統(tǒng)的語音采樣頻率為標(biāo)準(zhǔn)的8kHz,采取兩種工作模式,一種是以語音信號(hào)單樣點(diǎn)為單位的樣點(diǎn)處理模式,另一種是以128個(gè)語音信號(hào)樣點(diǎn)(16ms語音)為一幀來傳輸處理語音的幀處理模式.
測(cè)量該語音系統(tǒng)的背景噪聲分布,如圖3所示.噪聲由兩部分組成,其一為常規(guī)的白噪聲,其二為明顯的周期性沖激噪聲.圖中,VIF為周期性沖激噪聲的峰峰值,VGF為背景高斯白噪聲的峰峰值,T為周期性沖激噪聲的周期.測(cè)量不同工作模式及系統(tǒng)不同位置處的噪聲峰峰值,如表1、表2所示.
表中,“+5V”表示所測(cè)量位置在各芯片的電壓引腳處,“A/D模擬輸入”表示所測(cè)量位置在模數(shù)轉(zhuǎn)換芯片的模擬信號(hào)輸入腳.
更加值得注意的是,系統(tǒng)不同處理模式下的周期性沖激噪聲的周期為:
樣點(diǎn)處理模式下,T=0.125ms (1)
幀處理模式下, T=16ms (2)
從以上實(shí)際測(cè)量的背景噪聲的波形及其數(shù)據(jù)中可知,本語音處理系統(tǒng)性能樣機(jī)中沖激噪聲起主要影響,且與系統(tǒng)數(shù)據(jù)傳輸關(guān)系極其密切.首先,系統(tǒng)工作在樣點(diǎn)處理模式下時(shí),微處理器的數(shù)據(jù)傳輸以語音信號(hào)單樣點(diǎn)為單位,因而沖激噪聲的周期為1/8000s=0.125ms;工作在幀處理模式下時(shí),數(shù)據(jù)傳輸以幀為單位,一幀含語音樣點(diǎn)128個(gè),因而沖激噪聲的周期為1/8000×128s=16ms.實(shí)際測(cè)量值就是所分析的數(shù)值.其次,觀察不同處理模式下VIF和VGF的大小,可以發(fā)現(xiàn),SRAM芯片處的背景噪聲(特別是沖激噪聲)的峰峰值最大.可以認(rèn)為,污染系統(tǒng)電源的沖激噪聲主要由數(shù)據(jù)出入頻繁的SRAM區(qū)傳出.第三,系統(tǒng)幀處理模式下的噪聲一般比樣點(diǎn)處理模式下的相應(yīng)位置處的噪聲小.其原因在分析TTL邏輯電路引發(fā)的小浪涌噪聲中已經(jīng)提及,即高速處理引發(fā)的浪涌電流因其持續(xù)時(shí)間較短而具有更大值.
所以,微處理器數(shù)據(jù)傳輸所引發(fā)的周期性沖激噪聲,是帶微處理器的語音系統(tǒng)不可忽視的重要噪聲來源.
2 周期性沖激噪聲的處理
從根本上,周期性沖激噪聲是數(shù)字模塊工作時(shí),所需功率的峰值,通過電源對(duì)模擬模塊產(chǎn)生了污染.因此,處理系統(tǒng)電源是解決問題的核心.另外,為減小沖激噪聲對(duì)語音數(shù)據(jù)的不利影響,軟件在處理含沖激噪聲的數(shù)據(jù)時(shí),可先行采取數(shù)字濾波措施.在語音系統(tǒng)最終輸出語音時(shí),還可以加上業(yè)已相當(dāng)成熟的模擬濾波降噪和動(dòng)態(tài)降噪手段.
2.1 系統(tǒng)電源處理
徹底解決周期性沖激噪聲的方法是采用獨(dú)立功能塊供電,將語音處理系統(tǒng)的數(shù)字模塊和模擬模塊分開供電,如圖4所示,以切斷數(shù)字模塊通過電源對(duì)模擬模塊的影響.
表1 樣點(diǎn)處理模式下系統(tǒng)背景噪聲的峰峰值
微處理器+5V | SRAM+5V | 預(yù)放大+5V | A/D模擬輸入 | |
VIF/mV VGF/mV | 200 100 | 360 200 | 220 140 | 150 100 |
光電耦合[3]的主要優(yōu)點(diǎn)是能有效地抑制尖峰噪聲干擾,從而使數(shù)據(jù)通道上的信噪比(噪聲為沖激噪聲)大大提高.光電耦合器的輸入阻抗很小,一般在100Ω至1kΩ之間,而干擾源內(nèi)阻很大,通常為105~108Ω,因而,能進(jìn)入光電耦合器輸入端的噪聲很小.而且,沖激噪聲雖有較大的電壓幅度,但能量小,僅能形成微弱電流,而光電耦合器輸入部分的發(fā)光二極管是在電流狀態(tài)下工作,即使電壓幅值的干擾很高,由于不能提供足夠的電流,沖激噪聲可被抑制.同時(shí),光電耦合器作為系統(tǒng)模擬模塊和數(shù)字模塊之間的隔離器件,其輸入是數(shù)字的比特流,并不影響系統(tǒng)原來的數(shù)據(jù)傳輸.
表2 幀處理模式下系統(tǒng)背景噪聲的峰峰值
微處理器+5V | SRAM+5V | 預(yù)放大+5V | A/D模擬輸入 | |
VIF/mV VGF/mV | 160 40 | 300 60 | 200 80 | 120 40 |
為提高數(shù)據(jù)傳輸速率的上限并確保信號(hào)的準(zhǔn)確性,可以采用高速光電耦合器[4],其數(shù)據(jù)傳輸速率可達(dá)1Mb/s,而超高速光電耦合器可以提供大于10Mb/s的數(shù)據(jù)傳輸速率.作為語音系統(tǒng)模擬模塊和數(shù)字模塊之間的橋梁,一般足夠了.
同時(shí),數(shù)字模塊自身應(yīng)盡可能抑制TTL浪涌電流和傳輸數(shù)據(jù)引發(fā)的沖激噪聲.設(shè)計(jì)系統(tǒng)時(shí),可以在器件的電源和地線間加入平滑電容.
為了濾除TTL電路工作引入的分布浪涌電流,可把數(shù)字模塊電源總線設(shè)計(jì)為一種帶分段電容濾波的饋電線,以提供各器件一條浪涌電流的低阻抗通路.為了有效地濾波和去耦,所接電容的容量必須能在瞬態(tài)電流的重復(fù)周期內(nèi)保證“展平”浪涌電流.通常使用圖6所示的配電和去耦的連接方法,即用低頻濾波電容C1和高頻濾波電容C2并聯(lián).低頻大容量電容C1可取為1~10μF.對(duì)高頻電容C2,在下述合理假設(shè)下[2]:
·浪涌電流強(qiáng)度ΔIcc=50mA(3)
·電源電壓允許脈動(dòng)幅度ΔV≤0.1V(4)
·浪涌電流持續(xù)時(shí)間Δt=20ns(5)
有:
即一般標(biāo)識(shí)的103電容.
對(duì)微處理器數(shù)據(jù)傳輸產(chǎn)生的沖激電流,采用的濾波電容容量應(yīng)該大些.根據(jù)表1和表2的數(shù)據(jù),取電壓脈動(dòng)幅度ΔV′=200mV,實(shí)測(cè)沖激噪聲持續(xù)時(shí)間Δt′=20μs,沖激電流強(qiáng)度仍取ΔI′cc=50mA,這時(shí),
取5μF左右的電容(如4.7μF)接在數(shù)據(jù)RAM芯片的電源線附近,對(duì)平滑沖激電流,有一定效果.
由此,得到系統(tǒng)布線設(shè)計(jì)時(shí)加入去耦電容的常規(guī)做法[3]:
a.電源輸入端跨接10~100μF的電解電容器;
b.原則上每個(gè)集成電路芯片,在電源和地線之間,都應(yīng)安置一個(gè)0.01μF的陶瓷電容器;
c.每4~10個(gè)芯片,安置一個(gè)1~10μF的鉭電容;
d.對(duì)RAM芯片、EPRAM芯片等周期性讀取數(shù)據(jù)的器件,適當(dāng)加大濾波電容.
2.2 軟件處理沖激噪聲
軟件處理周期性沖激噪聲,可以避免在數(shù)據(jù)處理中因?yàn)闆_激噪聲污染數(shù)據(jù)而導(dǎo)致系統(tǒng)處理性能下降.常用的算法有中值濾波、LOR濾波[5]等.根據(jù)沖激噪聲具有的周期性,我們也可以在測(cè)知其周期的情況下用陷波器濾除.陷波器實(shí)現(xiàn)復(fù)雜,我們介紹簡(jiǎn)單高效的中值濾波和LOR濾波,它們都是非線性濾波算法,可有效抵抗沖激噪聲,同時(shí)盡可能保持原來語音信號(hào)的高頻分量,如陡峭邊界和較劇烈的變化等.
中值濾波[5]一般使用標(biāo)準(zhǔn)中值濾波器(SMF)和回歸中值濾波器(RMF).算法如下:設(shè){x(.)}和{y(.)}分別表示待濾波的輸入和已濾波后的輸出,中值濾波器使用取數(shù)窗長(zhǎng)2N+1,那么,SMF的輸出為:
y(k)=Med{x(k-N),Λ,x(k),Λ,x(k+N)}(8)
其中Med.表示取中值.RMF的輸出為:
y(k)=Med{y(k-N),Λ,y(k-1),x(k),Λ,x(k+N)}(9)
LOR濾波[5]指“參考最后輸出濾波”.算法如下:對(duì)輸入{x.},取數(shù)窗長(zhǎng)為W,則輸出y(k)為取數(shù)窗口中和最后一個(gè)輸出數(shù)據(jù)y(k-1)最接近的樣點(diǎn)值,即:
y(k)={x(k+i)││x(k+i)-y(k-1)││x(k+j)-
y(k-1),j≠i,0≤j
為了在濾除沖激噪聲基礎(chǔ)上盡可能地保留原信號(hào)的高頻分量,濾波通常需結(jié)合判界算法,即:輸入為x(k),初步濾波輸出為y(k),最終輸出為z(k),那么,
其中TH是設(shè)定的先驗(yàn)門限值.
中值濾波和LOR濾波都只使用簡(jiǎn)單的比較大小運(yùn)算,實(shí)現(xiàn)算法不復(fù)雜.根據(jù)文獻(xiàn)[5]和我們?cè)趯?shí)際系統(tǒng)中的應(yīng)用,LOR濾波的處理結(jié)果更令人滿意.
2.3 后級(jí)降噪處理
后級(jí)降噪處理是應(yīng)用于模擬模塊的通用降噪措施,對(duì)“治標(biāo)”性質(zhì)的壓制周期性沖激噪聲,有良好的效果.
如上所述,周期性沖激噪聲的周期取決于微處理器的工作狀態(tài),和外部數(shù)據(jù)存取關(guān)系密切.如我們的語音處理系統(tǒng)性能樣機(jī),樣點(diǎn)處理模式下的沖激噪聲的頻率為8kHz,屬高頻噪聲;幀處理模式下的沖激噪聲的頻率為62.5Hz,屬低頻噪聲.這種情況是具有共性的,因?yàn)檎Z音處理系統(tǒng)的采樣頻率一般為8kHz(少數(shù)為10kHz),而采取幀處理模式工作時(shí),一幀數(shù)據(jù)一般為64個(gè)樣點(diǎn)至256個(gè)樣點(diǎn),因此,主要周期性沖激噪聲的頻率都在語音頻帶300Hz~3.4kHz之外.我們可以幸運(yùn)地采用窄帶濾波技術(shù)濾除這些帶外噪聲.
濾除了沖激噪聲的帶外能量之后,帶內(nèi)諧波噪聲可以采用非互補(bǔ)式動(dòng)態(tài)降噪器件進(jìn)一步抑制.動(dòng)態(tài)降噪是頻率跟蹤型降噪器,根據(jù)帶內(nèi)噪聲隨帶寬成正比和掩蔽原理工作,過程為:當(dāng)信號(hào)電平較高時(shí),電路頻率響應(yīng)具平直特性;而當(dāng)信號(hào)電平較低時(shí),電路頻率響應(yīng)具高頻衰減特性.信號(hào)通道帶寬隨輸入信號(hào)電平而變化,信號(hào)電平越小,帶寬越窄.由于人耳具有掩蔽效應(yīng),對(duì)小音量時(shí)的高頻信號(hào)感覺較遲鈍,此時(shí)壓制高頻分量不會(huì)感覺高音不足,聽覺上沒有損失;但小音量時(shí)的噪聲一同被衰減,從而達(dá)到了降噪的目的.
窄帶濾波降噪和動(dòng)態(tài)降噪可如圖7相互配合.
我們?cè)谏鲜稣Z音處理系統(tǒng)的性能樣機(jī)上使用NS公司的單片語音PCM濾波器TP3040實(shí)現(xiàn)窄帶濾波,采用應(yīng)用廣泛的LM1894實(shí)現(xiàn)動(dòng)態(tài)降噪.根據(jù)我們的實(shí)驗(yàn),TP3040的窄帶濾波效果很好,在幀處理模式下,TP3040輸入信號(hào)中所含的幀頻沖激噪聲的峰峰值為200mV,白噪聲峰峰值為120mV,經(jīng)TP3040濾波后,輸出信號(hào)中只剩帶內(nèi)噪聲,其峰峰值為60mV.同時(shí),TP3040可以提供帶內(nèi)信號(hào)增益,我們?cè)O(shè)置為6dB,因此,經(jīng)過TP3040窄帶濾波,信噪比提高超過16dB.LM1894一般可以提供近10dB的降噪效果.在電源未做特殊處理?xiàng)l件下(即表1、表2的測(cè)試環(huán)境不變),用TP3040提供的功放口驅(qū)動(dòng)耳機(jī),聽覺上能感受到的背景噪聲極低,噪聲測(cè)量值可低至-82dB.
應(yīng)該指出,實(shí)際應(yīng)用的降噪系統(tǒng)應(yīng)該根據(jù)具體的應(yīng)用環(huán)境和成本等要求構(gòu)造,沒有必要綜合使用所有的降噪措施.
評(píng)論