采用MEMS麥克風(fēng)實(shí)現(xiàn)復(fù)雜環(huán)境下對(duì)特定語(yǔ)音的提取與放大
本文采用ADMP421組合麥克風(fēng)傳感器采集環(huán)境中的語(yǔ)音信號(hào),并使用FPGA構(gòu)建SOPC,進(jìn)行聲音信號(hào)的頻率,相位匹配,并可根據(jù)用戶(hù)自定義的方式實(shí)現(xiàn)用戶(hù)特征音頻和噪聲的分離,在語(yǔ)音識(shí)別的需求逐漸增長(zhǎng)的背景下,本系統(tǒng)具有極大的市場(chǎng)前景。
1.引 言
人們一直夢(mèng)想有朝一日可以擺脫鍵盤(pán)或遙控設(shè)備的束縛,擁有更為友好、親切的人機(jī)界面,使得計(jì)算機(jī)或家用電器可以像人一樣聽(tīng)懂人的話(huà)語(yǔ),看懂人的動(dòng)作,執(zhí)行人們所希望的任何任務(wù),而語(yǔ)音數(shù)字信號(hào)處理正是其中一項(xiàng)至關(guān)重要的應(yīng)用技術(shù)。隨著科技的發(fā)展,品種繁多的消費(fèi)電子產(chǎn)品進(jìn)入了人們的生活,利用語(yǔ)音技術(shù)對(duì)電子產(chǎn)品的控制也將是未來(lái)的消費(fèi)電子的一大趨勢(shì)。然而在語(yǔ)音通信的過(guò)程中,不可避免地會(huì)受到來(lái)自周?chē)h(huán)境中噪聲的干擾,甚至在某些極端場(chǎng)合下(如工地或公交車(chē)站),噪聲幾乎會(huì)覆蓋掉全部的有用信息。這使得識(shí)別的效率急劇下降,嚴(yán)重時(shí)會(huì)直接導(dǎo)致誤操作,所以在噪聲背景下的語(yǔ)音提取及增強(qiáng)有重要意義[1]。
語(yǔ)音增強(qiáng)作為預(yù)處理,可以改善這些系統(tǒng)的性能,例如語(yǔ)音識(shí)別正在步入實(shí)用階段,但目前的識(shí)別系統(tǒng)大都是在安靜環(huán)境中工作的,在噪聲環(huán)境中尤其是強(qiáng)噪聲環(huán)境,語(yǔ)音識(shí)別系統(tǒng)的識(shí)別率將受到嚴(yán)重影響,這就需要語(yǔ)音增強(qiáng)技術(shù)進(jìn)行預(yù)處理。所謂語(yǔ)音增強(qiáng)就是對(duì)帶噪語(yǔ)音進(jìn)行處理,改善語(yǔ)音質(zhì)量,減少語(yǔ)音通信過(guò)程中噪聲對(duì)語(yǔ)音的損害,對(duì)收聽(tīng)人而言主要是減少疲勞,改善語(yǔ)音質(zhì)量,提高語(yǔ)音可懂度,而對(duì)語(yǔ)音處理系統(tǒng)而言則主要是提高系統(tǒng)的識(shí)別率和抗干擾能力。
目前國(guó)內(nèi)外有關(guān)抗噪聲技術(shù)的研究成果大體可分為三類(lèi)。一類(lèi)是采用語(yǔ)音增強(qiáng)算法,提高語(yǔ)音識(shí)別系統(tǒng)前端預(yù)處理的抗噪聲能力,提高輸入信號(hào)的信噪比。第二類(lèi)方法是尋找穩(wěn)健的耐噪聲的語(yǔ)音特征參數(shù)并提出了短時(shí)修正的相干系數(shù),作為語(yǔ)音特征參數(shù),該參數(shù)是基于自相關(guān)函數(shù)序列的線(xiàn)性預(yù)測(cè)技術(shù),實(shí)驗(yàn)證明,該參數(shù)對(duì)寬帶語(yǔ)音具有較好效果。但是,目前的補(bǔ)償算法通常只考慮到噪聲環(huán)境是平穩(wěn)的,在低信噪比語(yǔ)音以及非平穩(wěn)噪聲環(huán)境中的效果并不理想。而解決噪聲問(wèn)題的根本方法是實(shí)現(xiàn)噪聲和語(yǔ)音的自動(dòng)分離,盡管人們很早就有這種愿望,但由于技術(shù)的難度,這方面的研究進(jìn)展很小。近年來(lái),隨著聲場(chǎng)景分析技術(shù)和盲分離技術(shù)的研究發(fā)展,利用在這些領(lǐng)域的研究成果進(jìn)行語(yǔ)音和噪聲分離的研究取得了一些進(jìn)展[2]。
耳機(jī)技術(shù)可以說(shuō)是手機(jī)背景噪音抑制技術(shù)的最初解決方案,語(yǔ)音壓擴(kuò)技術(shù)現(xiàn)在廣泛的應(yīng)用在通信系統(tǒng)中,麥克風(fēng)陣列技術(shù)有良好的抗噪性能[3],但是其目前的成本過(guò)高,期待著材料技術(shù)的突破。
本文將從硬件和軟件方面綜合設(shè)計(jì)語(yǔ)音增強(qiáng)的系統(tǒng)。本系統(tǒng)采用SOPC快速設(shè)計(jì)數(shù)字電路方案,在外圍擴(kuò)展組合麥克風(fēng)以及音頻輸出模塊,實(shí)現(xiàn)了整個(gè)硬件部分。通過(guò)分析現(xiàn)有的語(yǔ)音增強(qiáng)方案的缺點(diǎn),提出了獨(dú)特的語(yǔ)音增強(qiáng)方案。本系統(tǒng)可以根據(jù)用戶(hù)的特征進(jìn)行自我定制語(yǔ)音輸出,對(duì)環(huán)境中雜亂無(wú)章的噪聲采取了更為靈活的過(guò)濾方式。
2.系統(tǒng)總體設(shè)計(jì)
SoC(System on Chip)片上系統(tǒng)是現(xiàn)代電子系統(tǒng)設(shè)計(jì)的一個(gè)發(fā)展方向,它將原先分立的多個(gè)芯片集成在一塊芯片上,通過(guò)提高芯片的集成度、減少系統(tǒng)芯片的數(shù)量和相互之間的PCB連線(xiàn)、減少PCB面積來(lái)降低整個(gè)系統(tǒng)的成本,同時(shí)使系統(tǒng)的性能、功能和可靠性都有很大的提高。隨著新型的高性能、低成本FPGA的出現(xiàn)和綜合技術(shù)的提高,基于FPGA的SoPC(System on Programmable Chip)可編程片上系統(tǒng)正逐步走向市場(chǎng)。基于FPGA的SoPC與基于A(yíng)SIC技術(shù)的SoC相比,具有設(shè)計(jì)周期短、產(chǎn)品上市速度快、設(shè)計(jì)風(fēng)險(xiǎn)和設(shè)計(jì)成本低、集成度高、靈活性大、維護(hù)和升級(jí)方便、硬件缺陷修復(fù)和排除簡(jiǎn)單等優(yōu)點(diǎn)。因此基于FPGA和包括32位CPU在內(nèi)的各種IP核的系統(tǒng)級(jí)應(yīng)用開(kāi)發(fā)將是下一代電子系統(tǒng)設(shè)計(jì)的發(fā)展方向。
順應(yīng)這個(gè)潮流,F(xiàn)PGA器件的方要供應(yīng)商Altera和Xilinx都推出了各自的SoPC解決方案:Nios系統(tǒng)和MicroBlaze系統(tǒng)。它們功能強(qiáng)大、開(kāi)發(fā)環(huán)境和配套IP核完善,是工程應(yīng)用的首選。但是它們只能用在各自廠(chǎng)商的FPGA上,不但配套IP核價(jià)格昂貴,而且用戶(hù)無(wú)法獲得所有源代碼,不利于我國(guó)SoPC技術(shù)的發(fā)展[4]。針對(duì)這種情況,本系統(tǒng)使用OpenCores組織提供的各種免費(fèi)、開(kāi)源的IP核,構(gòu)建了以O(shè)penRISC1200CPU為核心,配以各類(lèi)外圍IP核的完全開(kāi)源的SoPC系統(tǒng)。其可以運(yùn)行μClinux系統(tǒng)。同時(shí)本系統(tǒng)采用的所有IP核在源代碼不變的情況下可以使用Xilinx的開(kāi)發(fā)工具進(jìn)行綜合、布線(xiàn),為該系統(tǒng)在其他FPGA平臺(tái)上的運(yùn)行打下了良好的基礎(chǔ)。
評(píng)論