基于MATLAB的皮膚聽(tīng)聲器系統(tǒng)的研究
摘要:為了使皮膚聽(tīng)聲器能夠辨析語(yǔ)音,設(shè)計(jì)了基于MATLAB的皮膚聽(tīng)聲器系統(tǒng)。該系統(tǒng)以MATLAB軟件為平臺(tái),在此基礎(chǔ)上實(shí)現(xiàn)了語(yǔ)音信號(hào)的錄制、播放、預(yù)處理、分段濾波、特征提取等功能,并利用特征參數(shù)辨析語(yǔ)音。本系統(tǒng)達(dá)到了辨析簡(jiǎn)單語(yǔ)音的要求,但仍有需改進(jìn)的地方,如:能否構(gòu)造更合適的特征參數(shù),能否辨析比較復(fù)雜的語(yǔ)音。
關(guān)鍵詞:皮膚聽(tīng)聲;采集;處理;語(yǔ)音辨析;MATLAB
目前,世界上有許多的耳聾患者,他們要么是皋天性耳聾,要么是后天造成的耳聾。當(dāng)前解決耳聾問(wèn)題主要通過(guò)傳統(tǒng)助聽(tīng)器和電子耳蝸,但兩者都有明顯的缺陷,前者只使用于輕度耳聾患者,而后者造價(jià)太高,不適于推廣。為徹底解決耳聾問(wèn)題,李建文教授針對(duì)全聾人的聽(tīng)覺(jué)問(wèn)題發(fā)明了變壓式皮膚聽(tīng)聲器,其實(shí)質(zhì)是利用聲-電轉(zhuǎn)換讓皮膚獲得對(duì)電流信號(hào)的感覺(jué),使全聾人通過(guò)皮膚獲得一定的聽(tīng)覺(jué),從根本上解決了聾啞人士的聽(tīng)力問(wèn)題。
但是,變壓式皮膚聽(tīng)聲器僅僅使用戶感受到電刺激,而不能辨析語(yǔ)音。為解決此問(wèn)題,本文提出了一種基于MATLAB的皮膚聽(tīng)聲器系統(tǒng)。該系統(tǒng)能夠?qū)崿F(xiàn)語(yǔ)音信號(hào)的錄制、播放、預(yù)處理、分段濾波、特征提取等功能,并能夠辨析簡(jiǎn)單的語(yǔ)音。
1 皮膚聽(tīng)聲技術(shù)與皮膚聽(tīng)聲器
皮膚聽(tīng)聲技術(shù)是一門(mén)比較前沿的技術(shù),其目韻是利用皮膚解決耳聾患者的聽(tīng)聲問(wèn)題。而皮膚聽(tīng)聲器就是通過(guò)皮膚聽(tīng)聲技術(shù)解決耳聾患者聽(tīng)覺(jué)問(wèn)題的電子工具,其特點(diǎn)類似于助聽(tīng)器并涉及醫(yī)學(xué)、電子學(xué)、聲學(xué)和生理學(xué),進(jìn)一步的發(fā)展將依賴于數(shù)學(xué)和計(jì)算機(jī)等學(xué)科,屬于典型的多學(xué)科高科技領(lǐng)域。它通過(guò)皮膚傳遞聲音信號(hào)且不依賴于人的任何殘余聽(tīng)力,實(shí)用效果明顯,容易佩戴,幾乎無(wú)副作用,任何聽(tīng)力損失的人均可使用。
由李建文教授發(fā)明并研制的第一代皮膚聽(tīng)聲器已經(jīng)達(dá)到聽(tīng)聲的效果,接下來(lái)皮膚聽(tīng)聲器要達(dá)到能夠辨析語(yǔ)音的要求。這需要將原來(lái)的模擬電路轉(zhuǎn)換為數(shù)字電路,在此基礎(chǔ)上進(jìn)行語(yǔ)音辨析。而本文就設(shè)計(jì)了一個(gè)基于MATLAB的皮膚聽(tīng)聲器系統(tǒng),該系統(tǒng)以MATLAB軟件為平臺(tái),依次實(shí)現(xiàn)語(yǔ)音信號(hào)的錄制、播放、預(yù)處理、分段濾波、特征提取和最后的辨析語(yǔ)音等功能。
2 系統(tǒng)功能介紹
2.1 主要功能
皮膚聽(tīng)聲器的作用就是解決耳聾患者的聽(tīng)聲問(wèn)題,因此是皮膚聽(tīng)聲器能量辨析語(yǔ)音是一個(gè)十分重要的技術(shù)環(huán)節(jié)。本文設(shè)計(jì)了一個(gè)皮膚聽(tīng)聲器系統(tǒng),基本能夠辨析簡(jiǎn)單的語(yǔ)音。該系統(tǒng)以MATLAB軟件為平臺(tái),主要功能有錄制語(yǔ)音、播放語(yǔ)音、預(yù)處理、分段濾波、特征提取和最后的辨析語(yǔ)音。平臺(tái)功能劃分如圖1所示。
2.2 核心模塊
根據(jù)本文皮膚聽(tīng)聲器系統(tǒng)的各個(gè)功能,將其分成三大核心模塊,分別是采集模塊、處理模塊和辨析模塊。
2.2.1 采集模塊
系統(tǒng)采集模塊的功能包括:錄制語(yǔ)音,播放語(yǔ)音。
1)錄制語(yǔ)音:通過(guò)麥克風(fēng)錄入聲音,并保存為.wav的格式,以備后用。
在MATLAB中,用函數(shù)wavrecord錄制語(yǔ)音。得到的是數(shù)字化的語(yǔ)音數(shù)據(jù)串,可直接作為Matlab變量參與各種運(yùn)算。然后用函數(shù)wavwrite(y,filename)將變量y中儲(chǔ)存的數(shù)據(jù)寫(xiě)入名為filename的WAVE文件中。
2)播放語(yǔ)音:播放已錄制的語(yǔ)音WAVE文件,并輸出其波形圖和語(yǔ)譜圖。
在此,用wavread和sound函數(shù)分別讀取、播放語(yǔ)音。求取波形圖和語(yǔ)譜圖時(shí),要用到length函數(shù)和FFT變換。
2.2.2 處理模塊
該模塊的功能有預(yù)處理、分段濾波和特征提取。
1)預(yù)處理:對(duì)前面錄制的語(yǔ)音信號(hào)進(jìn)行去除噪聲、預(yù)加重和端點(diǎn)檢測(cè)處理,為后續(xù)工作提供更加清晰有效的信號(hào)。
2)分段濾波:對(duì)經(jīng)預(yù)處理后語(yǔ)音信號(hào)進(jìn)行分段濾波,將不同的頻率的語(yǔ)音信號(hào)分離開(kāi),使得皮膚能夠更好地感應(yīng)語(yǔ)音信號(hào)。
3)特征提取:語(yǔ)音的特征參數(shù)能有效地體現(xiàn)說(shuō)話人語(yǔ)音所包含的與其他說(shuō)話人不同的特點(diǎn),它在整個(gè)辨析過(guò)程中起著至關(guān)重要的作用。本文在語(yǔ)音濾波后,從每個(gè)頻率段內(nèi)提取一個(gè)能夠表征該段語(yǔ)音的參數(shù),在把所有參數(shù)結(jié)合在一起構(gòu)造一個(gè)特征向量,將其作為表征該語(yǔ)音信號(hào)的特征參數(shù),為后面的辨析工作提供一個(gè)較為可靠的參考數(shù)據(jù)。
2.2.3 辨析模塊
該模塊的功能包括:模板建庫(kù)、模式匹配和輸出結(jié)果。
1)模板建庫(kù):講話者多次重復(fù)語(yǔ)音單元,從原始語(yǔ)音樣本中去除冗余信息,保留關(guān)鍵數(shù)據(jù),獲得表示識(shí)別基本單元共性特點(diǎn)的標(biāo)準(zhǔn)數(shù)據(jù),以此構(gòu)成參考模板,將所有能識(shí)別的基本單元的參考模板結(jié)合在一起,建立參考模板庫(kù)。
2)模式匹配:新錄入的語(yǔ)音經(jīng)特征提取后,與庫(kù)中模板按某種原則進(jìn)行比較,找出相似度最高的參考模板所對(duì)應(yīng)的發(fā)音,即為辨析的結(jié)果。
3)輸出結(jié)果:輸出前面的辨析結(jié)果,以使用戶能夠更好的通過(guò)皮膚聽(tīng)聲器辨析語(yǔ)音。
評(píng)論