基于DSP的語音識別計算器設(shè)計
摘要:為解決特殊群體使用計算器困難的問題,設(shè)計了一種基于TMS320VC5509 DSP的可語音識別的計算器系統(tǒng)。該計算器系統(tǒng)的核心是采用HMM算法建立語音識別模型。通過對實時語音信號(數(shù)字、運算符號等語音)進(jìn)行處理,將得到的參數(shù)與模板庫參數(shù)進(jìn)行匹配并加以識別,利用TMS320VC5509 DSP自帶的計算模塊實現(xiàn)語音信號整數(shù)100以內(nèi)的加、減、乘、除等計算功能。實驗結(jié)果表明,該計算器系統(tǒng)在低噪聲場合和高噪聲場合下識別率分別達(dá)到94.73%和76.55%。
關(guān)鍵詞:語音識別;DSP;HMM;計算器;TMS320VC5509
隨著電子技術(shù)的高速發(fā)展,現(xiàn)代普通民用計算器在保留基本的加減乘除等運算外,加入了大量如三角函數(shù)、冪函數(shù)等比較復(fù)雜的運算。但是其基本的操作沒有發(fā)生變化,依然是運用手指操作,對于需要進(jìn)行實時數(shù)字計算的一些特殊人群(殘疾人士)或是在一些特殊場合在無法手動操作計算器的情況下,用加入了語音識別模塊的計算器來進(jìn)行實時數(shù)字計算就有相當(dāng)?shù)谋匾?br /> 語音識別技術(shù)是人機最自然、最簡潔的交流方式,它就是讓機器能夠自動識別并理解說話人要表達(dá)的意思,將語音信號轉(zhuǎn)變?yōu)檎_的文本或者命令的高科技技術(shù)。根據(jù)實際的應(yīng)用,語音識別可以分為:特定人與非特定人的識別、孤立詞與連續(xù)詞的識別、中小詞匯量與無限詞匯量的識別。
考慮到成本及使用范圍因素,本文中應(yīng)用的是基于TMS320VC5509 DSP的非特定人、孤立詞、小詞匯量的語音識別系統(tǒng)。通過實際測試,使用該DSP的語音識別系統(tǒng)有著較高的實時性、識別率,基于該系統(tǒng)的計算器對實時數(shù)字計算有較高準(zhǔn)確性,基本能解決特殊群體和特殊地點使用計算器困難的情況。
1 系統(tǒng)硬件設(shè)計
1.1 語音識別系統(tǒng)
語音識別的基本原理框圖如圖l所示。語音識別過程主要包括語音信號前處理、特征提取、模式匹配等部分。語音信號輸入之后,預(yù)處理和數(shù)字化是進(jìn)行語音識別的前提條件。特征提取是進(jìn)行語音信號訓(xùn)練和識別必不可少的步驟,本文采用的是提取每幀的Mel系數(shù)的倒譜參數(shù)作為語音信號的特征值。模板匹配算法目前有DTW算法、HMM隱馬爾科夫模型、ANN人工神經(jīng)網(wǎng)絡(luò)等。本文采用HMM隱馬爾科夫模型的方法,提取出的特征值存入?yún)⒖寄J綆熘?,用來匹配待識別語音信號的特征值。匹配計算是進(jìn)行語音識別的核心部分,由待識別人的語音經(jīng)過特征提取后,與系統(tǒng)訓(xùn)練時產(chǎn)生的模板進(jìn)行匹配,在說話人辨認(rèn)中,取與待識別語音相似度最大的模型所對應(yīng)的語音作為識別結(jié)果。
1.2 系統(tǒng)硬件結(jié)構(gòu)
圖2為系統(tǒng)硬件結(jié)構(gòu)框圖。此系統(tǒng)的核心器件是TI公司的TMS320VC5509定點DSP。在本系統(tǒng)中,它不僅是語音識別的核心,還負(fù)責(zé)計算器的運算部分。TMS320VC5509是系統(tǒng)的運算處理單元,具有2個乘法器(MAC),4個累加器(ACC);40位、16位的算術(shù)邏輯單元(ALU)各一個,這大大增強了DSP的運算能力;指令字長不只單一的16位,可擴展到最高48位,數(shù)據(jù)字長16位;可通過USB接口對TMS320VC5509燒寫程序而不必借助仿真器。正是基于這些優(yōu)點,選擇該器件可節(jié)省開發(fā)資金,減小電路板面積。DSP與TLV320AIC23的接口電路如圖3所示。
評論