孤立詞語音識(shí)別系統(tǒng)的DSP實(shí)現(xiàn)
0 引 言
在孤立詞語音識(shí)別中,最為簡單有效的方法是采用動(dòng)態(tài)時(shí)間規(guī)整(Dynamic Time Warping,DTW)算法,該算法解決了發(fā)音長短不一的模板匹配問題,是語音識(shí)別中出現(xiàn)最早、較為經(jīng)典的一種算法。用于孤立詞識(shí)別,該算法較現(xiàn)在比較流行的HMM算法在相同的環(huán)境條件下,識(shí)別效果相差不大,但HMM算法要復(fù)雜的多,這主要體現(xiàn)在HMM算法在訓(xùn)練階段需要提供大量的語音數(shù)據(jù),通過反復(fù)計(jì)算才能得到模型參數(shù),而DTW算法的訓(xùn)練中幾乎不需要額外的計(jì)算。所以在孤立詞語音識(shí)別中,DTW算法仍得到廣泛的應(yīng)用。本系統(tǒng)就采用了該算法。
1 系統(tǒng)概述
語音識(shí)別系統(tǒng)的典型實(shí)現(xiàn)方案如圖1所示。輸入的模擬語音信號(hào)首先要進(jìn)行預(yù)處理,包括預(yù)濾波、采樣和量化、加窗、斷點(diǎn)檢測、預(yù)加重等。語音信號(hào)經(jīng)過預(yù)處理后,接下來重要的一環(huán)就是特征參數(shù)提取,其目的是從語音波形中提取出隨時(shí)間變化的語音特征序列。然后建立聲學(xué)模型,在識(shí)別的時(shí)候?qū)⑤斎氲恼Z音特征同聲學(xué)模型進(jìn)行比較,得到最佳的識(shí)別結(jié)果。
2 硬件構(gòu)成
2.1 系統(tǒng)構(gòu)成
這里采用DSP芯片為核心(圖2),系統(tǒng)包括直接雙訪問快速SRAM、一路ADC/一路DAC及相應(yīng)的模擬信號(hào)放大器和抗混疊濾波器。外部只需擴(kuò)展FLASH存儲(chǔ)器、電源模塊等少量電路即可構(gòu)成完整系統(tǒng)應(yīng)用。
評(píng)論