<meter id="pryje"><nav id="pryje"><delect id="pryje"></delect></nav></meter>
          <label id="pryje"></label>

          新聞中心

          EEPW首頁 > 汽車電子 > 基于DSP的高速實時語音識別系統(tǒng)的設(shè)計

          基于DSP的高速實時語音識別系統(tǒng)的設(shè)計

          ——
          作者:李邵梅 陳鴻昶等 時間:2007-10-31 來源:現(xiàn)代電子技術(shù) 收藏
          實時系統(tǒng)中,由于語音的數(shù)據(jù)量大,運算復(fù)雜,對處理器性能提出了很高的要求,適于采用高速實現(xiàn)。雖然提供了高速和靈活的硬件設(shè)計,但是在實時處理系統(tǒng)中,還需結(jié)合器件的結(jié)構(gòu)及工作方式,針對語音處理的特點,對軟件進(jìn)行反復(fù)優(yōu)化,以縮短識別時間,滿足實時的需求。因此如何對DSP進(jìn)行優(yōu)化編程,解決算法的復(fù)雜性和硬件存儲容量及速度之間的矛盾,成為實現(xiàn)系統(tǒng)性能的關(guān)鍵。本文基于TMS320C6713設(shè)計并實現(xiàn)了高速實時系統(tǒng),在固定文本的說話人辨識的應(yīng)用中效果顯著。 
            1 的原理

            語音識別的基本原理框圖如圖1所示。語音信號中含有豐富的信息,從中提取對語音識別有用的信息的過程,就是特征提取,特征提取方法是整個語音識別系統(tǒng)的基礎(chǔ)。語音識別的過程可以被看作足模式匹配的過程,模式匹配是指根據(jù)一定的準(zhǔn)則,使未知模式與模型庫中的某一模型獲得最佳匹配。



            1.1 MFCC

            語音識別中對特征參數(shù)的要求是:

            (1) 能夠有效地代表語音特征;

            (2) 各階參數(shù)之間有良好的獨立性;

            (3) 特征參數(shù)要計算方便,保證識別的實時實現(xiàn)。

            系統(tǒng)使用目前最為常用的MFCC(Mel FrequencyCepstral Coefficient,美爾頻率倒譜系數(shù))參數(shù)。

            求取MFCC的主要步驟是:

            (1) 給每一幀語音加窗做FFT,取出幅度;

            (2) 將幅度和濾波器組中每一個三角濾波器進(jìn)行Binning運算;

            (3) 求log,換算成對數(shù)率;

            (4) 從對數(shù)率的濾波器組幅度,使用DCT變換求出MFCC系數(shù)。



            本文中采用12階的MFCC,同時加過零率和delta能量共14維的語音參數(shù)。

            1.2 DTW

            語音識別中的模式匹配和模型訓(xùn)練技術(shù)主要有DTW(Dynamic Time Warping,動態(tài)時間彎折)、HMM(HideMarkov  
          Model,隱馬爾科夫模型)和ANN(Artificial Neu-ral Network,人工神經(jīng)元網(wǎng)絡(luò))。

            DTW是一種簡單有效的方法。該算法基于動態(tài)規(guī)劃的思想,解決了發(fā)音長短不一的模板匹配問題,是語音識別中出現(xiàn)較早、較為經(jīng)典的一種算法。DTW算法的原理是計算兩個長度不同的語音之間的相似程度,即失真距離。

            設(shè)測試語音和參考語音用T和R表示,他們分別含有N幀和M幀的語音參數(shù)。本文中每幀語音的特征參數(shù)為14維,因此T,R分別為N
          linux操作系統(tǒng)文章專題:linux操作系統(tǒng)詳解(linux不再難懂)


          關(guān)鍵詞: DSP 語音識別 嵌入式 嵌入式

          評論


          相關(guān)推薦

          技術(shù)專區(qū)

          關(guān)閉
          看屁屁www成人影院,亚洲人妻成人图片,亚洲精品成人午夜在线,日韩在线 欧美成人 (function(){ var bp = document.createElement('script'); var curProtocol = window.location.protocol.split(':')[0]; if (curProtocol === 'https') { bp.src = 'https://zz.bdstatic.com/linksubmit/push.js'; } else { bp.src = 'http://push.zhanzhang.baidu.com/push.js'; } var s = document.getElementsByTagName("script")[0]; s.parentNode.insertBefore(bp, s); })();