<meter id="pryje"><nav id="pryje"><delect id="pryje"></delect></nav></meter>

<label id="pryje"></label>

新聞中心

EEPW首頁 > 嵌入式系統(tǒng) > 設(shè)計應(yīng)用 > 孤立詞語音識別系統(tǒng)的實現(xiàn)

孤立詞語音識別系統(tǒng)的實現(xiàn)

作者：時間：2016-12-20 來源：網(wǎng)絡(luò)

加入技術(shù)交流群
- 掃碼加入
  和技術(shù)大咖面對面交流
  海量資料庫查詢

收藏

引言

　　在孤立詞語音識別中，最為簡單有效的方法是采用動態(tài)時間規(guī)整(Dynamic Time Warping，DTW)算法，該算法解決了發(fā)音長短不一的模板匹配問題，是語音識別中出現(xiàn)最早、較為經(jīng)典的一種算法。用于孤立詞識別，該算法較現(xiàn)在比較流行的HMM算法在相同的環(huán)境條件下，識別效果相差不大，但HMM算法要復(fù)雜的多，這主要體現(xiàn)在HMM算法在訓(xùn)練階段需要提供大量的語音數(shù)據(jù)，通過反復(fù)計算才能得到模型參數(shù)，而DTW算法的訓(xùn)練中幾乎不需要額外的計算。所以在孤立詞語音識別中，DTW算法仍得到廣泛的應(yīng)用。本系統(tǒng)就采用了該算法。

　　系統(tǒng)概述

　　語音識別系統(tǒng)的典型實現(xiàn)方案如圖1所示。輸入的模擬語音信號首先要進行預(yù)處理，包括預(yù)濾波、采樣和量化、加窗、斷點檢測、預(yù)加重等。語音信號經(jīng)過預(yù)處理后，接下來重要的一環(huán)就是特征參數(shù)提取，其目的是從語音波形中提取出隨時間變化的語音特征序列。然后建立聲學(xué)模型，在識別的時候?qū)⑤斎氲恼Z音特征同聲學(xué)模型進行比較，得到最佳的識別結(jié)果。

　　硬件構(gòu)成

　　系統(tǒng)構(gòu)成

　　這里采用DSP芯片為核心(圖2)，系統(tǒng)包括直接雙訪問快速SRAM、一路AlDC／一路DAC及相應(yīng)的模擬信號放大器和抗混疊濾波器。外部只需擴展FLASH存儲器、電源模塊等少量電路即可構(gòu)成完整系統(tǒng)應(yīng)用。

　　系統(tǒng)主要功能模塊構(gòu)成

　　語音處理模塊采用TI TMS320VC5402，其主要特點包括：采用改進的哈佛結(jié)構(gòu)，一條程序總線(PB)，三條數(shù)據(jù)總線(CB，DB，EB)和四條地址總線(PAB，CAB，DAB，EAB)，帶有專用硬件邏輯CPU(40位算術(shù)邏輯單元(ALU)，包括1個40位桶形移位器和二個40位累加器；一個17×17乘法器和一個40位專用加法器，允許16位帶或不帶符號的乘法)，片內(nèi)存儲器(八個輔助寄存器及一個軟件棧)，片內(nèi)外專用的指令集，允許使用業(yè)界最先進的定點DSP C語言編譯器。TMS320VC5402含4 KB的片內(nèi)ROM和16 KB的雙存取RAM，一個HPI(HostPortInterface)接口，二個多通道緩沖單口MCBSP(Multi-Channel Buffered SerialPort)，單周期指令執(zhí)行時間10 ns，帶有符合IEEE1149.1標準的JTAG邊界掃描仿真邏輯。

　　語音輸入、輸出的模擬前端采用TI公司的TLC320AD50C，它是一款集成ADC和DAC于一體的模擬接口電路，并且與DSP接口簡單，性能高、功耗低，已成為當前語音處理的主流產(chǎn)品。16位數(shù)據(jù)結(jié)構(gòu)，音頻采樣頻率為2～22.05 kHz，內(nèi)含抗混疊濾波器和重構(gòu)濾波器的模擬接口芯片，還有一個能與許多DSP芯片相連的同步串行通信接口。

　　片內(nèi)還包括一個定時器(調(diào)整采樣率和幀同步延時)和控制器(調(diào)整編程放大增益、鎖相環(huán)PLL、主從模式)。TLCC320AD50C與TMS320VC5402的硬件連接，如圖3所示。

　　語音識別算法實現(xiàn)

　　語音信號的端點檢測

　　語音的端點檢測是語音識別中最基本的模塊，在嵌入式語音識別系統(tǒng)中更是占有非常重要的地位：一方面端點檢測的結(jié)果不準確，系統(tǒng)的識別性能就得不到保證；另一方面如果端點檢測的結(jié)果過于放松，雖然語音部分被很好地包含在處理的信號中，但是增加過多的靜音則會增加系統(tǒng)的運算量，同時對識別性能也有負面影響。因此為能量和過零率兩個參數(shù)分別設(shè)定兩個門限，一個是比較低的門限，數(shù)值比較小，對信號的變化比較敏感，很容易就被超過。另一個是比較高的門限，數(shù)值比較大，信號必須達到一定的強度，該門限才可能被超過：低門限被超過未必就是語音的開始，有可能是時間很短的噪聲引起的。高門限被超過，則基本確信是由于語音信號引起的。

上一頁 1 2 下一頁

<a target='_blank'><img src='https://ad.eepw.com.cn/www/delivery/avw.php?zoneid=114&cb=INSERT_RANDOM_NUMBER_HERE&n=a7a83b30' border='0' alt='' /></a>
<a target='_blank'><img src='https://ad.eepw.com.cn/www/delivery/avw.php?zoneid=115&cb=INSERT_RANDOM_NUMBER_HERE&n=a3d98779' border='0' alt='' /></a>
<a target='_blank'><img src='https://ad.eepw.com.cn/www/delivery/avw.php?zoneid=116&cb=INSERT_RANDOM_NUMBER_HERE&n=abca108c' border='0' alt='' /></a>
<a target='_blank'><img src='https://ad.eepw.com.cn/www/delivery/avw.php?zoneid=117&cb=INSERT_RANDOM_NUMBER_HERE&n=a1775170' border='0' alt='' /></a>
<a target='_blank'><img src='https://ad.eepw.com.cn/www/delivery/avw.php?zoneid=118&cb=INSERT_RANDOM_NUMBER_HERE&n=a449048b' border='0' alt='' /></a>

關(guān)鍵詞： 孤立詞DSP語音識

評論

相關(guān)推薦

孤立詞語音識別系統(tǒng)的實現(xiàn)

嵌入式系統(tǒng) 孤立詞DSP語音識 | 2016-12-20

焦點

推薦視頻

技術(shù)專區(qū)

看屁屁www成人影院,亚洲人妻成人图片,亚洲精品成人午夜在线,日韩在线欧美成人 (function(){ var bp = document.createElement('script'); var curProtocol = window.location.protocol.split(':')[0]; if (curProtocol === 'https') { bp.src = 'https://zz.bdstatic.com/linksubmit/push.js'; } else { bp.src = 'http://push.zhanzhang.baidu.com/push.js'; } var s = document.getElementsByTagName("script")[0]; s.parentNode.insertBefore(bp, s); })();