<meter id="pryje"><nav id="pryje"><delect id="pryje"></delect></nav></meter>
          <label id="pryje"></label>

          新聞中心

          EEPW首頁(yè) > 嵌入式系統(tǒng) > 設(shè)計(jì)應(yīng)用 > 基于ATK的實(shí)時(shí)語(yǔ)音識(shí)別系統(tǒng)在家庭監(jiān)護(hù)機(jī)器人中的應(yīng)用實(shí)現(xiàn)

          基于ATK的實(shí)時(shí)語(yǔ)音識(shí)別系統(tǒng)在家庭監(jiān)護(hù)機(jī)器人中的應(yīng)用實(shí)現(xiàn)

          作者: 時(shí)間:2012-05-28 來(lái)源:網(wǎng)絡(luò) 收藏


          1.2 軟件設(shè)計(jì)

          HTK(Hidden Markov Model Toolkit)是一套專門(mén)的建立和處理隱馬可夫模型(HMMs)的實(shí)驗(yàn)工具包,由英國(guó)劍橋大學(xué)工程系(Cambridge University Engineering Department,CUED)開(kāi)發(fā)的,主要應(yīng)用于領(lǐng)域,也可以應(yīng)用于語(yǔ)音合成、字符識(shí)別和DNA排序等研究領(lǐng)域。HTK經(jīng)過(guò)劍橋大學(xué)、Entropic公司及Microsoft公司的不斷增強(qiáng)和改進(jìn),使其在領(lǐng)域處于世界領(lǐng)先水平。

          基于HTK的語(yǔ)言識(shí)別時(shí),識(shí)別結(jié)果適用只能顯示在DOS或終端上,而且不利于將結(jié)果保存、移植或者二次開(kāi)發(fā)利用。在本系統(tǒng)中使用了HTK接口工具ATK(AnApplication Toolkit for HTK)。ATK是由英國(guó)劍橋大學(xué)開(kāi)發(fā)的開(kāi)源語(yǔ)音識(shí)別工具,是對(duì)HTK的C++多線程封裝,跟HTK一樣,它支持和Windows,它包括HTK(HTKLib)、AHTK、AGram、ANGram、ADict、AHMMs、AResource、ARMan、ARec、ACode、ASour ce、ATee、AComponent、ABuffer、APacket、Asyn、FLite(SYNLib)、ALog模塊部件。

          基于ATK的語(yǔ)音識(shí)別軟件應(yīng)用系統(tǒng)的由語(yǔ)音信號(hào)采集模塊、基于DMA的雙向高速RAM存取模塊、ATK語(yǔ)音識(shí)別模塊、系統(tǒng)管理模塊、語(yǔ)音輸出模塊等模塊組成,如圖4所示。

          本文引用地址:http://www.ex-cimer.com/article/257479.htm



          在軟件設(shè)計(jì)中,系統(tǒng)管理模塊主要負(fù)責(zé)系統(tǒng)的總體管理調(diào)度,是應(yīng)用系統(tǒng)的調(diào)度中心;語(yǔ)音信號(hào)采集模塊主要負(fù)責(zé)控制數(shù)據(jù)采集芯片TPS 65930;基于DMA的雙向RAM存取模塊主要負(fù)責(zé)實(shí)現(xiàn)DMA驅(qū)動(dòng)及雙向RAM的讀寫(xiě)存取,使用了通道1來(lái)實(shí)現(xiàn)高速地把語(yǔ)音信號(hào)采集到的數(shù)據(jù)存儲(chǔ)到RAM上,并使用通道2實(shí)現(xiàn)高速地把RAM的數(shù)據(jù)取出來(lái),用于語(yǔ)音的識(shí)別;語(yǔ)音輸出模塊主要負(fù)責(zé)把相應(yīng)的音頻數(shù)據(jù)送到TPS65930,并控制TPS6 5930對(duì)接收到的音頻解碼輸出到功放電路,實(shí)現(xiàn)語(yǔ)音輸出的功能。軟件的設(shè)計(jì)流程圖如圖5所示。




          2 語(yǔ)音識(shí)別系統(tǒng)實(shí)驗(yàn)及結(jié)果

          文中設(shè)計(jì)的語(yǔ)音識(shí)別系統(tǒng)如圖6所示。在實(shí)驗(yàn)中總共進(jìn)行了3輪話語(yǔ)測(cè)試,每輪300句話語(yǔ)測(cè)試,其中150句為家庭監(jiān)護(hù)機(jī)器人需要識(shí)別的話語(yǔ),150句話語(yǔ)為機(jī)器人不予置理的無(wú)關(guān)話語(yǔ)。本系統(tǒng)只設(shè)置10個(gè)需要識(shí)別的話語(yǔ),由15名學(xué)生分別讀音進(jìn)行測(cè)試。同時(shí)對(duì)無(wú)關(guān)話語(yǔ)也是由該15名學(xué)生,每人10句分別隨機(jī)讀音測(cè)試。從顯示結(jié)果可以看出,第1輪中,先測(cè)試的150句無(wú)關(guān)話語(yǔ)中,能正確識(shí)別出無(wú)關(guān)話語(yǔ)數(shù)為150句,識(shí)別出無(wú)關(guān)話語(yǔ)率為100%,但對(duì)需識(shí)別的話語(yǔ)中,正確識(shí)別出148句,2句識(shí)別出錯(cuò),識(shí)別率為98.67%;在第2輪中,同樣先測(cè)試的150句無(wú)關(guān)話語(yǔ)中,能正確識(shí)別出無(wú)關(guān)話語(yǔ)數(shù)為150句,識(shí)別出為無(wú)關(guān)話語(yǔ)率為100%,但對(duì)需識(shí)別的話語(yǔ)中,正確識(shí)別出142句,8句識(shí)別出錯(cuò),識(shí)別率為94.67%;在第3輪中,同樣先測(cè)試的150句無(wú)關(guān)話語(yǔ)中,能正確識(shí)別出無(wú)關(guān)話語(yǔ)數(shù)為150句,識(shí)別出無(wú)關(guān)話語(yǔ)率為100%,但對(duì)需識(shí)別的話語(yǔ)中,正確識(shí)別出146句,識(shí)別率為97.33%。在3輪測(cè)試中,系統(tǒng)都能實(shí)時(shí)響應(yīng)所有語(yǔ)句,未出現(xiàn)漏句現(xiàn)象。并且在實(shí)驗(yàn)測(cè)試的過(guò)程中,系統(tǒng)的響應(yīng)速度都非???,感觀上沒(méi)有時(shí)間延遲,與真人交流速度相當(dāng)。



          從實(shí)驗(yàn)測(cè)試結(jié)果可看出,對(duì)于識(shí)別10個(gè)需要識(shí)別的話語(yǔ)的識(shí)別率高達(dá)94.67%以上,具有較高的識(shí)別率,因而該語(yǔ)音識(shí)別系統(tǒng)較好達(dá)到了家庭監(jiān)護(hù)機(jī)器人使用的要求。

          3 結(jié)論

          文中通過(guò)DSP、DMA和ARM 的并行處理,利用雙緩沖的方法,在嵌入式上實(shí)現(xiàn)了基于ATK的實(shí)時(shí)語(yǔ)音識(shí)別系統(tǒng)。該系統(tǒng)可以實(shí)時(shí)地實(shí)現(xiàn)語(yǔ)音識(shí)別,具有較高識(shí)別率,較快的響應(yīng)速度。可以應(yīng)用在家庭監(jiān)護(hù)機(jī)器人及其相關(guān)領(lǐng)域中。

          linux操作系統(tǒng)文章專題:linux操作系統(tǒng)詳解(linux不再難懂)

          上一頁(yè) 1 2 下一頁(yè)

          評(píng)論


          相關(guān)推薦

          技術(shù)專區(qū)

          關(guān)閉
          看屁屁www成人影院,亚洲人妻成人图片,亚洲精品成人午夜在线,日韩在线 欧美成人 (function(){ var bp = document.createElement('script'); var curProtocol = window.location.protocol.split(':')[0]; if (curProtocol === 'https') { bp.src = 'https://zz.bdstatic.com/linksubmit/push.js'; } else { bp.src = 'http://push.zhanzhang.baidu.com/push.js'; } var s = document.getElementsByTagName("script")[0]; s.parentNode.insertBefore(bp, s); })();