<meter id="pryje"><nav id="pryje"><delect id="pryje"></delect></nav></meter>
          <label id="pryje"></label>

          關 閉

          新聞中心

          EEPW首頁 > 工控自動化 > 設計應用 > 基于Julius的機器人語音識別系統(tǒng)構建

          基于Julius的機器人語音識別系統(tǒng)構建

          作者: 時間:2011-08-19 來源:網(wǎng)絡 收藏

          2 框架
          2.1 硬件結構
          的機器狗控制中Atom Z510為訓練學習機大腦(1.1 GHz主頻的Intel Atom Z510嵌入式控制平臺),它主要完成的功能。PXA270控制器(Intel公司于2003年底推出的性能強勁的PXA27x系列嵌入式處理器,ARMv5E的XScale內(nèi)核,最高頻率可達624MHz)作為機器狗本體上的核心智能控制器,接收Atom Z510后的結果,發(fā)出控制命令。ATmega128控制器(Atmel公司的8位系列單片機中的一種,運行頻率16 MHz)完成串行總線的數(shù)字舵機控制,完成對機器狗的前后腿以及尾巴等關節(jié)控制。機器狗硬件結構平臺如圖2所示。

          本文引用地址:http://www.ex-cimer.com/article/161552.htm

          b.jpg


          2.2 軟件結構
          整個包括3個模塊:識別模塊、GUI人機界面、控制模塊。將識別的語音命令提交給GUI模塊,并在GUI上顯示;同時GUI將語音命令轉化為動作控制命令并發(fā)給控制模塊;GUI還可以控制的啟動和停止。其中機器人控制模塊主要在PXA270上,而語音識別和GUI是在Atom Z510上。系統(tǒng)軟件模型如圖3所示。

          c.jpg



          3 語音識別系統(tǒng)
          一個完整的語音識別系統(tǒng)一般包括3部分:聲學模型、語言模型和識別器。在本系統(tǒng)中只建立控制命令(動詞)的識別語法,其他詞忽略,因此沒有語言模型;識別器采用Julius開源平臺,此部分只用配置參數(shù)和相關文件。本文主要工作是聲學模型訓練和語音識別系統(tǒng)。
          3.1 聲學模型訓練
          聲學模型是識別系統(tǒng)的底層模型,是語音識別系統(tǒng)中最關鍵的一部分,它是每個聲學單元的聲學模型參數(shù)集合。本系統(tǒng)的聲學模型是使用HTK對采集的語音庫進行多次迭代訓練后提取的,基于詞的聲學特征向量集。HTK(HMM Tools Kit)是由英國劍橋大學工程系的語音視覺和機器人技術工作組(Speech Vision and Robotics Group)開發(fā),專門用于建立和處理HMM的實驗工具包,主要應用于語音識別領域,也可用于語音模型的測試和分析。其具體訓練步驟如下:
          (1)數(shù)據(jù)準備
          收集漢語標準普通話的語料庫,并將語料庫中的語音標記,創(chuàng)建語音識別單元元素列表文件。
          (2)特征提取
          本系統(tǒng)采用MFCC進行語音的特征參數(shù)提取,訓練中將每一個語音文件用工具HCopy轉換成MFCC格式。
          (3)HMM定義
          在訓練HMM模型時要給出模型的初始框架,本系統(tǒng)中的HMM模型選擇同一個結構,如圖4所示。該模型包含4個活動狀態(tài){S2,S3,S4,S5),開始和結束(這里是S1.S6),是非發(fā)散狀態(tài)。觀察函數(shù)bi是帶對角矩陣的高斯分布,狀態(tài)的可能轉換由aij表示。



          評論


          相關推薦

          技術專區(qū)

          關閉
          看屁屁www成人影院,亚洲人妻成人图片,亚洲精品成人午夜在线,日韩在线 欧美成人 (function(){ var bp = document.createElement('script'); var curProtocol = window.location.protocol.split(':')[0]; if (curProtocol === 'https') { bp.src = 'https://zz.bdstatic.com/linksubmit/push.js'; } else { bp.src = 'http://push.zhanzhang.baidu.com/push.js'; } var s = document.getElementsByTagName("script")[0]; s.parentNode.insertBefore(bp, s); })();