<meter id="pryje"><nav id="pryje"><delect id="pryje"></delect></nav></meter>

<label id="pryje"></label>

新聞中心

EEPW首頁 > 嵌入式系統(tǒng) > 設(shè)計(jì)應(yīng)用 > 語音識(shí)別技術(shù)在微機(jī)器人控制系統(tǒng)中的應(yīng)用

語音識(shí)別技術(shù)在微機(jī)器人控制系統(tǒng)中的應(yīng)用

作者：時(shí)間：2009-01-21 來源：網(wǎng)絡(luò)

加入技術(shù)交流群
- 掃碼加入
  和技術(shù)大咖面對(duì)面交流
  海量資料庫查詢

收藏

　　本文基于毫米級(jí)全方位無回轉(zhuǎn)半徑移動(dòng)機(jī)器人課題。微系統(tǒng)配置示意圖如圖1所示。主要由主機(jī)Host(配有圖像采集卡)、兩個(gè)CCD攝像頭(其中一個(gè)為顯微攝像頭)、微移動(dòng)裝配平臺(tái)、微機(jī)器人本體和系統(tǒng)控制電路板等組成。計(jì)算機(jī)和攝像機(jī)組用于觀察微機(jī)器人的方位，控制系統(tǒng)控制微機(jī)器人的移動(dòng)。

　　本文在系統(tǒng)控制電路中嵌入式實(shí)現(xiàn)語音識(shí)別算法，通過語音控制微機(jī)器人。

　　微機(jī)器人控制系統(tǒng)的資源有限，控制方法比較復(fù)雜，并且需要有較高的實(shí)時(shí)性，因此本文采用的語音識(shí)別算法必須簡(jiǎn)單、識(shí)別率高、占用系統(tǒng)資源少。

　　HMM(隱馬爾可夫模型)的適應(yīng)性強(qiáng)、識(shí)別率高，是當(dāng)前語音識(shí)別的主流算法。使用基于HMM非特定人的語音識(shí)別算法雖然借助模板匹配減小了識(shí)別所需的資源，但是前期的模板儲(chǔ)存工作需要大量的計(jì)算和存儲(chǔ)空間，因此移植到嵌入式系統(tǒng)還有一定的難度，所以很多嵌入式應(yīng)用平臺(tái)的訓(xùn)練部分仍在PC機(jī)上實(shí)現(xiàn)。

　　為了使訓(xùn)練和識(shí)別都在嵌入式系統(tǒng)上實(shí)現(xiàn)，本文給出了一種基于K均值分段HMM模型的實(shí)時(shí)學(xué)習(xí)語音識(shí)別算法，不僅解決了上述問題，而且做到了智能化，實(shí)現(xiàn)了真正意義上的自動(dòng)語音識(shí)別。

1 增量K均值分段HMM的算法及實(shí)現(xiàn)

　　由于語音識(shí)別過程中非特定的因素較多，為了提高識(shí)別的準(zhǔn)確率，針對(duì)本系統(tǒng)的特點(diǎn)，采用動(dòng)態(tài)改變識(shí)別參數(shù)的方法提高系統(tǒng)的識(shí)別率。

　　訓(xùn)練算法是HMM中運(yùn)算量最大、最復(fù)雜的部分，訓(xùn)練算法的輸出是即將存儲(chǔ)的模型。目前的語音識(shí)別系統(tǒng)大都使用貝斯曼參數(shù)的HMM模型，采取最大似然度算法。這些算法通常是批處理函數(shù)，所有的訓(xùn)練數(shù)據(jù)要在識(shí)別之前訓(xùn)練好并存儲(chǔ)。因此很多嵌入式系統(tǒng)因?yàn)橘Y源有限不能達(dá)到高識(shí)別率和實(shí)時(shí)輸出。

　　本系統(tǒng)采用了自適應(yīng)增量K均值分段算法。在每次輸入新的語句時(shí)都連續(xù)地計(jì)算而不對(duì)前面的數(shù)據(jù)進(jìn)行存儲(chǔ)，這可以節(jié)約大量的時(shí)間和成本。輸入語句時(shí)由系統(tǒng)的識(shí)別結(jié)果判斷輸入語句的序號(hào)，并對(duì)此語句的參數(shù)動(dòng)態(tài)地修改，真正做到了實(shí)時(shí)學(xué)習(xí)。

　　K均值分段算法是基于最佳狀態(tài)序列的理論，因此可以采用Viterbi算法得到最佳狀態(tài)序列，從而方便地在線修改系統(tǒng)參數(shù)，使訓(xùn)練的速度大大提高。

　　為了達(dá)到本系統(tǒng)所需要的功能，對(duì)通常的K均值算法作了一定的改進(jìn)。在系統(tǒng)無人監(jiān)管的情況下，Viterbi解碼計(jì)算出最大相似度的語音模型，根據(jù)這個(gè)假設(shè)計(jì)算分段K均值算法的輸入?yún)?shù)，對(duì)此模型進(jìn)行參數(shù)重估。首先按照HMM模型的狀態(tài)數(shù)進(jìn)行等間隔分段，每個(gè)間隔的數(shù)據(jù)段作為某一狀態(tài)的訓(xùn)練數(shù)據(jù)，計(jì)算模型的初始參數(shù)λ=f(a，A，B)。采用Viterbi的最佳狀態(tài)序列搜索，得到當(dāng)前最佳狀態(tài)序列參數(shù)和重估參數(shù)θ，其中概率密度函數(shù)P(X，S|θ)代替了最大似然度算法中的P(X，θ)，在不同的馬爾科夫狀態(tài)和重估之間跳轉(zhuǎn)。基于K均值算法的參數(shù)重估流程如下：

　　為了使參數(shù)能更快地收斂，在每幀觀察語音最佳狀態(tài)序列的計(jì)算結(jié)束后，加入一個(gè)重估過程，以求更快地響應(yīng)速度。

　　可以看到，增量K均值算法的特點(diǎn)為：在每次計(jì)算完觀察值最佳狀態(tài)序列后，插入一個(gè)重估過程。隨時(shí)調(diào)整參數(shù)以識(shí)別下一個(gè)句子。

　　由于采用混合高斯密度函數(shù)作為輸出概率分布可以達(dá)到較好的識(shí)別效果，因此本文采用M的混合度對(duì)數(shù)據(jù)進(jìn)行訓(xùn)練。

　　對(duì)λ重估，并比較收斂性，最終得到HMM模型參數(shù)訓(xùn)練結(jié)果。

　　可見，用K均值法在線修改時(shí)，一次數(shù)據(jù)輸入會(huì)有多次重估過程，這使系統(tǒng)使用最近的模型估計(jì)后續(xù)語句的最佳狀態(tài)序列成為可能。但是對(duì)于在線修改參數(shù)要求，快速收斂是很重要的。為了得到更好的Viterbi序列，最佳狀態(tài)序列使用了漸增的算法模型，即快速收斂算法。

　　語音識(shí)別的具體實(shí)現(xiàn)過程為：數(shù)字語音信號(hào)通過預(yù)處理和特征向量的提取，用戶通過按鍵選擇學(xué)習(xí)或者識(shí)別模式；如果程序進(jìn)入訓(xùn)練過程，即用戶選擇進(jìn)行新詞條的學(xué)習(xí)，則用分段K均值法對(duì)數(shù)據(jù)進(jìn)行訓(xùn)練得到模板；如果進(jìn)入識(shí)別模式，則從Flash中調(diào)出聲音特征向量，進(jìn)行HMM算法識(shí)別。在識(shí)別出結(jié)果后，立即將識(shí)別結(jié)果作為正確結(jié)果與前一次的狀態(tài)做比較，得到本詞條更好的模板，同時(shí)通過LED數(shù)字顯示和語音輸出結(jié)果。系統(tǒng)軟件流程如圖2所示。

　　對(duì)采集到的語音進(jìn)行16kHz、12位量化，并對(duì)數(shù)字語音信號(hào)進(jìn)行預(yù)加重：

　　L選擇為320個(gè)點(diǎn)，用短時(shí)平均能量和平均過零率判斷起始點(diǎn)，去除不必要的信息。

　　對(duì)數(shù)據(jù)進(jìn)行FFT運(yùn)算，得到能量譜，通過24通道的帶通濾波輸出X(k)，然后再通過DCT運(yùn)算，提取12個(gè)MFCC系數(shù)和一階二階對(duì)數(shù)能量，提取38個(gè)參數(shù)可以使系統(tǒng)識(shí)別率得到提高。

　　為了進(jìn)行連接詞識(shí)別，需要由訓(xùn)練數(shù)據(jù)得到單個(gè)詞條的模型。方法為：首先從連接詞中分離出每個(gè)孤立的詞條，然后再進(jìn)行孤立詞條的模型訓(xùn)練。對(duì)于本系統(tǒng)不定長(zhǎng)詞條的情況，每個(gè)詞條需要有一套初始的模型參數(shù)，然后按照分層構(gòu)筑的HMM算法將所有詞串分成孤立的詞條。對(duì)每個(gè)詞條進(jìn)行參數(shù)的重估，判斷是否收斂。如果差異小于某個(gè)域值就判斷為收斂；否則將得到的參數(shù)作為新的初始參數(shù)再進(jìn)行重估，直到收斂。

2 實(shí)驗(yàn)結(jié)果

　　實(shí)驗(yàn)采用30個(gè)人(15男，15女)的聲音模型進(jìn)行識(shí)別。首先由10人(5男，5女)對(duì)5個(gè)命令詞(前進(jìn)、后退、左移、右移、快速)分別進(jìn)行初始數(shù)據(jù)訓(xùn)練，每人每詞訓(xùn)練10次，得到訓(xùn)練模板。然后再由這30人隨機(jī)進(jìn)行非特定人語音識(shí)別。采用6狀態(tài)的HMM模型，高斯混合度選為14，得到圖3的實(shí)驗(yàn)結(jié)果。

　　逐步增加高斯混合度數(shù)目，可以得到圖4的實(shí)驗(yàn)結(jié)果。可見高斯混合度在18的時(shí)候達(dá)到較好的識(shí)別效果，混合度太高識(shí)別率反而會(huì)有所下降，這是由于嵌入式系統(tǒng)的資源有限，運(yùn)算復(fù)雜度的增長(zhǎng)超過了嵌入式設(shè)備的限制所造成的。

　　為了使微機(jī)器人能夠正確地執(zhí)行人的聲音指令，本文將語音識(shí)別的過程嵌入微機(jī)器人的控制系統(tǒng)中，根據(jù)微機(jī)器人控制系統(tǒng)資源有限、對(duì)實(shí)時(shí)性要求高的特點(diǎn)，使用增量K均值分段HMM的算法，簡(jiǎn)化計(jì)算節(jié)省了所需的硬件資源，實(shí)現(xiàn)了實(shí)時(shí)學(xué)習(xí)的語音識(shí)別，能方便地對(duì)微機(jī)器人進(jìn)行控制。

　　本系統(tǒng)的識(shí)別率達(dá)到了較高的標(biāo)準(zhǔn)，又由于加入了智能化的用戶選擇部分，用戶可隨時(shí)選擇學(xué)習(xí)新的語句，使其有更廣闊的應(yīng)用前景。
　　由于嵌入式平臺(tái)受到處理速度、存儲(chǔ)空間的限制，所以能夠?qū)ξC(jī)器人發(fā)出的指令十分有限，識(shí)別率還有待提高。因此，研究語音識(shí)別算法，比較各種算法的優(yōu)缺點(diǎn)，進(jìn)而在嵌入式微機(jī)器人控制系統(tǒng)上實(shí)現(xiàn)大詞匯量非特定人的語音識(shí)別，實(shí)現(xiàn)真正意義上的人機(jī)交流是今后進(jìn)一步的工作。

<a target='_blank'><img src='https://ad.eepw.com.cn/www/delivery/avw.php?zoneid=114&cb=INSERT_RANDOM_NUMBER_HERE&n=a7a83b30' border='0' alt='' /></a>
<a target='_blank'><img src='https://ad.eepw.com.cn/www/delivery/avw.php?zoneid=115&cb=INSERT_RANDOM_NUMBER_HERE&n=a3d98779' border='0' alt='' /></a>
<a target='_blank'><img src='https://ad.eepw.com.cn/www/delivery/avw.php?zoneid=116&cb=INSERT_RANDOM_NUMBER_HERE&n=abca108c' border='0' alt='' /></a>
<a target='_blank'><img src='https://ad.eepw.com.cn/www/delivery/avw.php?zoneid=117&cb=INSERT_RANDOM_NUMBER_HERE&n=a1775170' border='0' alt='' /></a>
<a target='_blank'><img src='https://ad.eepw.com.cn/www/delivery/avw.php?zoneid=118&cb=INSERT_RANDOM_NUMBER_HERE&n=a449048b' border='0' alt='' /></a>

關(guān)鍵詞： 微機(jī)器人 語音識(shí)別 隱式馬爾可夫模型 嵌入式系統(tǒng)

評(píng)論

相關(guān)推薦

新一代語音識(shí)別：可徹底改變車內(nèi)體驗(yàn)的技術(shù)

汽車電子語音識(shí)別生物識(shí)別人工智能 | 2024-07-18

ARM嵌入式系統(tǒng)系列教程》多媒體教學(xué)課件示例5.1～5.8

資源下載 ARM ARM 嵌入式系統(tǒng) 教學(xué)課件 | 2007-12-23

利用MEMS麥克風(fēng)陣列定位并識(shí)別音頻或語音信源的技術(shù)方案

設(shè)計(jì)方案 ARM處理器 MEMS STM32F4 語音識(shí)別 | 2015-03-23

COS，我們自己的手機(jī)系統(tǒng)

jobs | 2014-01-18

告訴你怎么報(bào)考嵌入式系統(tǒng)設(shè)計(jì)師

dolphin | 2014-06-12

基于Vxwoks OS的嵌入式系統(tǒng)開發(fā) 上

視頻 Vxwoks 嵌入式系統(tǒng) | 2009-10-22

嵌入式系統(tǒng)的外設(shè)器件選擇

嵌入式系統(tǒng) 嵌入式系統(tǒng) 外設(shè)器件 | 2024-03-28

CCF專家：嵌入式系統(tǒng)技術(shù)推動(dòng)傳統(tǒng)行業(yè)“數(shù)智化”升級(jí)

嵌入式系統(tǒng) 嵌入式系統(tǒng) embedded world 上海國(guó)際嵌入式展 | 2024-05-14

《嵌入式系統(tǒng)設(shè)計(jì)》2-嵌入式系統(tǒng)與桌面系統(tǒng)(處理器技術(shù)到I2C)

視頻嵌入式系統(tǒng) MCU | 2010-02-02

STM32全球在線峰會(huì)：揭示2024年嵌入式系統(tǒng)三大趨勢(shì)

嵌入式系統(tǒng) STM32 嵌入式系統(tǒng) | 2024-04-16

Linux系統(tǒng)中的調(diào)度器策略

嵌入式系統(tǒng) Linux 嵌入式系統(tǒng) | 2024-06-26

MMU原理

資源下載 ARM 嵌入式系統(tǒng) MMU 存儲(chǔ)管理單元 | 2008-01-03

嵌入式系統(tǒng)的創(chuàng)新：RTOS與MCU的協(xié)同運(yùn)作

嵌入式系統(tǒng) 嵌入式系統(tǒng) RTOS MCU Green Hills 意法半導(dǎo)體 | 2024-07-10

Nuance語音識(shí)別技術(shù)

設(shè)計(jì)方案語音識(shí)別 Nuance 消費(fèi)電子 | 2015-02-03

基于Vxwoks OS的嵌入式系統(tǒng)開發(fā) 下

視頻 Vxwoks 嵌入式系統(tǒng) | 2009-10-22

MMU原理

資源下載 ARM 嵌入式系統(tǒng) MMU 存儲(chǔ)管理單元 | 2008-01-03

嵌入式系統(tǒng)電子書

Hugo801122 | 2014-06-04

嵌入式系統(tǒng)構(gòu)建

資源下載 ARM 嵌入式系統(tǒng) 構(gòu)建 | 2007-12-15

嵌入式uCOS-II學(xué)習(xí)教程—需要的帶走吧

南盜 | 2014-09-10

電源電壓在嵌入式系統(tǒng)中的精確控制應(yīng)用

設(shè)計(jì)方案電源電壓嵌入式系統(tǒng) 控制 | 2014-05-13

優(yōu)化嵌入式PC的性能

設(shè)計(jì)方案嵌入式PC 嵌入式系統(tǒng) | 2014-12-31

EasyARM1138嵌入式專題講座

視頻 ARM 嵌入式系統(tǒng) Cortex-M3 | 2009-12-02

RISC-V 開源芯片新紀(jì)元：毛德操新書發(fā)布，共筑中國(guó)芯未來

嵌入式系統(tǒng) RISC-V 新書發(fā)布會(huì) 開源嵌入式系統(tǒng) | 2024-06-18

利用 I3C 提升嵌入式系統(tǒng)

物聯(lián)網(wǎng)與傳感器 I3C 嵌入式系統(tǒng) | 2024-07-09

《嵌入式系統(tǒng)設(shè)計(jì)》1-說明及嵌入式系統(tǒng)與桌面系統(tǒng)(到處理器技術(shù))

視頻嵌入式系統(tǒng) MCU | 2010-02-02

STM32揭示2024年嵌入式系統(tǒng)三大趨勢(shì)

嵌入式系統(tǒng) 202405 STM32 嵌入式系統(tǒng) | 2024-05-15

基于STM32智能家居系統(tǒng)的設(shè)計(jì)與實(shí)現(xiàn)

設(shè)計(jì)方案 STM32 語音識(shí)別服務(wù)器智能家居 | 2015-03-21

示波器基本原理及操作（硬件工程師基本功）泰克高級(jí)工程師作品

Hugo801122 | 2014-03-21

2024年嵌入式系統(tǒng)的三大重要趨勢(shì)

嵌入式系統(tǒng) 嵌入式系統(tǒng) 意法半導(dǎo)體 | 2024-04-21

ARM 的嵌入式系統(tǒng)程序開發(fā)要點(diǎn)

資源下載 ARM 嵌入式系統(tǒng) 程序開發(fā) | 2007-12-20

焦點(diǎn)

推薦視頻

技術(shù)專區(qū)

看屁屁www成人影院,亚洲人妻成人图片,亚洲精品成人午夜在线,日韩在线欧美成人 (function(){ var bp = document.createElement('script'); var curProtocol = window.location.protocol.split(':')[0]; if (curProtocol === 'https') { bp.src = 'https://zz.bdstatic.com/linksubmit/push.js'; } else { bp.src = 'http://push.zhanzhang.baidu.com/push.js'; } var s = document.getElementsByTagName("script")[0]; s.parentNode.insertBefore(bp, s); })();