智能機(jī)器人語音識(shí)別技術(shù)
3 機(jī)器人控制
機(jī)器人由自然條件下的語句進(jìn)行控制。這些語句描述了動(dòng)作的方向,以及動(dòng)作的幅度。為了簡單起見,讓機(jī)器人只執(zhí)行簡單命令。由手機(jī)進(jìn)行遙控,DSP模塊識(shí)別出語音命令,送控制命令到ARM模塊,驅(qū)動(dòng)左右機(jī)械輪執(zhí)行相應(yīng)動(dòng)作。
3.1 硬件結(jié)構(gòu)
機(jī)器人的硬件結(jié)構(gòu)如圖4所示。本文引用地址:http://www.ex-cimer.com/article/161779.htm
機(jī)器人主要有2大模塊,一個(gè)是基于DSP的語音識(shí)別模塊;另一個(gè)是基于ARM的控制模塊,其機(jī)械足為兩滑輪。由語音識(shí)別模塊識(shí)別語音,由控制模塊控制機(jī)器人動(dòng)作。
3.2 語音控制
首先根據(jù)需要,設(shè)置了如下幾個(gè)簡單命令:前、后、左、右。機(jī)器人各狀態(tài)之間的轉(zhuǎn)移關(guān)系如圖5所示。其中,等待狀態(tài)為默認(rèn)狀態(tài),當(dāng)每次執(zhí)行前后或左右轉(zhuǎn)命令后停止,即回到等待狀態(tài),此時(shí)為靜止?fàn)顟B(tài)。
語音的訓(xùn)練模板庫由4個(gè)命令加10個(gè)阿拉伯?dāng)?shù)字共14個(gè)組成,如下所示。
命令:“前”、“后”、“左”、“右”;
數(shù)字:“0~9”。
命令代表動(dòng)作的方向,數(shù)字代表動(dòng)作的幅度。當(dāng)執(zhí)行前后命令時(shí),數(shù)字的單位為dm,執(zhí)行左右轉(zhuǎn)彎命令時(shí),數(shù)字的單位為角度單位的20°。每句命令句法為命令+數(shù)字。例如,語音“左2”表示的含義為向左轉(zhuǎn)彎40°,“前4”表示向前直行4 dm。
機(jī)器人語音控制的關(guān)鍵在于語音識(shí)別的準(zhǔn)確率。表1給出了5個(gè)男聲樣本的識(shí)別統(tǒng)計(jì)結(jié)果。
4 結(jié)語
工作中,成功地將CHMM模型應(yīng)用于定點(diǎn)DSP上,并實(shí)現(xiàn)了對機(jī)器人的語音控制。解決了CHMM模型巨大計(jì)算量及精度與實(shí)時(shí)性之間的矛盾。提出了一種新的端點(diǎn)檢測算法,對于對抗短時(shí)或較低能量的環(huán)境噪音具有明顯效果。同時(shí)需要指出的是,當(dāng)語音識(shí)別指令增多時(shí),則需要定義更多的句法,并且識(shí)別率也可能會(huì)相應(yīng)降低,計(jì)算量也會(huì)相應(yīng)變大。下一步研究工作應(yīng)更注重提高大詞匯量時(shí)的識(shí)別率及其魯棒性。
評(píng)論