基于A(yíng)RM的實(shí)時(shí)語(yǔ)音識(shí)別系統(tǒng)在家庭監(jiān)護(hù)機(jī)器人的實(shí)現(xiàn)
進(jìn)入90年代,隨著多媒體時(shí)代的來(lái)臨,迫切要求語(yǔ)音識(shí)別系統(tǒng)從實(shí)驗(yàn)室走向?qū)嵱谩TS多發(fā)達(dá)國(guó)家如美國(guó)、日本、韓國(guó)以及IBM、Apple、ATT、NTT等著名公司都為語(yǔ)音識(shí)別系統(tǒng)的實(shí)用化開(kāi)發(fā)研究投以巨資。IBM公司于1997年開(kāi)發(fā)出漢語(yǔ)ViaVoice語(yǔ)音識(shí)別系統(tǒng),次年又開(kāi)發(fā)出可以識(shí)別上海話(huà)、廣東話(huà)和四川話(huà)等地方口音的語(yǔ)音識(shí)別系統(tǒng)ViaVoice’98。目前市場(chǎng)上已經(jīng)出現(xiàn)了語(yǔ)音識(shí)別電話(huà)、語(yǔ)音識(shí)別記事本等產(chǎn)品,如美國(guó)VPTC公司的Voice Organizer和法國(guó)的Parrot等。
我國(guó)語(yǔ)音識(shí)別研究工作開(kāi)始的較晚,但近年來(lái)發(fā)展得很快,一直緊跟國(guó)際水平,國(guó)家也很重視,并把大詞匯量語(yǔ)音識(shí)別的研究列入“8 63”計(jì)劃,由中科院聲學(xué)所、自動(dòng)化所、清華大學(xué)電子工程系及北京大學(xué)等單位研究開(kāi)發(fā),取得了高水平的科研成果,如中科院自動(dòng)化所研制的非特定人、連續(xù)語(yǔ)音聽(tīng)寫(xiě)系統(tǒng)和漢語(yǔ)語(yǔ)音人機(jī)對(duì)話(huà)系統(tǒng),其字準(zhǔn)確率或系統(tǒng)響應(yīng)率可達(dá)90%以上。鑒于中國(guó)未來(lái)龐大的市場(chǎng),國(guó)外也非常重視漢語(yǔ)語(yǔ)音識(shí)別的研究。美國(guó)、新加坡等地聚集了一批來(lái)自大陸、臺(tái)灣、香港等地的學(xué)者,研究成果已達(dá)到相當(dāng)高水平。
1 系統(tǒng)設(shè)計(jì)
文中是家庭監(jiān)護(hù)機(jī)器人項(xiàng)目中的語(yǔ)音識(shí)別系統(tǒng)設(shè)計(jì)部分,設(shè)計(jì)目的是設(shè)計(jì)出一種可以識(shí)別語(yǔ)音的、協(xié)助監(jiān)護(hù)家庭行動(dòng)不方便人員的機(jī)器人。為實(shí)現(xiàn)該語(yǔ)音識(shí)別系統(tǒng),設(shè)計(jì)了語(yǔ)音識(shí)別系統(tǒng)總體結(jié)構(gòu)框圖,如圖1所示。
1.1 硬件設(shè)計(jì)
文中所研究和設(shè)計(jì)的功能,都是應(yīng)用在移動(dòng)機(jī)器人上的。因而系統(tǒng)的研究設(shè)計(jì)需要考慮到體積小、省電、便于移動(dòng)的特性,并需具有便于家庭用戶(hù)操作的友好顯示界面。對(duì)于語(yǔ)音識(shí)別部分,需要用到用于語(yǔ)音識(shí)別算法處理的處理器、語(yǔ)音采集電路和語(yǔ)音輸出電路,如圖2所示。其中語(yǔ)音識(shí)別算法運(yùn)算的處理器主要負(fù)責(zé)算法的運(yùn)算處理,相當(dāng)于機(jī)器人的大腦;語(yǔ)音采集電路負(fù)責(zé)采集外部的聲音信號(hào),相當(dāng)于機(jī)器人的耳朵;語(yǔ)音輸出電路負(fù)責(zé)輸出話(huà)語(yǔ)聲音,相當(dāng)于機(jī)器人的嘴巴。
1)語(yǔ)音識(shí)別算法處理器選擇
根據(jù)系統(tǒng)設(shè)計(jì)功能的要求,目前常用的語(yǔ)音識(shí)別芯片種類(lèi)一般有:?jiǎn)纹瑱C(jī)(MCU)、DSP和SoC(System on Circuit)。考慮到普通單片機(jī)(MCU)資源的緊缺及運(yùn)行速度較慢的缺點(diǎn),因而在本系統(tǒng)設(shè)計(jì)將不考慮使用單片機(jī)(MCU)作為語(yǔ)音識(shí)別的處理器。DSP包含用作數(shù)字信號(hào)處理的專(zhuān)用部件,運(yùn)算能力強(qiáng)、精度高,但目前DSP的價(jià)格比較高,同時(shí)考慮到本系統(tǒng)的特性,需要選擇一種既有較強(qiáng)的運(yùn)算能力,合適于語(yǔ)音識(shí)別的功能,并且能實(shí)現(xiàn)較好的用戶(hù)操作界面,并帶有文件系統(tǒng)(用于識(shí)別地圖)的功能,因而選擇DSP并不是明智之舉。目前Texas Instruments公司新推出的一款芯片OMAP3530,它具有雙內(nèi)核ARM CortexTM-A8的內(nèi)核和TMS320C64+TM DSP內(nèi)核,屬于高性能的OMAP35x架構(gòu)系列產(chǎn)品,滿(mǎn)足了系統(tǒng)設(shè)計(jì)的各種功能特性要求。
c++相關(guān)文章:c++教程
評(píng)論