基于STM32的嵌入式語音識別模塊設(shè)計

作者：時間：2011-03-23 來源：網(wǎng)絡(luò)

加入技術(shù)交流群
- 掃碼加入
  和技術(shù)大咖面對面交流
  海量資料庫查詢

3．3 對話管理單元設(shè)計
為了方便進(jìn)行對話的管理，本文中設(shè)計了一個對話管理單元，用于對等待識別的語句和等待執(zhí)行的命令進(jìn)行存儲，在主控制器中通過定義二維數(shù)組來實現(xiàn)。LD3320每次識別最多可以設(shè)置50項候選識別句，每個識別句可以是單字、詞組或短句，長度為不超過10個漢字或者79個字節(jié)的拼音串。基于上述原因，本文設(shè)計的對話管理數(shù)組如表3所列。

本文引用地址：http://www.ex-cimer.com/article/150932.htm

行為數(shù)組中存儲要執(zhí)行的行為編號，對應(yīng)于50條語音識別語句，共有50組指令，每組指令中可以最多包含6個行為，并行的行為可以歸為一步，通過多個行為的組合，就可以完成更復(fù)雜的任務(wù)。

4 性能測試與應(yīng)用
為了保證設(shè)計的語音識別模塊的語音識別率、穩(wěn)定性和響應(yīng)時間，本文對所描述的語音識別模塊做了相應(yīng)的測試，測試環(huán)境分別為安靜的家庭環(huán)境和嘈雜的醫(yī)院環(huán)境，共8條語音指令，對每條語音指令分別進(jìn)行10次測試，每個環(huán)境下對每個特定人的總實驗次數(shù)為80次，記錄成功識別的次數(shù)。測試結(jié)果如表4所列。

測試中的3個非特定人中，非特定人1為女性，非特定人2和非特定人3為男性。由表中數(shù)據(jù)可以看出，家庭環(huán)境下對非特定人的語音識別率可達(dá)到90％以上，嘈雜的醫(yī)院環(huán)境下的語音識別率也可達(dá)82．5％以上。識別率方面，在嘈雜環(huán)境下比在安靜環(huán)境下的語音識別率有所降低；穩(wěn)定性方面，在安靜環(huán)境下系統(tǒng)的穩(wěn)定性較好，語音說1遍，最多說2遍模塊就可以做出正確的響應(yīng)；在噪聲環(huán)境下，系統(tǒng)的穩(wěn)定性有所下降，個別語音命令需要說3遍甚至3遍以上才能被模塊準(zhǔn)確識別；實時性方面，在安靜環(huán)境下的語音能保證系統(tǒng)響應(yīng)的實時性，響應(yīng)時間一般不超過1 s，在噪聲環(huán)境下的響應(yīng)時間相對長一些。

結(jié)語
本文討論了基于 STM32的嵌入式語音識別模塊的設(shè)計和實現(xiàn)，對模塊各個組成單元的硬件電路及軟件實現(xiàn)進(jìn)行了詳細(xì)的介紹。大量實驗及實際應(yīng)用表明，本文設(shè)計的語音識別模塊具有穩(wěn)定性好、語音識別率高、抗噪聲干擾能力強、結(jié)構(gòu)簡單和使用方便等特點。該模塊實用性
強，可廣泛應(yīng)用于服務(wù)機器人智能空間、智能家居和消費電子產(chǎn)品等多個領(lǐng)域。

linux操作系統(tǒng)文章專題:linux操作系統(tǒng)詳解（linux不再難懂）

新聞中心

基于STM32的嵌入式語音識別模塊設(shè)計

評論

相關(guān)推薦

技術(shù)專區(qū)