基于STM32的嵌入式語音識別模塊設(shè)計
3.3 對話管理單元設(shè)計
為了方便進(jìn)行對話的管理,本文中設(shè)計了一個對話管理單元,用于對等待識別的語句和等待執(zhí)行的命令進(jìn)行存儲,在主控制器中通過定義二維數(shù)組來實現(xiàn)。LD3320每次識別最多可以設(shè)置50項候選識別句,每個識別句可以是單字、詞組或短句,長度為不超過10個漢字或者79個字節(jié)的拼音串。基于上述原因,本文設(shè)計的對話管理數(shù)組如表3所列。本文引用地址:http://www.ex-cimer.com/article/150932.htm
行為數(shù)組中存儲要執(zhí)行的行為編號,對應(yīng)于50條語音識別語句,共有50組指令,每組指令中可以最多包含6個行為,并行的行為可以歸為一步,通過多個行為的組合,就可以完成更復(fù)雜的任務(wù)。
4 性能測試與應(yīng)用
為了保證設(shè)計的語音識別模塊的語音識別率、穩(wěn)定性和響應(yīng)時間,本文對所描述的語音識別模塊做了相應(yīng)的測試,測試環(huán)境分別為安靜的家庭環(huán)境和嘈雜的醫(yī)院環(huán)境,共8條語音指令,對每條語音指令分別進(jìn)行10次測試,每個環(huán)境下對每個特定人的總實驗次數(shù)為80次,記錄成功識別的次數(shù)。測試結(jié)果如表4所列。
測試中的3個非特定人中,非特定人1為女性,非特定人2和非特定人3為男性。由表中數(shù)據(jù)可以看出,家庭環(huán)境下對非特定人的語音識別率可達(dá)到90%以上,嘈雜的醫(yī)院環(huán)境下的語音識別率也可達(dá)82.5%以上。識別率方面,在嘈雜環(huán)境下比在安靜環(huán)境下的語音識別率有所降低;穩(wěn)定性方面,在安靜環(huán)境下系統(tǒng)的穩(wěn)定性較好,語音說1遍,最多說2遍模塊就可以做出正確的響應(yīng);在噪聲環(huán)境下,系統(tǒng)的穩(wěn)定性有所下降,個別語音命令需要說3遍甚至3遍以上才能被模塊準(zhǔn)確識別;實時性方面,在安靜環(huán)境下的語音能保證系統(tǒng)響應(yīng)的實時性,響應(yīng)時間一般不超過1 s,在噪聲環(huán)境下的響應(yīng)時間相對長一些。
結(jié)語
本文討論了基于STM32的嵌入式語音識別模塊的設(shè)計和實現(xiàn),對模塊各個組成單元的硬件電路及軟件實現(xiàn)進(jìn)行了詳細(xì)的介紹。大量實驗及實際應(yīng)用表明,本文設(shè)計的語音識別模塊具有穩(wěn)定性好、語音識別率高、抗噪聲干擾能力強、結(jié)構(gòu)簡單和使用方便等特點。該模塊實用性
強,可廣泛應(yīng)用于服務(wù)機器人智能空間、智能家居和消費電子產(chǎn)品等多個領(lǐng)域。
評論