基于STM32的嵌入式語音識別模塊設計
3 軟件系統(tǒng)設計
軟件系統(tǒng)的設計主要包括3部分:主控單元的嵌入式操作系統(tǒng)μC/OS-II移植、LD3320的語音識別程序設計、對話管理單元的設計。
3.1 嵌入式操作系統(tǒng)μC/OS-II移植
μC/OS-II是一個源碼公開、可移植、可固化、可裁剪、占先式的實時多任務操作系統(tǒng)。它是專門為計算機的嵌入式應用設計的,絕大部分代碼采用C語言編寫,具有執(zhí)行效率高、占用空間小、實時性能優(yōu)良和可擴展性強等特點,最小內核可至2 KB。在μC/OS-II中,任務的概念尤為重要,它是可剝奪型的內核,因此任務優(yōu)先級的劃分至關緊要。基于分層化和模塊化的設計理念,整個系統(tǒng)任務的劃分如表1所列。本文引用地址:http://www.ex-cimer.com/article/150932.htm
表1中除OSTaskStat和OSTaskIdle任務為系統(tǒng)自帶,其他7個任務均為用戶創(chuàng)建。App_TaskStart是系統(tǒng)的第一個任務,對系統(tǒng)時鐘和底層設備進行初始化,創(chuàng)建所有事件和其他各項用戶任務,并對系統(tǒng)狀態(tài)進行監(jiān)測;App_TaskSR完成語音識別;App_TaskCmd完成對話集中命令的解析和執(zhí)行,并通過USART1向外發(fā)送;App_TaskCom作為外圍擴展任務,通過USART2向外發(fā)送指令或數(shù)據(jù),負責控制外圍擴展設備,如語音合成設備等;
App_TaskUpdate通過解析USART1接收的命令和數(shù)據(jù)進行對話集的更新;App_TaskPB是按鍵掃描任務,負責檢測3個獨立按鍵,分為短按和長按檢測;App_TaskLed驅動4個LED指示燈,指示當前工作狀態(tài)。
3.2 語音識別程序設計
語音識別程序的設計,參考了LD332X開發(fā)手冊,本文中采用中斷方式工作,其工作流程分為通用初始化一語音識別用初始化-寫入識別列表-開始識別-響應中斷。
①通用初始化和語音識別用初始化。在初始化程序里,主要完成軟復位、模式設定、時鐘頻率設定、FIFO設定。
②寫入識別列表。列表的規(guī)則是,每個識別條目對應一個特定的編號(1個字節(jié)),編號可以相同,可以不連續(xù),但是數(shù)值要小于256(00H~FFH)。本芯片最多支持50個識別條目,每個識別條目是標準普通話的漢語拼音(小寫),每2個字(漢語拼音)之間用一個空格間隔。本文中采取了連續(xù)不同編號的識別條目,表2是簡單的示例。
③開始識別。設置幾個相關的寄存器,即可開始語音的識別。圖4是相關的流程。ADC通道即為麥克風輸入通道,ADC增益也就是麥克風音量,可設定值00H~7FH,建議設置值為40H~6FH,值越大代表MIC音量越大,識別啟動越敏感,但可能帶來更多誤識別;值越小代表MIC音量越小,需要近距離說話才能啟動識別功能,好處是對遠處的干擾語音沒有反應。本文中設定值為43H。
④響應中斷。如果麥克風采集到聲音,不管是否識別出正常結果,都會產(chǎn)生一個中斷信號。而中斷程序要根據(jù)寄存器的值分析結果。讀取BA寄存器的值,可以知道有幾個候選答案,而C5寄存器里的答案是得分最高、最可能正確的答案。
評論