ARM為核心的嵌入式語音識別電路模塊設計
服務機器人以服務為目的,因此人們需要一種更方便、更自然、更加人性化的方式與機器人交互,而不再滿足于復雜的鍵盤和按鈕操作?;诼犛X的人機交互是該領域的一個重要發(fā)展方向。目前主流的語音識別技術是基于統(tǒng)計模式。然而,由于統(tǒng)計模型訓練算法復雜,運算量大,一般由工控機、PC機或筆記本來完成,這無疑限制了它的運用。嵌入式語音交互已成為目前研究的熱門課題。 嵌入式語音識別系統(tǒng)和PC機的語音識別系統(tǒng)相比,雖然其運算速度和內(nèi)存容量有一定限制,但它具有體積小、功耗低、可靠性高、投入小、安裝靈活等優(yōu)點,特別適用于智能家居、機器人及消費電子等領域。
本文引用地址:http://www.ex-cimer.com/article/201611/340136.htm模塊的核心處理單元選用ST公司的基于ARM Cortex-M3內(nèi)核的32位處理器STM32F103C8T6。本模塊以對話管理單元為中心,通過以LD3320芯片為核心的硬件單元實現(xiàn)語音識別功能,采用嵌入式操作系統(tǒng)μC/OS-II來實現(xiàn)統(tǒng)一的任務調(diào)度和外圍設備管理。經(jīng)過大量的實驗數(shù)據(jù)驗證,本文設計的語音識別模塊具有高實時性、高識別率、高穩(wěn)定性的優(yōu)點。
語音識別電路
圖3為語音識別部分原理圖,參照了ICRoute發(fā)布的LD3320數(shù)據(jù)手冊進行設計。LD3320的內(nèi)部集成了快速穩(wěn)定的優(yōu)化算法,不需外接Fla-sh、RAM,不需要用戶事先訓練和錄音而完成非特定人語音識別,識別準確率高。圖中,LD3320采用并行方式直接與STM32F103C8T6相接,均采用1kΩ電阻上拉,A0用于判斷是數(shù)據(jù)段還是地址段;控制信號,復位信號以及中斷返回信號INTB與STM32F103C8T6直接相連,采用10kΩ電阻上拉,輔助系統(tǒng)穩(wěn)定工作;和STM32F103C8T6采用同一個外部8 MHz時鐘;發(fā)光二極管D1、D2用于復位后的上電指示;MBS(引腳12)作為麥克風偏置,接了一個RC電路,保證能輸出一個浮動電壓給麥克風。
評論