基于嵌入式Linux的語音識(shí)別系統(tǒng)硬軟件設(shè)計(jì)

作者：時(shí)間：2015-08-01 來源：網(wǎng)絡(luò)

加入技術(shù)交流群
- 掃碼加入
  和技術(shù)大咖面對(duì)面交流
  海量資料庫查詢

　　該設(shè)計(jì)運(yùn)用三星公司的S3C2440，結(jié)合ICRoute公司的高性能語音識(shí)別芯片LD3320，進(jìn)行了語音識(shí)別系統(tǒng)的硬件和軟件設(shè)計(jì)。在嵌入式Linux操作系統(tǒng)下，運(yùn)用多進(jìn)程機(jī)制完成了對(duì)語音識(shí)別芯片、超聲波測(cè)距和云臺(tái)的控制，并將語音識(shí)別技術(shù)應(yīng)用于多角度超聲波測(cè)距系統(tǒng)中。通過測(cè)試，系統(tǒng)可以通過識(shí)別語音指令控制測(cè)量方向，無需手動(dòng)干預(yù)，最后將測(cè)量結(jié)果通過語音播放出來。

本文引用地址：http://www.ex-cimer.com/article/278135.htm

　　1.引言

　　語言是人類傳播信息的重要手段，語音識(shí)別則是實(shí)現(xiàn)語音控制的關(guān)鍵技術(shù)。采用嵌入式語音識(shí)別技術(shù)使得設(shè)備具有功耗低、使用簡(jiǎn)便、靈活等優(yōu)點(diǎn)，擺脫了復(fù)雜按鍵和按鈕的困擾，在服務(wù)機(jī)器人、智能家居及消費(fèi)電子等領(lǐng)域發(fā)揮著重要作用。

　　2.系統(tǒng)構(gòu)成與原理

　　語音識(shí)別主要包括兩個(gè)階段：訓(xùn)練階段和識(shí)別階段。在訓(xùn)練或識(shí)別過程中，都必須對(duì)輸入語音進(jìn)行預(yù)處理和特征提取。訓(xùn)練階段通過用戶輸入的若干次訓(xùn)練語音，經(jīng)過預(yù)處理和特征提取后得到特征參數(shù)，最后通過特征參數(shù)建模，進(jìn)而建立訓(xùn)練語音的參考模型庫。而識(shí)別階段是將輸入語音的特征矢量參數(shù)和參考模型庫中的參考模型進(jìn)行相似性度量，然后把相似度最高的輸入特征矢量作為識(shí)別結(jié)果輸出，從而達(dá)到語音識(shí)別目的，如圖1所示。

　　圖1語音識(shí)別原理框圖

　　語音識(shí)別技術(shù)可分為：特定人識(shí)別和非特定人識(shí)別兩種。特定人識(shí)別是指需要對(duì)待識(shí)別人的語音進(jìn)行采集訓(xùn)練，識(shí)別對(duì)象為專門的人;非特定人識(shí)別是指識(shí)別對(duì)象為大多數(shù)用戶，一般要采集多個(gè)人的語音進(jìn)行錄音、訓(xùn)練和學(xué)習(xí)，從而達(dá)到較高的識(shí)別率。

　　在實(shí)際應(yīng)用中，現(xiàn)代技術(shù)開發(fā)嵌入式語音識(shí)別有兩種實(shí)現(xiàn)方式：調(diào)入嵌入式語音開發(fā)包和外擴(kuò)語音識(shí)別芯片。本文的語音識(shí)別系統(tǒng)方案是以嵌入式處理器S3C2440為核心，外擴(kuò)非特定人語音識(shí)別芯片LD3320，并將超聲波測(cè)距模塊和云臺(tái)相結(jié)合作為系統(tǒng)的機(jī)械執(zhí)行機(jī)構(gòu)。系統(tǒng)測(cè)量過程如下：首先根據(jù)語音指令控制兩自由度云臺(tái)的位姿，使超聲波探測(cè)器指向特定方向，然后開啟超聲波探測(cè)器，測(cè)量出前方障礙物距離，最后將測(cè)量結(jié)果轉(zhuǎn)化為可以播放的二進(jìn)制數(shù)據(jù)流，通過LD3320的播放功能完成數(shù)據(jù)的播放。

　　3.硬件電路設(shè)計(jì)方案

　　硬件電路主要包括語音識(shí)別部分、主控部分、超聲波測(cè)距部分和舵機(jī)控制部分，如圖2所示。處理器為三星公司的S3C2440，系統(tǒng)主頻最高可達(dá)533 MHz，支持SPI、I2C、UART等接口，能夠滿足控制系統(tǒng)的需求。主控芯片S3C2440通過SPI總線完成對(duì)語音識(shí)別模塊的讀寫操作，超聲波測(cè)距部分和舵機(jī)控制部分由處理器的GPIO進(jìn)行統(tǒng)一控制。

　　圖2硬件電路設(shè)計(jì)方案

　　3.1語音識(shí)別電路設(shè)計(jì)

　　為了使系統(tǒng)能夠識(shí)別操作人員發(fā)出的語音指令，設(shè)計(jì)中采用了由ICRoute公司設(shè)計(jì)生產(chǎn)的非特定人語音識(shí)別芯片LD3320，它集成了語音識(shí)別處理電路和一些外部電路，包括AD、DA轉(zhuǎn)換器、麥克風(fēng)接口、聲音輸出接口等，不需要外接任何的輔助芯片如Flash、RAM.在主控制器的控制下，可以識(shí)別出預(yù)先添加到識(shí)別列表中的內(nèi)容。設(shè)計(jì)中參考了ICRoute發(fā)布的LD3320數(shù)據(jù)手冊(cè)，圖中LD3320的P0、P1、P2引腳通過SPI接口與嵌入式處理器相接，控制信號(hào)WRB、CSB、RSTB以及中斷返回信號(hào)引腳INTB與處理器S3C2440直接相連，如圖3所示。

　　圖3語音模塊和核心板連接關(guān)系

　　3.2超聲波測(cè)距和舵機(jī)控制電路設(shè)計(jì)

　　超聲波測(cè)距原理相對(duì)比較成熟，系統(tǒng)中采用超聲波測(cè)距模塊HC-SR04.該模塊有兩個(gè)TTL電平通信引腳，兼容3.3V電平。其中，控制端口Trig發(fā)一個(gè)10us以上的高電平，接收端口Echo將輸出與距離成正比的高電平信號(hào)。當(dāng)Echo有高電平輸出時(shí)就開啟處理器定時(shí)器，當(dāng)端口電平跳變?yōu)榈碗娖綍r(shí)關(guān)閉定時(shí)器，根據(jù)定時(shí)器的值可計(jì)算得到障礙物的距離。其中，控制端口Trig和接收端口Echo分別接至處理器的GPG9、GPG6引腳。

　　超聲波測(cè)距模塊的感應(yīng)角度小于15°，為了擴(kuò)大測(cè)距的感應(yīng)角度范圍，將超聲波測(cè)距模塊安裝在兩自由度云臺(tái)上，其中，舵機(jī)為SG90(9G)，旋轉(zhuǎn)角度為180°。處理器通過GPB0和GPB1分別控制兩個(gè)舵機(jī)以實(shí)現(xiàn)云臺(tái)的旋轉(zhuǎn)，以測(cè)量不同方向的障礙物，如圖4所示。

　　圖4超聲波測(cè)距和舵機(jī)控制電路

　　4.軟件設(shè)計(jì)方案

　　系統(tǒng)軟件基于嵌入式Linux操作系統(tǒng)，實(shí)現(xiàn)了語音識(shí)別、語音播放、超聲波測(cè)距和舵機(jī)控制等任務(wù)，使用fock機(jī)制為每項(xiàng)任務(wù)分配獨(dú)立的進(jìn)程，使系統(tǒng)可以進(jìn)行多任務(wù)處理。針對(duì)不同功能模塊編寫了相應(yīng)的底層驅(qū)動(dòng)程序，為上層應(yīng)用程序提供了調(diào)用接口。

　　系統(tǒng)工作流程如下：處理器通過SPI總線對(duì)語音識(shí)別芯片LD3320進(jìn)行通用初始化，使語音識(shí)別芯片進(jìn)入循環(huán)識(shí)別模式，系統(tǒng)處理器反復(fù)啟動(dòng)語音識(shí)別過程。如果有識(shí)別結(jié)果，則根據(jù)識(shí)別作相應(yīng)處理后(比如播放某個(gè)聲音作為應(yīng)答)再啟動(dòng)下一個(gè)識(shí)別過程。處理器通過SPI總線讀取C5寄存器的識(shí)別結(jié)果并分析，將語音命令轉(zhuǎn)換為超聲波測(cè)距和舵機(jī)的控制信號(hào)，完成多方位測(cè)距任務(wù)，如圖5所示。