<meter id="pryje"><nav id="pryje"><delect id="pryje"></delect></nav></meter>
          <label id="pryje"></label>

          新聞中心

          EEPW首頁 > 嵌入式系統(tǒng) > 設(shè)計應(yīng)用 > 基于嵌入式Linux的語音識別系統(tǒng)硬軟件設(shè)計

          基于嵌入式Linux的語音識別系統(tǒng)硬軟件設(shè)計

          作者: 時間:2015-08-01 來源:網(wǎng)絡(luò) 收藏

            該設(shè)計運用三星公司的S3C2440,結(jié)合ICRoute公司的高性能芯片LD3320,進行了系統(tǒng)的硬件和軟件設(shè)計。在嵌入式操作系統(tǒng)下,運用多進程機制完成了對芯片、超聲波測距和云臺的控制,并將語音識別技術(shù)應(yīng)用于多角度超聲波測距系統(tǒng)中。通過測試,系統(tǒng)可以通過識別語音指令控制測量方向,無需手動干預(yù),最后將測量結(jié)果通過語音播放出來。

          本文引用地址:http://www.ex-cimer.com/article/278135.htm

            1.引言

            語言是人類傳播信息的重要手段,語音識別則是實現(xiàn)語音控制的關(guān)鍵技術(shù)。采用嵌入式語音識別技術(shù)使得設(shè)備具有功耗低、使用簡便、靈活等優(yōu)點,擺脫了復(fù)雜按鍵和按鈕的困擾,在服務(wù)機器人、智能家居及消費電子等領(lǐng)域發(fā)揮著重要作用。

            2.系統(tǒng)構(gòu)成與原理

            語音識別主要包括兩個階段:訓(xùn)練階段和識別階段。在訓(xùn)練或識別過程中,都必須對輸入語音進行預(yù)處理和特征提取。訓(xùn)練階段通過用戶輸入的若干次訓(xùn)練語音,經(jīng)過預(yù)處理和特征提取后得到特征參數(shù),最后通過特征參數(shù)建模,進而建立訓(xùn)練語音的參考模型庫。而識別階段是將輸入語音的特征矢量參數(shù)和參考模型庫中的參考模型進行相似性度量,然后把相似度最高的輸入特征矢量作為識別結(jié)果輸出,從而達到語音識別目的,如圖1所示。

            

           

            圖1語音識別原理框圖

            語音識別技術(shù)可分為:特定人識別和非特定人識別兩種。特定人識別是指需要對待識別人的語音進行采集訓(xùn)練,識別對象為專門的人;非特定人識別是指識別對象為大多數(shù)用戶,一般要采集多個人的語音進行錄音、訓(xùn)練和學(xué)習(xí),從而達到較高的識別率。

            在實際應(yīng)用中,現(xiàn)代技術(shù)開發(fā)嵌入式語音識別有兩種實現(xiàn)方式:調(diào)入嵌入式語音開發(fā)包和外擴語音識別芯片。本文的語音識別系統(tǒng)方案是以嵌入式處理器S3C2440為核心,外擴非特定人語音識別芯片LD3320,并將超聲波測距模塊和云臺相結(jié)合作為系統(tǒng)的機械執(zhí)行機構(gòu)。系統(tǒng)測量過程如下:首先根據(jù)語音指令控制兩自由度云臺的位姿,使超聲波探測器指向特定方向,然后開啟超聲波探測器,測量出前方障礙物距離,最后將測量結(jié)果轉(zhuǎn)化為可以播放的二進制數(shù)據(jù)流,通過LD3320的播放功能完成數(shù)據(jù)的播放。

            3.硬件電路設(shè)計方案

            硬件電路主要包括語音識別部分、主控部分、超聲波測距部分和舵機控制部分,如圖2所示。處理器為三星公司的S3C2440,系統(tǒng)主頻最高可達533 MHz,支持SPI、I2C、UART等接口,能夠滿足控制系統(tǒng)的需求。主控芯片S3C2440通過SPI總線完成對語音識別模塊的讀寫操作,超聲波測距部分和舵機控制部分由處理器的GPIO進行統(tǒng)一控制。

            

           

            圖2硬件電路設(shè)計方案

            3.1語音識別電路設(shè)計

            為了使系統(tǒng)能夠識別操作人員發(fā)出的語音指令,設(shè)計中采用了由ICRoute公司設(shè)計生產(chǎn)的非特定人語音識別芯片LD3320,它集成了語音識別處理電路和一些外部電路,包括AD、DA轉(zhuǎn)換器、麥克風(fēng)接口、聲音輸出接口等,不需要外接任何的輔助芯片如Flash、RAM.在主控制器的控制下,可以識別出預(yù)先添加到識別列表中的內(nèi)容。設(shè)計中參考了ICRoute發(fā)布的LD3320數(shù)據(jù)手冊,圖中LD3320的P0、P1、P2引腳通過SPI接口與嵌入式處理器相接,控制信號WRB、CSB、RSTB以及中斷返回信號引腳INTB與處理器S3C2440直接相連,如圖3所示。

            

           

            圖3語音模塊和核心板連接關(guān)系

            3.2超聲波測距和舵機控制電路設(shè)計

            超聲波測距原理相對比較成熟,系統(tǒng)中采用超聲波測距模塊HC-SR04.該模塊有兩個TTL電平通信引腳,兼容3.3V電平。其中,控制端口Trig發(fā)一個10us以上的高電平,接收端口Echo將輸出與距離成正比的高電平信號。當(dāng)Echo有高電平輸出時就開啟處理器定時器,當(dāng)端口電平跳變?yōu)榈碗娖綍r關(guān)閉定時器,根據(jù)定時器的值可計算得到障礙物的距離。其中,控制端口Trig和接收端口Echo分別接至處理器的GPG9、GPG6引腳。

            超聲波測距模塊的感應(yīng)角度小于15°,為了擴大測距的感應(yīng)角度范圍,將超聲波測距模塊安裝在兩自由度云臺上,其中,舵機為SG90(9G),旋轉(zhuǎn)角度為180°。處理器通過GPB0和GPB1分別控制兩個舵機以實現(xiàn)云臺的旋轉(zhuǎn),以測量不同方向的障礙物,如圖4所示。

            

           

            圖4超聲波測距和舵機控制電路

            4.軟件設(shè)計方案

            系統(tǒng)軟件基于嵌入式操作系統(tǒng),實現(xiàn)了語音識別、語音播放、超聲波測距和舵機控制等任務(wù),使用fock機制為每項任務(wù)分配獨立的進程,使系統(tǒng)可以進行多任務(wù)處理。針對不同功能模塊編寫了相應(yīng)的底層驅(qū)動程序,為上層應(yīng)用程序提供了調(diào)用接口。

            系統(tǒng)工作流程如下:處理器通過SPI總線對語音識別芯片LD3320進行通用初始化,使語音識別芯片進入循環(huán)識別模式,系統(tǒng)處理器反復(fù)啟動語音識別過程。如果有識別結(jié)果,則根據(jù)識別作相應(yīng)處理后(比如播放某個聲音作為應(yīng)答)再啟動下一個識別過程。處理器通過SPI總線讀取C5寄存器的識別結(jié)果并分析,將語音命令轉(zhuǎn)換為超聲波測距和舵機的控制信號,完成多方位測距任務(wù),如圖5所示。

            

           

            圖5軟件流程圖

          linux操作系統(tǒng)文章專題:linux操作系統(tǒng)詳解(linux不再難懂)

          linux相關(guān)文章:linux教程



          上一頁 1 2 下一頁

          關(guān)鍵詞: Linux 語音識別

          評論


          相關(guān)推薦

          技術(shù)專區(qū)

          關(guān)閉
          看屁屁www成人影院,亚洲人妻成人图片,亚洲精品成人午夜在线,日韩在线 欧美成人 (function(){ var bp = document.createElement('script'); var curProtocol = window.location.protocol.split(':')[0]; if (curProtocol === 'https') { bp.src = 'https://zz.bdstatic.com/linksubmit/push.js'; } else { bp.src = 'http://push.zhanzhang.baidu.com/push.js'; } var s = document.getElementsByTagName("script")[0]; s.parentNode.insertBefore(bp, s); })();