<meter id="pryje"><nav id="pryje"><delect id="pryje"></delect></nav></meter>
          <label id="pryje"></label>

          新聞中心

          EEPW首頁(yè) > 嵌入式系統(tǒng) > 設(shè)計(jì)應(yīng)用 > 基于SPCE061A的語(yǔ)音識(shí)別系統(tǒng)的設(shè)計(jì)

          基于SPCE061A的語(yǔ)音識(shí)別系統(tǒng)的設(shè)計(jì)

          作者: 時(shí)間:2012-01-07 來(lái)源:網(wǎng)絡(luò) 收藏

          1引言

          語(yǔ)音識(shí)別技術(shù)就是讓機(jī)器通過(guò)識(shí)別和理解把語(yǔ)音信號(hào)轉(zhuǎn)變?yōu)橄鄳?yīng)的文本或命令的技術(shù)。語(yǔ)音識(shí)別是一門(mén)交叉學(xué)科,正逐步成為信息技術(shù)中人機(jī)接口的關(guān)鍵技術(shù),語(yǔ)音識(shí)別技術(shù)與語(yǔ)音合成技術(shù)的結(jié)合,使人們能夠甩掉鍵盤(pán),通過(guò)語(yǔ)音命令進(jìn)行操作。近年來(lái)語(yǔ)音學(xué)研究的深入和數(shù)字信號(hào)處理軟硬件技術(shù)的發(fā)展,語(yǔ)音技術(shù)的應(yīng)用己經(jīng)逐步具備走出實(shí)驗(yàn)室,服務(wù)于社會(huì)的能力。尤其在中小字表孤立詞語(yǔ)音識(shí)別技術(shù)已基本成熟,逐漸開(kāi)始應(yīng)用于家電產(chǎn)品、智能玩具等對(duì)識(shí)別率要求不是極其嚴(yán)格的領(lǐng)域。

          2 硬件系統(tǒng)的總體方案介紹

          本系統(tǒng)采用凌陽(yáng)作為主控芯片,并根據(jù)功能需求設(shè)計(jì)嵌入式的硬件。由于這是一款包含DSP功能并集成了戶(hù)A/D,D/A等一系列功能的語(yǔ)音處理專(zhuān)用SOC,模塊電路、外擴(kuò)存儲(chǔ)FLASH、LED顯示電路、通信模塊、功放和喇叭輸出模塊等。

          圖1 的硬件組成

          2.1電源電路

          采用低電壓供電方式,這可以大大降低芯片的功率損耗。其中,SPCE06lA的電源分兩種,即內(nèi)核電源(VDD)和I/O口電源(VDDH)。I/O口電源采用5V電壓,而內(nèi)核電源則為3.3V或者更低。降低芯片內(nèi)核電壓的目的主要還是降低芯片的功耗,同時(shí)也可以降低芯片的工作溫度,延長(zhǎng)芯片使用壽命。盡管這種語(yǔ)音芯片的工作電壓范圍很大,但是為了使芯片內(nèi)核運(yùn)行更加穩(wěn)定,同時(shí)又保證I/O口及外部擴(kuò)展部件的工作電壓要求,系統(tǒng)采取:

          AC220V電源通過(guò)AC10V進(jìn)行整流,利用以7805穩(wěn)壓集成塊為核心的電路,產(chǎn)生+5V電源,作為語(yǔ)音識(shí)別與播放模塊共同使用的電源。5V電源經(jīng)過(guò)TR1972-33得到DC3.3v為CPU核心供電。

          圖2 電源電路

          2.2存儲(chǔ)模塊部分電路設(shè)計(jì)

          因?yàn)?a class="contentlabel" href="http://www.ex-cimer.com/news/listbylabel/label/SPCE061A">SPCE061A的FLASH只有32Kwords,要存放大量的語(yǔ)音資源,就需要外擴(kuò)存儲(chǔ)器。系統(tǒng)使用的是一種用SIO擴(kuò)展串行存儲(chǔ)器的方法。本方案采用凌陽(yáng)公司的SPR4096芯片進(jìn)行設(shè)計(jì)。SPR4096是一個(gè)高性能的4M-bit(512K×8-bit)總線FLASH,分為256個(gè)扇區(qū)(sector)每個(gè)扇區(qū)為2K-byte。SPR4096還內(nèi)置了一個(gè)4K×8-bit的SRAM。在進(jìn)行FLASH的編程/擦除的時(shí)候,可以并發(fā)執(zhí)行SRAM的讀/寫(xiě)。SPR4096內(nèi)置了一個(gè)總線存儲(chǔ)器接口和一個(gè)串行接口,它允許單片機(jī)通過(guò)8-bit并行模式或者1-bit的串行模式訪問(wèn)FLASH SRAM存儲(chǔ)區(qū)。本例使用串行模式,其接口的工作頻率為5MHz。SPR4096有兩個(gè)電源輸入端VDDI和VDDQ。VDDI為內(nèi)部FLASH和控制邏輯供電;VDDQ專(zhuān)門(mén)為I/O供電。SPR4096最大讀電流為2mA,最大編程/擦除電流為6mA。

          2.3音頻輸出電路模塊

          放音利用的是SPCE06lA內(nèi)部集成的DAC,它是電流輸出,為了能夠驅(qū)動(dòng)揚(yáng)聲器SPEAKER放音需要相應(yīng)的驅(qū)動(dòng)電路。圖中的SPY0030單運(yùn)放是凌陽(yáng)公司的產(chǎn)品。與常用的單運(yùn)放LM386比,SPY0030的優(yōu)勢(shì)在如LM386的工作電壓需要在4v以上,而SPY0030只需要2.4v可工作,LM386的輸出功率在100mw以下,而SPY0030約為700mw,可以提供足夠的驅(qū)動(dòng)能力。音頻輸出電路如圖3所示。

          圖3 音頻輸出電路

          2.4 MIC輸入模塊

          SPCE061A的A/D轉(zhuǎn)換器有8個(gè)通道,其中有1個(gè)通道是MIC-NI輸入,它專(zhuān)門(mén)用于對(duì)語(yǔ)音信號(hào)進(jìn)行采樣。語(yǔ)音信號(hào)經(jīng)過(guò)MCI轉(zhuǎn)換成電信號(hào),然后輸入至SPCE061A內(nèi)部前置放大器。由于人們說(shuō)話時(shí),麥克風(fēng)距離嘴邊的距離不同,語(yǔ)音信號(hào)的能量將會(huì)有很大的差異,此時(shí),如果芯片的的輸入信號(hào)太大或是太小都將影響識(shí)別的精度。而SPCE06lA內(nèi)部就帶有自動(dòng)增益控制電路AGC能隨時(shí)跟蹤、監(jiān)視前置放大器輸出的音頻信號(hào)電平,當(dāng)輸入信號(hào)增大時(shí)AGC電路自動(dòng)減小放大器的增益;當(dāng)輸入信號(hào)減小時(shí),AGC電路自動(dòng)增大放大器的增益,從而以補(bǔ)償太小或是太大的信號(hào),以便使進(jìn)入戶(hù)A/D的信號(hào)保持在最佳電平,又可使削波減至最小。

          2.5通信接口電路

          單片機(jī)中的數(shù)據(jù)通過(guò)串口經(jīng)MAX232電平轉(zhuǎn)換成RS-232電平向上位傳輸。由于SPCE06lA的串行口都為T(mén)TL電平,它與RS-232C電平互不相容,所以在二者接口處,必須進(jìn)行電平轉(zhuǎn)換。利用MAX232芯片外接5V電源,外接電容,可產(chǎn)生正負(fù)10V的電源形成232C的收發(fā)器。本系統(tǒng)中設(shè)有通信電路是為將大量語(yǔ)音數(shù)據(jù)處理都需要上傳給PC,由PC完成。比如,噪聲能量和過(guò)零率的計(jì)算,數(shù)字濾波器設(shè)計(jì),模型庫(kù)的訓(xùn)練等。

          3軟件設(shè)計(jì)部分

          總體來(lái)說(shuō),本系統(tǒng)包含語(yǔ)音識(shí)別模塊的軟件設(shè)計(jì)和語(yǔ)音回放模塊的軟件設(shè)計(jì)。

          3.1語(yǔ)音識(shí)別部分設(shè)計(jì)

          語(yǔ)音識(shí)別程序是軟件編程的主體工作識(shí)別模塊的程序流程圖4所示。本系統(tǒng)采用了常用的能量過(guò)零率雙門(mén)限法進(jìn)行語(yǔ)音端點(diǎn)檢測(cè),采用了計(jì)算量較小的線性預(yù)測(cè)倒譜系數(shù)作為語(yǔ)音信號(hào)特征矢量,另外,基于非特定人的嵌入式系統(tǒng)要求,為了達(dá)到減少計(jì)算量和存儲(chǔ)量的目的,在特征參數(shù)提取完成之后,利用矢量量化方法進(jìn)行數(shù)據(jù)壓縮。語(yǔ)音識(shí)別模型采用(DHMM)離散隱馬爾可夫模型,利用Baum-welth重估算法、前向后向算法、viterbi算法來(lái)完成語(yǔ)音模板的訓(xùn)練和語(yǔ)音識(shí)別的任務(wù)。

          圖4 語(yǔ)音識(shí)別模塊流程圖

          初始化子程序的作用是將微處理器中與語(yǔ)音識(shí)別相關(guān)的資源進(jìn)行參數(shù)設(shè)置,使其實(shí)現(xiàn)為相應(yīng)的功能,例如自動(dòng)A/D變換等;

          端點(diǎn)檢測(cè)用來(lái)避免不必要的計(jì)算量,同時(shí)設(shè)定語(yǔ)音識(shí)別解碼的起點(diǎn)和終點(diǎn),防止無(wú)效搜索;預(yù)處理用來(lái)提高語(yǔ)音識(shí)別性能,增強(qiáng)穩(wěn)健性的重要環(huán)節(jié)。預(yù)處理包括對(duì)原始語(yǔ)音信號(hào)的濾波、預(yù)加重、加窗、分幀等環(huán)節(jié)。同時(shí)還可能包含語(yǔ)音增強(qiáng)、噪聲抵消、端點(diǎn)檢測(cè)等等。預(yù)加重主要是為了提升高頻部分,以彌補(bǔ)聲音在唇部輻射時(shí)產(chǎn)生的高頻部分的損失,可以使信號(hào)的頻譜平坦,減少信號(hào)的動(dòng)態(tài)范圍;

          特征提取就是對(duì)語(yǔ)音信號(hào)進(jìn)行分析處理,去除對(duì)語(yǔ)音識(shí)別無(wú)關(guān)緊要的冗余信息,提取出對(duì)語(yǔ)音識(shí)別有用的重要信息;

          矢量量化(VQ)是一種重要的信號(hào)壓縮方法,它可以減少語(yǔ)音信號(hào)處理中所需要的大量的存儲(chǔ)空間,并可以減少識(shí)別匹配的計(jì)算量;

          語(yǔ)音信號(hào)本身是一個(gè)可觀察的序列:它是由大腦中的(不可觀察的)、根據(jù)言語(yǔ)需要和語(yǔ)法知識(shí)(狀態(tài)選擇)所發(fā)出的音素(詞、句)的參數(shù)流,所以用離散隱馬爾可夫模型(DHMM)來(lái)模擬語(yǔ)音信號(hào)。

          3.2語(yǔ)音播放的模塊設(shè)計(jì)

          為了有一個(gè)友好的人機(jī)交互的功能,該系統(tǒng)還必須語(yǔ)音回放。語(yǔ)音數(shù)據(jù)的保存形式是以臺(tái)灣凌陽(yáng)公司開(kāi)發(fā)的幾種語(yǔ)音壓縮編碼算法來(lái)實(shí)現(xiàn)的。同時(shí),凌陽(yáng)公司還提供了相應(yīng)的語(yǔ)音壓縮與解壓算法的API接口,可以方便開(kāi)發(fā)人員進(jìn)行編程開(kāi)發(fā)工作。

          先用凌陽(yáng)Compress Tool事先把所需要的語(yǔ)音信號(hào)錄制好,用凌陽(yáng)壓縮工具進(jìn)行壓縮,這樣就可以得到所要播報(bào)的語(yǔ)音了。語(yǔ)音播放程序調(diào)用凌陽(yáng)提供的音頻編碼算法庫(kù)中的API函數(shù),采用凌陽(yáng)壓縮算法中的SACM_S480進(jìn)行自動(dòng)放音,其語(yǔ)音自動(dòng)播放程序流程圖如下圖5所示。語(yǔ)音播放是在中斷服務(wù)程序中執(zhí)行,本系統(tǒng)使用了FIQ_TMA中斷源。語(yǔ)音播放通常會(huì)出現(xiàn)兩種情況:一是系統(tǒng)能正確識(shí)別語(yǔ)音,此時(shí)的識(shí)別后處理是通過(guò)語(yǔ)音播報(bào)出正確的結(jié)果;二是系統(tǒng)不能正確識(shí)別語(yǔ)音,則播報(bào)出不能識(shí)別的原因。語(yǔ)音回放流程圖如圖5所示。

          圖5 語(yǔ)音回放流程圖

          4 總結(jié)

          本文的創(chuàng)新點(diǎn)是設(shè)計(jì)的提出的嵌入式非特定人所選用的SPCE061A微處理CPU最高時(shí)鐘可達(dá)到49MHZ,因此在處理復(fù)雜的數(shù)字信號(hào)方面它可以和DSP相媲美,但其價(jià)格卻要比專(zhuān)用的DSP芯片廉價(jià),并且它具有較強(qiáng)的中斷處理能力,系統(tǒng)支持10個(gè)中斷向量及10余個(gè)中斷源,適合實(shí)時(shí)語(yǔ)音處理,并具有雙通道10位DAC方式的音頻輸出功能,配置帶自動(dòng)增益控制功能(AGC)的麥克風(fēng)輸入方式,為語(yǔ)音處理帶來(lái)了極大便利;其次,采用了離散隱馬爾可夫模型來(lái)模擬語(yǔ)音信號(hào),并且隨著DHMM在語(yǔ)音模板的訓(xùn)練階段計(jì)算復(fù)雜度的增加,識(shí)別階段的計(jì)算負(fù)擔(dān)相應(yīng)的大大減少,對(duì)于特定人、小詞匯量的語(yǔ)音控制系統(tǒng)己能滿(mǎn)足要求。此項(xiàng)目投入市場(chǎng)后,半年內(nèi)產(chǎn)生50余萬(wàn)的經(jīng)濟(jì)效益。

          參考文獻(xiàn)

          [1]薛均義,張延斌,虞鶴松等.凌陽(yáng)16位單片機(jī)原理及應(yīng)用[M].北京航空航天大學(xué)出版社2003.72~89

          [2]易克初等.語(yǔ)音信號(hào)處理.國(guó)防工業(yè)出版社[M].2000.11-15 ;154-172

          [3]胡航.語(yǔ)音信號(hào)處理.哈爾濱工業(yè)大學(xué)出版社[M].2000.88-120

          [4]胡凱,張穎超.生化分析儀的設(shè)計(jì)及與PC機(jī)的通信[J].微計(jì)算機(jī)信息.2006,9-1:20-22

          [5]馬鴻文.基于AT89C52單片機(jī)的自動(dòng)存取柜的設(shè)計(jì)與實(shí)現(xiàn)[J].微計(jì)算機(jī)信息,2006,7-2:10-13.

          矢量控制相關(guān)文章:矢量控制原理


          評(píng)論


          相關(guān)推薦

          技術(shù)專(zhuān)區(qū)

          關(guān)閉
          看屁屁www成人影院,亚洲人妻成人图片,亚洲精品成人午夜在线,日韩在线 欧美成人 (function(){ var bp = document.createElement('script'); var curProtocol = window.location.protocol.split(':')[0]; if (curProtocol === 'https') { bp.src = 'https://zz.bdstatic.com/linksubmit/push.js'; } else { bp.src = 'http://push.zhanzhang.baidu.com/push.js'; } var s = document.getElementsByTagName("script")[0]; s.parentNode.insertBefore(bp, s); })();