<meter id="pryje"><nav id="pryje"><delect id="pryje"></delect></nav></meter>
          <label id="pryje"></label>

          新聞中心

          EEPW首頁(yè) > 消費(fèi)電子 > 設(shè)計(jì)應(yīng)用 > 基于中英文數(shù)字語(yǔ)音登陸系統(tǒng)的仿真研究

          基于中英文數(shù)字語(yǔ)音登陸系統(tǒng)的仿真研究

          作者:李梓鈺,林子明,程曉東,楊潔 時(shí)間:2012-06-27 來(lái)源:電子產(chǎn)品世界 收藏

            摘要:為了方便學(xué)生使用中文或英文說(shuō)出學(xué)號(hào)與名字登錄注冊(cè)系統(tǒng),設(shè)計(jì)了中英文數(shù)字語(yǔ)音登錄系統(tǒng)。采用(Mel頻率倒譜系數(shù))作為語(yǔ)音特征參數(shù),在隱馬爾可夫模型HMM(Hidden Markov Model)框架下建立了基于開(kāi)發(fā)工具包HTK的中英文連續(xù)數(shù)字系統(tǒng),包括對(duì)語(yǔ)音信號(hào)的預(yù)處理、特征參數(shù)的提取,識(shí)別模版的訓(xùn)練,最后送到識(shí)別器進(jìn)行識(shí)別。通過(guò)建立中文、英文和中英文混合訓(xùn)練集和測(cè)試集聲學(xué)模型,并得到了較高的識(shí)別率,從而加強(qiáng)多媒體注冊(cè)系統(tǒng)的穩(wěn)定性和魯棒性。

          本文引用地址:http://www.ex-cimer.com/article/134004.htm

            引言

            語(yǔ)言是人與人之間在日常交往中最直接也是最強(qiáng)大的工具,然而我們并不滿足于人與人之間的對(duì)話,而是通過(guò)技術(shù)來(lái)實(shí)現(xiàn)人機(jī)對(duì)話,語(yǔ)音識(shí)別技術(shù)的終極目標(biāo)就是能夠讓人類與計(jì)算機(jī)進(jìn)行自由地交談。隨著語(yǔ)音識(shí)別技術(shù)的逐漸成熟及近些年來(lái)已經(jīng)取得的進(jìn)步,英文數(shù)字語(yǔ)音識(shí)別在其發(fā)展的20多年間已達(dá)到了很高的識(shí)別率,漢語(yǔ)數(shù)字語(yǔ)音識(shí)別也經(jīng)過(guò)多年研究在PC平臺(tái)和實(shí)驗(yàn)室條件下達(dá)到了高性能,但中英文混合連續(xù)數(shù)字語(yǔ)音識(shí)別還有待進(jìn)一步研究,張晴晴等人研究的中英雙語(yǔ)混合語(yǔ)音識(shí)別的識(shí)別率為16.8%,遠(yuǎn)低于理想中的識(shí)別率。為使識(shí)別效果達(dá)到可實(shí)用的水平,本系統(tǒng)首先從基本的中英文數(shù)字語(yǔ)音識(shí)別出發(fā),從而為相應(yīng)的登錄注冊(cè)系統(tǒng)做出一些嘗試。

            本文研究的中英文連續(xù)數(shù)字語(yǔ)音識(shí)別,包含中文0-10和英文zero-ten的數(shù)字語(yǔ)音識(shí)別,其中包括對(duì)語(yǔ)音信號(hào)的預(yù)處理、特征參數(shù)提取、中英文聲學(xué)模型與語(yǔ)言模型的訓(xùn)練及模版匹配等,適合于研究數(shù)字語(yǔ)音登錄系統(tǒng),比如用戶用中英文任何語(yǔ)言念學(xué)號(hào)或是身份證號(hào)就能登陸,免去書寫的麻煩,同時(shí)也對(duì)后續(xù)研究中英文混合連續(xù)語(yǔ)音識(shí)別奠定了基礎(chǔ)。

            語(yǔ)音識(shí)別原理

            根據(jù)對(duì)說(shuō)話人說(shuō)話方式的要求,語(yǔ)音識(shí)別可以分為孤立字(詞)語(yǔ)音識(shí)別系統(tǒng),連接字語(yǔ)音識(shí)別系統(tǒng)以及連續(xù)語(yǔ)音識(shí)別系統(tǒng);根據(jù)對(duì)說(shuō)話人的依賴程度,語(yǔ)音識(shí)別可以分為特定人和非特定人語(yǔ)音識(shí)別系統(tǒng);根據(jù)詞匯量大小,又可以分為小詞匯量、中等詞匯量、大詞匯量以及無(wú)限詞匯量的語(yǔ)音識(shí)別系統(tǒng)。不同的語(yǔ)音識(shí)別系統(tǒng),其目的和功能各不相同,但它們所采用的基本框架大體一致,語(yǔ)音識(shí)別基本流程如圖1。 

             語(yǔ)音識(shí)別的過(guò)程,其本質(zhì)就是模式匹配的過(guò)程。語(yǔ)音信號(hào)經(jīng)過(guò)預(yù)處理、語(yǔ)音信號(hào)的特征提取、聲學(xué)模型的訓(xùn)練與模式匹配后,經(jīng)過(guò)處理輸出識(shí)別結(jié)果。其中:

            1)預(yù)處理是對(duì)輸入的原始語(yǔ)音信號(hào)進(jìn)行處理,濾除掉其中不重要的信息和背景噪聲,并進(jìn)行語(yǔ)音信號(hào)的端點(diǎn)檢測(cè)、語(yǔ)音分幀以及預(yù)加重等處理。

            2)特征提取主要負(fù)責(zé)計(jì)算語(yǔ)音的聲學(xué)參數(shù),并進(jìn)行特征的計(jì)算,以便提取出反映信號(hào)特征的關(guān)鍵特征參數(shù),從而用于后續(xù)處理。因Mel頻率倒譜系數(shù)()具有良好的抗噪性和魯棒性,故本文采用提取特征參數(shù)。

            3)訓(xùn)練階段是用戶通過(guò)輸入若干次訓(xùn)練語(yǔ)音后,經(jīng)預(yù)處理和特征提取后得到特征矢量參數(shù),建立或修改訓(xùn)練語(yǔ)音的參考模式庫(kù)。



          關(guān)鍵詞: 語(yǔ)音識(shí)別 MFCC 201206

          評(píng)論


          相關(guān)推薦

          技術(shù)專區(qū)

          關(guān)閉
          看屁屁www成人影院,亚洲人妻成人图片,亚洲精品成人午夜在线,日韩在线 欧美成人 (function(){ var bp = document.createElement('script'); var curProtocol = window.location.protocol.split(':')[0]; if (curProtocol === 'https') { bp.src = 'https://zz.bdstatic.com/linksubmit/push.js'; } else { bp.src = 'http://push.zhanzhang.baidu.com/push.js'; } var s = document.getElementsByTagName("script")[0]; s.parentNode.insertBefore(bp, s); })();