<meter id="pryje"><nav id="pryje"><delect id="pryje"></delect></nav></meter>

<label id="pryje"></label>

新聞中心

EEPW首頁 > 嵌入式系統(tǒng) > 設(shè)計(jì)應(yīng)用 > 特定人語音識(shí)別技術(shù)在汽車控制上的應(yīng)用

特定人語音識(shí)別技術(shù)在汽車控制上的應(yīng)用

——

作者：時(shí)間：2007-09-28 來源：PLC&FA

加入技術(shù)交流群
- 掃碼加入
  和技術(shù)大咖面對(duì)面交流
  海量資料庫查詢

收藏

1 引言

　　從20世紀(jì)50年代開始對(duì)語音識(shí)別的研究開始，經(jīng)過幾十年的發(fā)展已經(jīng)達(dá)到一定的高度，有的已經(jīng)從實(shí)驗(yàn)室走向市場，如一些玩具、某些部門密碼語音輸入等，隨著DSP和專用集成電路技術(shù)的發(fā)展，快速傅立葉變換以及近來嵌入式操作系統(tǒng)的研究，使得特定人識(shí)別尤其是計(jì)算量小的特定人識(shí)別成為可能。因此，對(duì)特定人語音識(shí)別技術(shù)在汽車控制上的應(yīng)用的研究是很有前途的。

　　2 特定人語音識(shí)別的方法

　　目前，常用的說話人識(shí)別方法有模板匹配法、統(tǒng)計(jì)建模法、聯(lián)接主義法(即人工神經(jīng)網(wǎng)絡(luò)實(shí)現(xiàn))。考慮到數(shù)據(jù)量、實(shí)時(shí)性以及識(shí)別率的問題，筆者采用基于矢量量化和隱馬爾可夫模型(HMM)相結(jié)合的方法。

　　說話人識(shí)別的系統(tǒng)主要由語音特征矢量提取單元(前端處理)、訓(xùn)練單元、識(shí)別單元和后處理單元組成，其系統(tǒng)構(gòu)成如圖1所示。

系統(tǒng)構(gòu)成

　　圖1 系統(tǒng)構(gòu)成

　　由上圖也可以看出，每個(gè)司機(jī)在購買車后必須將自己的語音輸入系統(tǒng)，也就是訓(xùn)練過程，當(dāng)然最好是在安靜、次數(shù)達(dá)到一定的數(shù)目。從此在以后駕駛過程中就可以利用這個(gè)系統(tǒng)了。

　　所謂預(yù)處理是指對(duì)語音信號(hào)的特殊處理:預(yù)加重，分幀處理。預(yù)加重的目的是提升高頻部分，使信號(hào)的頻譜變得平坦，以便于進(jìn)行頻譜分析或聲道參數(shù)分析。用具有 6dB/倍頻程的提升高頻特性的預(yù)加重?cái)?shù)字濾波器實(shí)現(xiàn)。雖然語音信號(hào)是非平穩(wěn)時(shí)變的，但是可以認(rèn)為是局部短時(shí)平穩(wěn)。故語音信號(hào)分析常分段或分幀來處理。

　　2.1 語音特征矢量提取單元

　　說話人識(shí)別系統(tǒng)設(shè)計(jì)中的根本問題是如何從語音信號(hào)中提取表征人的基本特征。即語音特征矢量的提取是整個(gè)說話人識(shí)別系統(tǒng)的基礎(chǔ)，對(duì)說話人識(shí)別的錯(cuò)誤拒絕率和錯(cuò)誤接受率有著極其重要的影響。同語音識(shí)別不同，說話人識(shí)別利用的是語音信號(hào)中的說話人信息，而不考慮語音中的字詞意思，它強(qiáng)調(diào)說話人的個(gè)性。因此，單一的語音特征矢量很難提高識(shí)別率。該系統(tǒng)在說話人的識(shí)別中采用倒譜系數(shù)加基因周期參數(shù),而在對(duì)控制命令的語音識(shí)別中僅采用倒譜系數(shù)。其中，常用的倒譜系數(shù)有2 種，即LPC(線性預(yù)測(cè)系數(shù))和倒譜參數(shù)(LPCC),一種是基于Mel刻度的MFLL(頻率倒譜系數(shù))參數(shù)(Mel頻率譜系數(shù))。

　　對(duì)于LPCC參數(shù)的提取, 可先采用Durbin遞推算法、格型算法或者Schur遞推算法來求LPC系數(shù)，然后求LPC參數(shù)。設(shè)第l幀語音的LPC系數(shù)為αn,則LPCC的參數(shù)為1＜n≤p

　　其中p為LPCC系數(shù)的階數(shù)，k為LPCC系數(shù)的遞推次數(shù)。

　　進(jìn)一步的研究發(fā)現(xiàn)，引入一階和二階差分倒譜可以提高識(shí)別率。

　　對(duì)于MPCC參數(shù)的提取，若根據(jù)Mel曲線將語音信號(hào)頻譜分為K個(gè)頻帶，每個(gè)頻帶的能量為θ(Mk)，則 MFCC參數(shù)為 1＜n≤p

　　通過對(duì)LPCC和MFCC參數(shù)對(duì)識(shí)別率影響的實(shí)驗(yàn)比較，筆者選取LPCC參數(shù)及其一階和二階差分倒譜稀疏作為特征參數(shù)。

　　基音周期估計(jì)的方法很多，主要有基于求短時(shí)自相關(guān)函數(shù)的算法、基于求短時(shí)平均幅度差函數(shù)(AMDF)的算法、基于同態(tài)信號(hào)處理和線性預(yù)測(cè)編碼的算法。筆者僅介紹基于求短時(shí)自相關(guān)函數(shù)的算法。

　　設(shè)Sw(n)是一段加窗語音信號(hào)，它的非零區(qū)間為0＜n≤n-1。Sw(n)的自相關(guān)函數(shù)稱為語音信號(hào)的S(n)的短時(shí)自相關(guān)函數(shù)，用Rw(l)表示，即Rw(l)= 參數(shù)

　　可知短時(shí)自相關(guān)函數(shù)在Rw(0)處最大，且在基音周期的各個(gè)整數(shù)倍點(diǎn)上有很大的峰值，選擇合適的窗函數(shù)(窗長為40ms的Hamming窗)與濾波器(帶寬為60~900Hz的帶通濾波器)后，只要找到自相關(guān)函數(shù)的第一最大峰值點(diǎn)的位置并計(jì)算它與零點(diǎn)的距離，便能估計(jì)出基音周期。

　　2.2 訓(xùn)練單元

　　訓(xùn)練單元的功能是把事先收集到的語音利用一定的算法為每一個(gè)待識(shí)別的說話人訓(xùn)練出與之相匹配的參數(shù)。針對(duì)說話人識(shí)別在汽車應(yīng)用中的不同的要求，訓(xùn)練單元也分為2部分:對(duì)說話人識(shí)別的訓(xùn)練和對(duì)待識(shí)別詞的訓(xùn)練。

　　對(duì)于說話人識(shí)別部分的訓(xùn)練，針對(duì)說話人的特征進(jìn)行訓(xùn)練，為每個(gè)合法用戶建立一套或多套HMM模型，同時(shí)采用基于矢量量化(VQ)的方法，為每個(gè)合法用戶建立VQ碼本。VQ碼本的設(shè)計(jì)采用LBG算法，初始碼本的設(shè)置采用分裂法初始碼本。

　　第2 部分針對(duì)控制命令中用到的每個(gè)孤立的詞條建立多個(gè)訓(xùn)練樣本，或稱為詞條樣本，估計(jì)出該詞條的HMM參數(shù)(一套或多套)。對(duì)一個(gè)HMM過程的完整的描述包括:2個(gè)模型參數(shù)N和M，3組概率度量A，B和π。為了方便起見，通常采用如下方式表示一個(gè)完整的模型:λ=(N,M,π,A,B)，或者簡寫為:λ= (π,A,B)。而對(duì)于每一個(gè)詞條V的模型參數(shù)，V=1~V，可以用Baum-Welch重估算法。

2.3 識(shí)別單元

　　識(shí)別單元的功能是利用經(jīng)訓(xùn)練已經(jīng)獲得的HMM模型參數(shù) 和測(cè)得的說話人的基音周期在一定的判決條件下辨認(rèn)出待識(shí)別的說話人并估計(jì)出待識(shí)別的控制命令詞串。針對(duì)HMM模型參數(shù)通常采用的判決條件是最大后驗(yàn)概率，用Viterbi算法實(shí)現(xiàn)。

　　2.4 后處理單元

　　充分利用每個(gè)說話人的聲道參數(shù)和詞條中各狀態(tài)持續(xù)時(shí)間的概率分布來改進(jìn)系統(tǒng)的識(shí)別率。

　　3 系統(tǒng)的實(shí)現(xiàn)

　　由于汽車的控制命令是有限的詞條和數(shù)字串的組合，對(duì)這些語音命令的識(shí)別屬于特定人小詞匯量的連接詞的識(shí)別以及與文本有關(guān)的說話人確認(rèn)，不論是從目前的DSP運(yùn)算速度還是存儲(chǔ)空間來說，實(shí)時(shí)實(shí)現(xiàn)這些語音命令的識(shí)別都是完全可能的。

　　識(shí)別系統(tǒng)組成框圖如圖所示:在此系統(tǒng)中，對(duì)運(yùn)算能力和存儲(chǔ)單元要求非常高的語音識(shí)別部分完全由DSP完成。

識(shí)別系統(tǒng)的組成框圖

圖2 識(shí)別系統(tǒng)的組成框圖

　　框圖中識(shí)別系統(tǒng)的功能是完成語音的輸入、A/D轉(zhuǎn)換及識(shí)別，系統(tǒng)中核心部分采用TMS320VC5410。其原因是它的運(yùn)算速度和存儲(chǔ)空間都能滿足要求，同時(shí)它的一些并行運(yùn)算硬件結(jié)構(gòu)也非常適合語音識(shí)別的各種算法，程序和已經(jīng)脫機(jī)訓(xùn)練好的HMM參數(shù)表及相應(yīng)的詞典存放在程序存儲(chǔ)器中，數(shù)據(jù)存儲(chǔ)器存放識(shí)別過程中的中間計(jì)算數(shù)據(jù)。A/D芯片采用TLC320AD50C, 里面含有A/D、D/A以及低通濾波器和采樣保持電路。模擬語音信號(hào)的輸入主要是通過傳聲器，保證語音門禁的安全性，轉(zhuǎn)換后的數(shù)字語音數(shù)據(jù)以同步串行通信方式傳送給DSP。如圖2。

　　4 結(jié)束語

　　語音控制汽車是未來的一種趨勢(shì)。目前，將語音技術(shù)應(yīng)用于汽車的產(chǎn)品只有在一些玩具中用到，由此可想利用語音技術(shù)進(jìn)行汽車控制這一領(lǐng)域蘊(yùn)涵著相當(dāng)大的潛在市場。

　　而且，說話人識(shí)別技術(shù)已經(jīng)發(fā)展到可以應(yīng)用到實(shí)際的階段了，但目前對(duì)說話人識(shí)別的應(yīng)用并不是很多。筆者嘗試提出一種比較容易實(shí)現(xiàn)的方案，將說話人識(shí)別技術(shù)應(yīng)用到實(shí)際中。但在實(shí)際應(yīng)用中，說話人識(shí)別系統(tǒng)都面臨一個(gè)共同的問題，即無法區(qū)分一個(gè)發(fā)音是現(xiàn)場發(fā)音還是錄音回放。針對(duì)該現(xiàn)象，筆者提出的說話人識(shí)別系統(tǒng)可以有效地防止這種情況發(fā)生。具體實(shí)現(xiàn)說話人識(shí)別系統(tǒng)時(shí)，可采用隨機(jī)或其它方法來生成提示文本。如隨機(jī)的數(shù)字串，以使假冒者無法事先錄音，增加駕駛的安全性。

<a target='_blank'><img src='https://ad.eepw.com.cn/www/delivery/avw.php?zoneid=114&cb=INSERT_RANDOM_NUMBER_HERE&n=a7a83b30' border='0' alt='' /></a>
<a target='_blank'><img src='https://ad.eepw.com.cn/www/delivery/avw.php?zoneid=115&cb=INSERT_RANDOM_NUMBER_HERE&n=a3d98779' border='0' alt='' /></a>
<a target='_blank'><img src='https://ad.eepw.com.cn/www/delivery/avw.php?zoneid=116&cb=INSERT_RANDOM_NUMBER_HERE&n=abca108c' border='0' alt='' /></a>
<a target='_blank'><img src='https://ad.eepw.com.cn/www/delivery/avw.php?zoneid=117&cb=INSERT_RANDOM_NUMBER_HERE&n=a1775170' border='0' alt='' /></a>
<a target='_blank'><img src='https://ad.eepw.com.cn/www/delivery/avw.php?zoneid=118&cb=INSERT_RANDOM_NUMBER_HERE&n=a449048b' border='0' alt='' /></a>

關(guān)鍵詞： 汽車電子 語音識(shí)別 汽車控制 汽車電子控制裝置

評(píng)論

相關(guān)推薦

村田汽車電子元件技術(shù)交流會(huì)現(xiàn)場視頻5

視頻 Murata 汽車電子 | 2008-08-22

新一代語音識(shí)別：可徹底改變車內(nèi)體驗(yàn)的技術(shù)

汽車電子語音識(shí)別生物識(shí)別人工智能 | 2024-07-18

[推薦]2004年汽車電子產(chǎn)業(yè)趨勢(shì)研討會(huì)

mmm_y | 2004-12-13

altera的汽車電子的參考設(shè)計(jì)

資源下載 altera 汽車電子參考設(shè)計(jì) | 2007-12-12

村田汽車電子元件技術(shù)交流會(huì)現(xiàn)場視頻4

視頻 Murata 汽車電子 | 2008-08-22

電視機(jī)智能聲控選合系統(tǒng)設(shè)計(jì)與實(shí)現(xiàn)

資源下載語音識(shí)別彩電遙控智能聲控選臺(tái) | 2007-02-16

直播預(yù)告 | 從汽車到智能家居，干簧傳感器如何發(fā)揮其核心作用？

汽車電子斯丹麥德汽車電子智能家居干簧管 | 2024-05-20

德州儀器閃耀上海慕展三大板塊更顯產(chǎn)品實(shí)力

模擬技術(shù) 德州儀器慕尼黑電子展汽車電子機(jī)器人能源 | 2024-07-15

2004年汽車電子高級(jí)技術(shù)研討會(huì)演講稿下載?。?/a>

jackwang | 2004-11-29

Canalys：2025～2026 年，L2+ 輔助駕駛滲透率 9.3%、L3 達(dá) 4.6%

汽車電子汽車電子輔助駕駛 | 2024-07-04

汽車電子儀表冷卻液溫度表、機(jī)油壓力表電路圖

設(shè)計(jì)方案汽車電子儀表冷卻溫度表機(jī)油壓力表電路圖 | 2010-08-31

走進(jìn)臨港新片區(qū)之國際汽車電子企業(yè)交流會(huì)成功舉辦

汽車電子安富利臨港汽車電子 | 2024-05-24

大聯(lián)大汽車技術(shù)應(yīng)用路演重慶場圓滿落幕

汽車電子大聯(lián)大汽車電子 | 2024-06-14

PID控制及其在車輛上的應(yīng)用

資源下載 PID PID控制汽車電子 | 2007-12-29

韓國計(jì)劃開發(fā)高性能通用自動(dòng)駕駛芯片，算力可達(dá) 1000TOPS

汽車電子韓國汽車電子自動(dòng)駕駛芯片 | 2024-05-08

村田汽車電子元件技術(shù)交流會(huì)現(xiàn)場視頻1

視頻 Murata 汽車電子 | 2008-08-13

村田汽車電子元件技術(shù)交流會(huì)現(xiàn)場視頻3

視頻 Murata 汽車電子 | 2008-08-22

魯棒控制系統(tǒng) 課件

資源下載汽車電子魯棒性能直升機(jī)系統(tǒng) Furuta擺 | 2007-12-29

555實(shí)用汽車電子點(diǎn)火器電路

設(shè)計(jì)方案實(shí)用汽車電子點(diǎn)火器 | 2009-07-06

2005年汽車電子高級(jí)研討會(huì)演講稿下載

jackwang | 2005-09-23

中國汽車電子半導(dǎo)體器件市場快速增長

hpnet | 2003-11-10

汽車電子密碼鎖電路

設(shè)計(jì)方案汽車電子密碼鎖 | 2009-08-17

調(diào)查——搞汽車電子的請(qǐng)報(bào)道。

jackwang | 2003-11-21

淼鑠實(shí)業(yè)做好扎實(shí)服務(wù) 深耕汽車電子電器

元件/連接器汽車電子淼鑠實(shí)業(yè) 上海慕尼黑電子展 | 2024-07-19

芯熾科技發(fā)布革新性MIPI A-PHY SerDes芯片組，驅(qū)動(dòng)車載與長距視頻傳輸技術(shù)邁入新紀(jì)元

汽車電子汽車電子，解串器，芯熾 | 2024-07-12

汽車電子密碼鎖

設(shè)計(jì)方案汽車電子密碼鎖 | 2009-07-06

大聯(lián)大汽車技術(shù)應(yīng)用路演重慶場：探索新能源汽車技術(shù)的未來

汽車電子大聯(lián)大汽車電子 | 2024-06-18

Maxim 帶汽車電子卸載保護(hù)的升壓LED 驅(qū)動(dòng)器

設(shè)計(jì)方案 Maxim 汽車電子卸載保護(hù) 升壓驅(qū)動(dòng)器 | 2009-07-27

村田汽車電子元件技術(shù)交流會(huì)現(xiàn)場視頻2

視頻 Murata 汽車電子 | 2008-08-22

汽車電子的串口通V3.20

資源下載汽車電子串口通 | 2008-01-16

焦點(diǎn)

推薦視頻

技術(shù)專區(qū)

看屁屁www成人影院,亚洲人妻成人图片,亚洲精品成人午夜在线,日韩在线欧美成人 (function(){ var bp = document.createElement('script'); var curProtocol = window.location.protocol.split(':')[0]; if (curProtocol === 'https') { bp.src = 'https://zz.bdstatic.com/linksubmit/push.js'; } else { bp.src = 'http://push.zhanzhang.baidu.com/push.js'; } var s = document.getElementsByTagName("script")[0]; s.parentNode.insertBefore(bp, s); })();