<meter id="pryje"><nav id="pryje"><delect id="pryje"></delect></nav></meter>

<label id="pryje"></label>

新聞中心

EEPW首頁(yè) > 設(shè)計(jì)應(yīng)用 > 3G 手機(jī)語(yǔ)音識(shí)別應(yīng)用中DSP的選擇策略

3G 手機(jī)語(yǔ)音識(shí)別應(yīng)用中DSP的選擇策略

作者：時(shí)間：2010-03-18 來(lái)源：網(wǎng)絡(luò)

加入技術(shù)交流群
- 掃碼加入
  和技術(shù)大咖面對(duì)面交流
  海量資料庫(kù)查詢(xún)

收藏

　　隨著DSP技術(shù)的進(jìn)步，計(jì)算能力更強(qiáng)、功耗更低和體積更小的DSP已經(jīng)出現(xiàn)，使3G 手機(jī)上植入更精確更復(fù)雜的自動(dòng)語(yǔ)音識(shí)別(ASR)功能成為可能。目前，基本ASR應(yīng)用可以分成三大類(lèi)：1. 語(yǔ)音-文本轉(zhuǎn)換(語(yǔ)音輸入)；2. 講者識(shí)別；3. 語(yǔ)音命令控制(語(yǔ)音控制)。
　　
　　這三類(lèi)功能包含了3G所需的眾多ASR性能。語(yǔ)音-文本轉(zhuǎn)換的典型實(shí)例是語(yǔ)音撥號(hào)和電子郵件聽(tīng)寫(xiě)。講者識(shí)別功能可以通過(guò)語(yǔ)音識(shí)別安全地讀出存儲(chǔ)器中的個(gè)人數(shù)據(jù)，從而滿(mǎn)足信用卡定購(gòu)和銀行服務(wù)等保密性高的應(yīng)用需要。語(yǔ)音命令控制功能包括連接語(yǔ)音擴(kuò)展標(biāo)記語(yǔ)言(VXML)網(wǎng)站內(nèi)容的語(yǔ)音接口，它支持財(cái)經(jīng)服務(wù)與目錄助理等業(yè)務(wù)。目前VXML被用于規(guī)范網(wǎng)站內(nèi)容的語(yǔ)音標(biāo)簽。

　　語(yǔ)音識(shí)別的兩種方法

　　3G 手機(jī)的ASR應(yīng)用設(shè)計(jì)可分為兩類(lèi)，即以終端為中心和以客戶(hù)/服務(wù)器為中心的應(yīng)用。如圖1所示為以終端為中心的設(shè)計(jì)方法，3G手機(jī)(終端)執(zhí)行整個(gè)語(yǔ)音識(shí)別過(guò)程并送出識(shí)別結(jié)果。在圖2所示的客戶(hù)/服務(wù)器方法中，終端只是執(zhí)行預(yù)處理特征提取，然后通過(guò)一個(gè)誤碼受保護(hù)的數(shù)據(jù)信道將這些參數(shù)發(fā)送給中心服務(wù)器，中心服務(wù)器最終完成語(yǔ)音識(shí)別。如果采用以客戶(hù)/服務(wù)器為中心的設(shè)計(jì)方法，3G手機(jī)應(yīng)使用數(shù)據(jù)信道而非移動(dòng)信道來(lái)將語(yǔ)音發(fā)送給服務(wù)器進(jìn)行識(shí)別，因?yàn)橐苿?dòng)信道所用的低速率語(yǔ)音編碼會(huì)嚴(yán)重影響語(yǔ)音識(shí)別的性能。

　　各種ASR系統(tǒng)的差異主要體現(xiàn)在詞匯量上。一個(gè)簡(jiǎn)單的網(wǎng)絡(luò)設(shè)備可能只需要16字的詞庫(kù)就能實(shí)現(xiàn)所要求的語(yǔ)音識(shí)別功能，而3G移動(dòng)手機(jī)則需要更大的專(zhuān)業(yè)詞庫(kù)。這些詞匯可以跟講者相關(guān)(訓(xùn)練語(yǔ)音識(shí)別設(shè)備使之熟悉用戶(hù)的聲音特征)或跟講者無(wú)關(guān)(語(yǔ)音識(shí)別設(shè)備可以識(shí)別任何人的聲音)，DSP的計(jì)算負(fù)荷就隨著詞匯量和訓(xùn)練數(shù)據(jù)的增加而增大。

　　例如，根據(jù)隱性馬爾可夫模型(HMM)可以分析一個(gè)典型的跟講者無(wú)關(guān)的100條命令識(shí)別的應(yīng)用實(shí)例。假設(shè)HMM模型從左到右沒(méi)有跳躍地順序擺放，共有6個(gè)狀態(tài)、5個(gè)具有對(duì)角協(xié)方差的混合高斯分布，包含39個(gè)特征(13嘜-頻率對(duì)數(shù)系數(shù)或MFCC，及其一階和二階差分)，具有16位精度，那么，HMM聲學(xué)模型的大小就是100×5×5×(39+2)×2=240kB。

　　為了實(shí)現(xiàn)輸入語(yǔ)音樣本差分、窗口截獲、MFCC抽取、概率計(jì)算和維特比搜索等運(yùn)算的實(shí)時(shí)性，典型情況下需要消耗DSP的1千萬(wàn)個(gè)乘法-累加周期(MMAC)。對(duì)于連續(xù)語(yǔ)音識(shí)別來(lái)說(shuō)，上千個(gè)三音素模型和多種語(yǔ)法模型需要更多的存儲(chǔ)空間，也需要更快的DSP處理速度。

　　因此，移動(dòng)電話中ASR系統(tǒng)的成敗很大程度上取決于DSP的功能和設(shè)計(jì)。第三代系統(tǒng)本身就需要比第二代系統(tǒng)更強(qiáng)性能的DSP，而增加ASR功能就對(duì)DSP提出了更高的要求。從結(jié)構(gòu)角度看，對(duì)DSP性能的要求是處理速度快、功耗低和代碼密度高。

　　采用高速DSP是關(guān)鍵

　　由于系統(tǒng)要實(shí)時(shí)對(duì)語(yǔ)音進(jìn)行處理和取樣，因此語(yǔ)音識(shí)別系統(tǒng)需要具有巨大的計(jì)算能力。下面的數(shù)字和計(jì)算假設(shè)采用的是圍繞終端的設(shè)計(jì)方法。如果將DSP計(jì)算資源的20%分配給一個(gè)10MMAC的語(yǔ)音識(shí)別系統(tǒng)使用，那么就需要一個(gè)具有50MMAC的DSP才能滿(mǎn)足這一功能需要，并可提供足夠的空間執(zhí)行3G手機(jī)所需的其它DSP任務(wù)，如處理軟貓。如果采用較慢的DSP，如25MMAC的DSP，那么詞匯表中的命令數(shù)量就要減半，或減少HMM參數(shù)，這樣會(huì)降低整個(gè)系統(tǒng)性能。

　　DSP的速度決定了語(yǔ)音識(shí)別系統(tǒng)的復(fù)雜性和性能。舉例來(lái)說(shuō)，如果一個(gè)基本的跟講者無(wú)關(guān)的連續(xù)語(yǔ)音識(shí)別系統(tǒng)需要100MMAC，DSP計(jì)算資源的50%用于滿(mǎn)足3G手機(jī)的其它DSP任務(wù)的需求，那么DSP的處理速度就需要達(dá)到200MMAC。

上一頁(yè) 1 2 3 下一頁(yè)

<a target='_blank'><img src='https://ad.eepw.com.cn/www/delivery/avw.php?zoneid=114&cb=INSERT_RANDOM_NUMBER_HERE&n=a7a83b30' border='0' alt='' /></a>
<a target='_blank'><img src='https://ad.eepw.com.cn/www/delivery/avw.php?zoneid=115&cb=INSERT_RANDOM_NUMBER_HERE&n=a3d98779' border='0' alt='' /></a>
<a target='_blank'><img src='https://ad.eepw.com.cn/www/delivery/avw.php?zoneid=116&cb=INSERT_RANDOM_NUMBER_HERE&n=abca108c' border='0' alt='' /></a>
<a target='_blank'><img src='https://ad.eepw.com.cn/www/delivery/avw.php?zoneid=117&cb=INSERT_RANDOM_NUMBER_HERE&n=a1775170' border='0' alt='' /></a>
<a target='_blank'><img src='https://ad.eepw.com.cn/www/delivery/avw.php?zoneid=118&cb=INSERT_RANDOM_NUMBER_HERE&n=a449048b' border='0' alt='' /></a>

關(guān)鍵詞： 手機(jī) 語(yǔ)音識(shí)別 DSP 應(yīng)用 3G

評(píng)論

相關(guān)推薦

炮轟蘋(píng)果后，馬斯克稱(chēng)造手機(jī)并非不可能

手機(jī)與無(wú)線通信蘋(píng)果馬斯克手機(jī) | 2024-06-12

華為折疊屏手機(jī)出貨量猛增257%，首登榜首

華為折疊屏手機(jī) 榮耀三星摩托羅拉 | 2024-06-04

通信接收機(jī)：DSP、軟件無(wú)線電和設(shè)計(jì)

資源下載 DSP 軟件無(wú)線電通信接收機(jī) | 2007-12-11

TI DSP開(kāi)發(fā)工具CCS上AET調(diào)試功能

視頻 TI DSP DSP AET CCS | 2009-10-16

手機(jī)原理第二章（2）

資源下載摩托羅拉手機(jī) 發(fā)射機(jī) | 2007-12-11

Canalys報(bào)告：2024年第一季度智能手機(jī)處理器出貨量排名出爐

嵌入式系統(tǒng) Canalys 手機(jī) MCU | 2024-05-20

LM386典型應(yīng)用電路

設(shè)計(jì)方案 LM386 典型應(yīng)用電路 | 2009-07-06

C64+ 系列DSP上Cache 的應(yīng)用（第一部分）

視頻 TI DSP C64+ Cache | 2009-10-16

手機(jī)原理第二章（1）

資源下載摩托羅拉手機(jī) 射頻系統(tǒng) | 2007-12-11

2024年折疊手機(jī)品牌市占率預(yù)估：三星50.4%，華為30.8%

手機(jī)與無(wú)線通信三星華為手機(jī) | 2024-06-05

高性能系列DSP上TCP2/VCP2協(xié)處理器

視頻 TI DSP VCP2 TCP2 協(xié)處理器 | 2009-10-16

華為最強(qiáng)科普：什么是DSP？

嵌入式系統(tǒng) DSP | 2024-05-20

恩智浦SAF9xxx發(fā)布，汽車(chē)AI音頻處理升級(jí)！

汽車(chē)電子汽車(chē)音頻 DSP SDV 汽車(chē)娛樂(lè)系統(tǒng) | 2024-06-21

TA7240AP應(yīng)用電路

設(shè)計(jì)方案 TA7240AP 應(yīng)用電路 | 2009-07-06

手機(jī)原理第一章

資源下載手機(jī) 功能電路 ETACS GSM | 2007-12-11

手機(jī)＝間諜？警惕手機(jī)成為你身上的竊聽(tīng)器

hpnet | 2002-05-15

LG電子進(jìn)軍中國(guó)CDMA手機(jī)市場(chǎng)

hpnet | 2002-05-21

μC/OS的應(yīng)用和擴(kuò)展

amine | 2002-05-23

2002年嵌入式系統(tǒng)及其應(yīng)用研討會(huì)暨多國(guó)產(chǎn)品展示會(huì)

jackwang | 2002-05-16

C64+ 系列DSP上Cache 的應(yīng)用（第二部分）

視頻 TI DSP C64+ Cache | 2009-10-16

專(zhuān)為客戶(hù)設(shè)計(jì)的高性能器件系列

視頻 TI DSP TMS320C6474 C6474 AIF | 2009-10-16

TMS320LF240x DSP應(yīng)用程序設(shè)計(jì)教程

資源下載 TI TMS320LF240x DSP 應(yīng)用程序設(shè)計(jì) | 2007-12-08

充電器算法復(fù)雜傳統(tǒng)MCU難以勝任？不如試試這些集成DSP內(nèi)核的MCU

嵌入式系統(tǒng) DSP MCU | 2024-05-15

集成運(yùn)放F007基本應(yīng)用電路

設(shè)計(jì)方案集成運(yùn)放基本應(yīng)用電路 | 2009-07-06

三星集團(tuán)會(huì)長(zhǎng)李在镕：堅(jiān)持在華發(fā)展，致力于做中國(guó)人民喜愛(ài)的企業(yè)

手機(jī)與無(wú)線通信三星手機(jī) | 2024-05-27

DSP虛擬I2C總線軟件包的設(shè)計(jì)及應(yīng)用實(shí)例

hpnet | 2002-05-17

新一代語(yǔ)音識(shí)別：可徹底改變車(chē)內(nèi)體驗(yàn)的技術(shù)

汽車(chē)電子語(yǔ)音識(shí)別生物識(shí)別人工智能 | 2024-07-18

達(dá)林頓管的典型應(yīng)用電路

設(shè)計(jì)方案達(dá)林頓典型應(yīng)用電路 | 2009-07-06

光電隔離器應(yīng)用實(shí)例

設(shè)計(jì)方案光電隔離應(yīng)用實(shí)例 | 2009-07-06

谷歌 Pixel 9 系列手機(jī)提前至8月14日發(fā)布

谷歌 Pixel 手機(jī) | 2024-06-27

焦點(diǎn)

推薦視頻

技術(shù)專(zhuān)區(qū)

看屁屁www成人影院,亚洲人妻成人图片,亚洲精品成人午夜在线,日韩在线欧美成人 (function(){ var bp = document.createElement('script'); var curProtocol = window.location.protocol.split(':')[0]; if (curProtocol === 'https') { bp.src = 'https://zz.bdstatic.com/linksubmit/push.js'; } else { bp.src = 'http://push.zhanzhang.baidu.com/push.js'; } var s = document.getElementsByTagName("script")[0]; s.parentNode.insertBefore(bp, s); })();