<meter id="pryje"><nav id="pryje"><delect id="pryje"></delect></nav></meter>

<label id="pryje"></label>

新聞中心

EEPW首頁 > 消費(fèi)電子 > 設(shè)計(jì)應(yīng)用 > 基于DTW的編碼域說話人識(shí)別研究

基于DTW的編碼域說話人識(shí)別研究

作者：時(shí)間：2010-10-14 來源：網(wǎng)絡(luò)

加入技術(shù)交流群
- 掃碼加入
  和技術(shù)大咖面對(duì)面交流
  海量資料庫查詢

收藏

說話人識(shí)別又被稱為話者識(shí)別，是指通過對(duì)說話人語音信號(hào)的分析處理，自動(dòng)確認(rèn)說話人是否在所記錄的話者集合中，以及進(jìn)一步確認(rèn)說話人的身份。說話人識(shí)別的基本原理如圖1所示。

本文引用地址：http://www.ex-cimer.com/article/166450.htm

按照語音的內(nèi)容，說話人識(shí)別可以分為文本無關(guān)的(Text-Independent)和文本相關(guān)的(Text-Dependent)兩種。文本無關(guān)的識(shí)別系統(tǒng)不規(guī)定說話人的發(fā)音內(nèi)容，模型建立相對(duì)困難，但用戶使用方便。與文本有關(guān)的說話人識(shí)別系統(tǒng)要求用戶按照規(guī)定的內(nèi)容發(fā)音，而識(shí)別時(shí)也必須按規(guī)定的內(nèi)容發(fā)音，因此可以達(dá)到較好的識(shí)別效果。
　隨著網(wǎng)絡(luò)技術(shù)的發(fā)展，通過Internet網(wǎng)絡(luò)傳遞語音的網(wǎng)絡(luò)電話VoIP(Voice over IP)技術(shù)發(fā)展迅速，已經(jīng)成為人們?nèi)粘＝涣鞯闹匾侄?，越來越多的用戶拋棄傳統(tǒng)的通信方式，通過計(jì)算機(jī)網(wǎng)絡(luò)等媒介進(jìn)行語音交流。由于VoIP工作方式的特點(diǎn)，語音在傳輸中經(jīng)過了語音編譯碼處理，VoIP設(shè)備端口同時(shí)要處理多路、海量的壓縮話音數(shù)據(jù)。所以VoIP說話人識(shí)別技術(shù)主要研究的是如何高速、低復(fù)雜度地針對(duì)解碼參數(shù)和壓縮碼流進(jìn)行說話人識(shí)別。
　現(xiàn)有的針對(duì)編碼域說話人識(shí)別方法的研究主要集中在編碼域語音特征參數(shù)的提取上，香港理工大學(xué)研究從G.729和G.723編碼比特流以及殘差中提取信息，并采用了分?jǐn)?shù)補(bǔ)償?shù)姆椒?。中國科學(xué)技術(shù)大學(xué)主要研究了針對(duì)AMR語音編碼的說話人識(shí)別。西北工業(yè)大學(xué)在說話人確認(rèn)中針對(duì)不同的語音編碼差異進(jìn)行了補(bǔ)償算法研究，并且研究了直接在G.729編碼的比特流中提取參數(shù)的方法。說話人模型則主要采用在傳統(tǒng)說話人識(shí)別中應(yīng)用最廣泛的GMM-UBM(Gaussian Mixture Model-Universal Background Model)。GMM-UBM的應(yīng)用效果和混元數(shù)目密切相關(guān)，在保證識(shí)別率的基礎(chǔ)上，其處理速度無法滿足VoIP環(huán)境下高速說話人識(shí)別的需求。
　本文研究VoIP語音流中G.729編碼域的說話人實(shí)時(shí)識(shí)別,將DTW識(shí)別算法成功應(yīng)用在G.729編碼域的文本相關(guān)的說話人實(shí)時(shí)識(shí)別。
1 G.729編碼比特流中的特征提取
1.1 G.729編碼原理
　ITU－T在1996年3月公布G.729編碼，其編碼速率為8 kb/s，采用了對(duì)結(jié)構(gòu)代數(shù)碼激勵(lì)線性預(yù)測技術(shù)(CS-ACELP)，編碼結(jié)果可以在8 kb/s的碼率下得到合成音質(zhì)不低于32 kb/s ADPCM的水平。 G.729的算法延時(shí)為15 ms。由于G.729編解碼器具有很高的語音質(zhì)量和很低的延時(shí)，被廣泛地應(yīng)用在數(shù)據(jù)通信的各個(gè)領(lǐng)域，如VoIP和H.323網(wǎng)上多媒體通信系統(tǒng)等。
G.729的編碼過程如下：輸入8 kHz采樣的數(shù)字語音信號(hào)先經(jīng)過高通濾波預(yù)處理,每10 ms幀作一次線性預(yù)測分析，計(jì)算10階線性預(yù)測濾波器系數(shù)，然后把這些系數(shù)轉(zhuǎn)換為線譜對(duì)（LSP）參數(shù)，采用兩級(jí)矢量量化技術(shù)進(jìn)行量化。自適應(yīng)碼本搜索時(shí)，以原始語音與合成語音的誤差知覺加權(quán)最小為測度進(jìn)行搜索。固定碼本采用代數(shù)碼本機(jī)構(gòu)。激勵(lì)參數(shù)（自適應(yīng)碼本和固定碼本參數(shù)）每個(gè)子幀（5 ms，40個(gè)樣點(diǎn)）確定一次。
1.2 特征參數(shù)提取
直接從G.729 編碼流中按照量化算法解量化可以得到LSP參數(shù)。由于后段的說話人識(shí)別系統(tǒng)還需要激勵(lì)參數(shù)，而在激勵(lì)參數(shù)的計(jì)算過程中經(jīng)過了LSP的插值平滑，所以為了使特征矢量中聲道和激勵(lì)參數(shù)能準(zhǔn)確地對(duì)應(yīng)起來，要對(duì)解量化的LSP參數(shù)采用插值平滑。

上一頁 1 2 3 下一頁

<a target='_blank'><img src='https://ad.eepw.com.cn/www/delivery/avw.php?zoneid=114&cb=INSERT_RANDOM_NUMBER_HERE&n=a7a83b30' border='0' alt='' /></a>
<a target='_blank'><img src='https://ad.eepw.com.cn/www/delivery/avw.php?zoneid=115&cb=INSERT_RANDOM_NUMBER_HERE&n=a3d98779' border='0' alt='' /></a>
<a target='_blank'><img src='https://ad.eepw.com.cn/www/delivery/avw.php?zoneid=116&cb=INSERT_RANDOM_NUMBER_HERE&n=abca108c' border='0' alt='' /></a>
<a target='_blank'><img src='https://ad.eepw.com.cn/www/delivery/avw.php?zoneid=117&cb=INSERT_RANDOM_NUMBER_HERE&n=a1775170' border='0' alt='' /></a>
<a target='_blank'><img src='https://ad.eepw.com.cn/www/delivery/avw.php?zoneid=118&cb=INSERT_RANDOM_NUMBER_HERE&n=a449048b' border='0' alt='' /></a>

關(guān)鍵詞： 編解碼器 音頻

評(píng)論

相關(guān)推薦

AMD 助力千視電子 NDI 和 NDI|HX 編解碼解決方案

嵌入式系統(tǒng) AMD Zynq UltraScale MPSoC NDI 編解碼器 | 2024-02-29

如何解決超薄筆記本電腦的音頻挑戰(zhàn)？

消費(fèi)電子超薄筆記本電腦音頻 Cirrus Logic | 2023-05-09

YD2206 雙聲道音頻功率放大電路

資源下載音頻功率放大放大電路 YD2206 | 2007-12-25

AN7113S音頻功率放大電路

設(shè)計(jì)方案 AN7113S 音頻功率放大電路 | 2009-07-06

音頻無線傳輸-紅外發(fā)射電路

資源下載音頻無線傳輸紅外發(fā)射電路 | 2007-12-25

音頻控制電路集錦

資源下載音頻控制電路 | 2007-12-25

Snapdragon Sound驍龍暢聽技術(shù)助力全新Bose SoundLink Max手提音箱帶來“派對(duì)級(jí)”音頻體驗(yàn)

消費(fèi)電子 Snapdragon Sound 驍龍暢聽 Bose SoundLink Max 手提音箱派對(duì)級(jí) 音頻 | 2024-05-31

敏迪內(nèi)置音頻解碼/編碼器的藍(lán)牙基頻LSI

yongzhe | 2005-09-01

針對(duì)Microsoft Teams Rooms和會(huì)議應(yīng)用的ADI AEC

視頻 adi AEC 音頻通信 | 2021-04-28

電視發(fā)射器電路

嵌入式系統(tǒng) 音頻視頻傳輸 VHF | 2023-07-21

請教s3c241上音頻問題?

ycl39 | 2004-11-27

遠(yuǎn)程操作機(jī)器人電路

嵌入式系統(tǒng) 遙控機(jī)器人音頻視頻射頻 | 2023-08-09

紅外音頻鏈接電路

手機(jī)與無線通信紅外音頻無線傳輸 | 2023-08-07

24 音頻技術(shù)

視頻 Android 傳感器無線傳輸音頻 | 2015-06-30

BA5204/5204F 3V雙聲道音頻功率放大器的典型應(yīng)用電路

設(shè)計(jì)方案 BA5204 5204F 聲道音頻功率放大器典型應(yīng)用 | 2009-07-06

使用555定時(shí)器的低功耗音頻放大器

嵌入式系統(tǒng) 555定時(shí)器低功率音頻放大器 | 2023-05-15

有源音頻交叉電路

嵌入式系統(tǒng) 音頻交叉 | 2023-08-04

計(jì)算機(jī)音頻工作站總論--音頻工作站與硬盤錄音機(jī)同類比較(轉(zhuǎn)載）

hpnet | 2002-05-15

音頻均衡器電路

嵌入式系統(tǒng) 音頻均衡 | 2023-08-08

AN7100S雙聲道音頻功率放大電路

設(shè)計(jì)方案 AN7100S 聲道音頻功率放大電路 | 2009-07-06

報(bào)告預(yù)測：07年音頻芯片市場收入達(dá)68億美元

hpnet | 2003-05-09

請問目前常用的音頻/語音錄音采集模塊?

C-- | 2004-07-01

集成音頻功率放大電路LM380

設(shè)計(jì)方案集成音頻功率放大電路 LM380 | 2009-07-06

雙路SCART連接器的音頻_視頻開關(guān) MAX4397

資源下載 Maxim 音頻/視頻開關(guān) MAX4397 | 2007-03-20

AN102S雙聲道音頻功率放大器的典型應(yīng)用電路

設(shè)計(jì)方案 AN102S 聲道音頻功率放大器典型應(yīng)用電路 | 2009-07-06

音頻音控制電路

嵌入式系統(tǒng) 音頻控制電路 | 2023-08-07

音頻電路圖

資源下載運(yùn)算放大器音頻前置放大 | 2007-02-09

焦點(diǎn)

推薦視頻

技術(shù)專區(qū)

看屁屁www成人影院,亚洲人妻成人图片,亚洲精品成人午夜在线,日韩在线欧美成人 (function(){ var bp = document.createElement('script'); var curProtocol = window.location.protocol.split(':')[0]; if (curProtocol === 'https') { bp.src = 'https://zz.bdstatic.com/linksubmit/push.js'; } else { bp.src = 'http://push.zhanzhang.baidu.com/push.js'; } var s = document.getElementsByTagName("script")[0]; s.parentNode.insertBefore(bp, s); })();