用ＴＭＳ３２０Ｃ６２０１實(shí)現(xiàn)多路ＩＴＵ－ＴＧ．７２８語(yǔ)音編碼標(biāo)準(zhǔn)

作者：時(shí)間：2006-05-07 來(lái)源：網(wǎng)絡(luò)

加入技術(shù)交流群
- 掃碼加入
  和技術(shù)大咖面對(duì)面交流
  海量資料庫(kù)查詢

摘要：ＩＴＵ－ＴＧ．７２８標(biāo)準(zhǔn)是國(guó)際電信聯(lián)盟于１９９２年制定的比特率為１６ｋｂｉｔ／ｓ的低延時(shí)ＣＥＬＰ類語(yǔ)音編碼器。在扼要介紹Ｇ．７２８編解碼算法原理和ＴＭＳ３２０Ｃ６２０１定點(diǎn)ＤＳＰ芯片的基礎(chǔ)上，詳細(xì)討論了Ｇ．７２８算法在ＴＭＳ３２０Ｃ６２０１上實(shí)時(shí)實(shí)現(xiàn)的硬件設(shè)計(jì)和軟件開(kāi)發(fā)及優(yōu)化的關(guān)鍵技術(shù)。實(shí)驗(yàn)結(jié)果表明，單片Ｃ６２０１能實(shí)現(xiàn)至少４路Ｇ．７２８語(yǔ)音編解碼。

本文引用地址：http://www.ex-cimer.com/article/242348.htm

關(guān)鍵詞：語(yǔ)音編碼ＩＴＵ標(biāo)準(zhǔn) ＤＳＰ

隨著數(shù)字語(yǔ)音壓縮技術(shù)的應(yīng)用領(lǐng)域越來(lái)越廣，將高質(zhì)量語(yǔ)音編碼算法實(shí)用化的需求也越來(lái)越迫切。１６ｋｂｉｔ／ｓＬＤ－ＣＥＬＰＩＴＵ－ＴＧ．７２８語(yǔ)音編碼標(biāo)準(zhǔn)，采用后向自適應(yīng)技術(shù)，單向編碼延遲小于２ｍｓ，主觀評(píng)價(jià)ＭＯＳ分４．０，達(dá)到進(jìn)入公眾通信網(wǎng)的需求，因而廣泛適用于數(shù)字衛(wèi)星系統(tǒng)、數(shù)字線路倍增設(shè)備（ＤＣＭＥ）、綜合業(yè)務(wù)數(shù)字網(wǎng)（ＩＳＤＮ）、公共交換電話網(wǎng)（ＰＳＴＮ）、話音存儲(chǔ)轉(zhuǎn)發(fā)系統(tǒng)等。但其算法復(fù)雜度高，運(yùn)算量龐大，定點(diǎn)實(shí)現(xiàn)時(shí)，一路全雙工約需３０～４０ＭＩＰＳ。一般通用的數(shù)字信號(hào)處理器（ＤＳＰ），只能做到一片ＤＳＰ實(shí)現(xiàn)一路Ｇ．７２８語(yǔ)音編解碼。

ＴＭＳ３２０Ｃ６２０１是ＴＩ公司最新推出的Ｃ６Ｘ數(shù)字信號(hào)處理芯片系列中具代表性的定點(diǎn)處理芯片。由于內(nèi)部含有具備超長(zhǎng)指令字（ＶＬＩＷ）處理能力的ＣＰＵ和８?jìng)€(gè)功能單元，故它可在一個(gè)時(shí)鐘周期內(nèi)執(zhí)行多達(dá)８條指令。此外，１Ｍ位的片內(nèi)ＲＡＭ、可擴(kuò)展的外部ＲＡＭ接口和靈活的外圍設(shè)備使其成為實(shí)現(xiàn)具有高速運(yùn)算的復(fù)雜處理系統(tǒng)的首選芯片。

本文研究了在單片ＴＭＳ３２０Ｃ６２０１芯片上實(shí)時(shí)實(shí)現(xiàn)ＩＴＵ－ＴＧ．７２８語(yǔ)音編碼標(biāo)準(zhǔn)，實(shí)驗(yàn)結(jié)果表明，單片ＴＭＳ３２０Ｃ６２０１能實(shí)現(xiàn)至少４路語(yǔ)音編解碼。這對(duì)于擴(kuò)展基于Ｇ．７２８標(biāo)準(zhǔn)的單路處理系統(tǒng)的功能或降低基于Ｇ．７２８標(biāo)準(zhǔn)的多路處理系統(tǒng)的系統(tǒng)復(fù)雜度都具有現(xiàn)實(shí)的意義。

文中將扼要介紹Ｇ．７２８編解碼算法和ＴＭＳ３２０Ｃ６２０１芯片，并詳細(xì)討論Ｇ．７２８算法在ＴＭＳ３２０Ｃ６２０１上的實(shí)時(shí)實(shí)現(xiàn)，最后給出結(jié)論。

１Ｇ.７２８語(yǔ)音編解碼原理簡(jiǎn)介

圖１給出了Ｇ．７２８語(yǔ)音編解碼器的原理框圖。

編碼器中五個(gè)連續(xù)語(yǔ)音樣點(diǎn)形成一個(gè)５維語(yǔ)音矢量。激勵(lì)碼本中共有１０２４個(gè)５維的碼矢量，對(duì)于每個(gè)輸入語(yǔ)音矢量，編碼器利用合成分析法從碼本中搜索出最佳碼矢，然后將其標(biāo)號(hào)選出，ＬＰ系數(shù)和增益均由后向自適應(yīng)提取和更新。

解碼操作也是逐個(gè)矢量地進(jìn)行。根據(jù)接收到的碼本標(biāo)號(hào)，從激勵(lì)碼本中找到相應(yīng)的激勵(lì)矢量，經(jīng)過(guò)增益調(diào)整后得到激勵(lì)信號(hào)，將其輸入綜合濾波器合成語(yǔ)音信號(hào)，再經(jīng)自適應(yīng)后濾波處理，以增強(qiáng)語(yǔ)音的主觀感覺(jué)質(zhì)量。

由于編碼器只緩沖５個(gè)樣點(diǎn)（一個(gè)語(yǔ)音矢量），在８ｋＨｚ的采樣率下，算法延遲只有０．６２５ｍｓ，加上處理延遲和傳輸延遲，故總的單向編碼延遲小于２ｍｓ。采用后向自適應(yīng)技術(shù)，預(yù)測(cè)器參數(shù)在解碼端通過(guò)ＬＰ分析恢復(fù)，不再作為傳輸內(nèi)容，編解碼器間僅需傳送最佳碼矢的索引值，故碼率為１０ｂｉｔ／０．６２５ｍｓ＝１６ｋｂｉｔ／ｓ。

２ＴＭＳ３２０Ｃ６２０１定點(diǎn)數(shù)字信號(hào)處理芯片簡(jiǎn)介

ＴＭＳ３２０Ｃ６２０１是美國(guó)德州儀器公司（ＴＩ）最新推出的含多處理單元的Ｃ６Ｘ?cái)?shù)字信號(hào)處理芯片中具有代表性的定點(diǎn)芯片。ＶＬＩＷ結(jié)構(gòu)提供的高輸出量、高效開(kāi)發(fā)工具保證的易用性、以及可接受的價(jià)格，使得ＴＭＳ３２０Ｃ６２０１成為高速運(yùn)算的理想選擇。以下從硬件結(jié)構(gòu)和軟件資源兩方面，簡(jiǎn)要介紹ＴＭＳ３２０Ｃ６２０１芯片。

２.１Ｃ６２０１的硬件結(jié)構(gòu)

２.１.１ＣＰＵ

采用了ＶｅｌｏｃｉＴＩ的ＶＬＩＷ結(jié)構(gòu)，因而在每個(gè)時(shí)鐘周期內(nèi)最多可并行執(zhí)行八條３２位寬（一個(gè)字長(zhǎng)）的指令，在２００ＭＨｚ的主頻下可以得到１６００ＭＩＰＳ的高處理速度。ＣＰＵ中包括了兩套對(duì)稱的運(yùn)算單元（Ｌ，Ｓ，Ｍ，Ｄ）和相應(yīng)的兩套寄存器組，每組有１６個(gè)３２位寬的寄存器。

２.１.２存儲(chǔ)空間

Ｃ６２０１的地址總線為３２位，尋址范圍達(dá)到４ＧＢ。存儲(chǔ)空間可分為四部分：片內(nèi)程序空間、片內(nèi)數(shù)據(jù)空間、外部存儲(chǔ)空間和內(nèi)部外圍設(shè)備空間，可通過(guò)對(duì)五個(gè)ＢＯＯＴＭＯＤＥ引腳的靈活設(shè)置設(shè)定各空間的地址范圍。片內(nèi)數(shù)據(jù)空間分成四個(gè)８Ｋ×１６的交織塊，使得ＣＰＵ可同時(shí)訪問(wèn)數(shù)據(jù)ＲＡＭ的兩個(gè)塊而不會(huì)發(fā)生沖突。片內(nèi)程序空間可設(shè)為Ｃａｃｈｅ，存儲(chǔ)經(jīng)常使用的代碼，減少片外訪問(wèn)次數(shù)，從而提高程序運(yùn)行速度。

２.１.３外設(shè)

Ｃ６２０１的外圍設(shè)備包括ＤＭＡ控制器、主機(jī)接口（ＨＰＩ）、中斷選擇等。兩個(gè)多通道緩存串行口（ＭｃＢＳＰ，除多通道、雙緩存外，還支持多種數(shù)據(jù)格式、硬件Ａ／μ率壓擴(kuò)、位時(shí)鐘和幀時(shí)鐘的靈活編程。

２．２Ｃ６２０１的軟件資源

２．２．１豐富的指令

Ｃ６２０１的指令集共有五十余條指令，大部分是單周期的，可完成數(shù)據(jù)傳輸、算術(shù)邏輯運(yùn)算和程序控制等功能。指令支持８／１６／３２位數(shù)據(jù)存取，給不同結(jié)構(gòu)的數(shù)據(jù)操作帶來(lái)方便。由于多處理單元的采用，在無(wú)資源沖突下，Ｃ６２０１最多可并行執(zhí)行８條基本指令。

２．２．２流水線操作

流水線操作和超長(zhǎng)指令字是Ｃ６２０１的高性能特點(diǎn)。其指令執(zhí)行可分為四個(gè)步驟：取指（Ｆｅｔｃｈ）、指令拆裝（Ｄｉｓｐａｔｃｈ）、譯碼（Ｄｅｃｏｄｅ）、執(zhí)行（Ｅｘｅｃｕｔｅ）。流水線操作即指以上四個(gè)步驟的并行操作。由于引入了多單元結(jié)構(gòu)和超長(zhǎng)指令字，所以和常見(jiàn)的數(shù)字處理芯片相比，多了一個(gè)指令拆裝的過(guò)程。

２．２．３靈活的尋址方式

Ｃ６２０１支持多種尋址方式，如寄存器尋址、直接尋址、短立即數(shù)尋址、長(zhǎng)立即數(shù)尋址和相對(duì)尋址。此外，它還提供循環(huán)尋址方式，適用于相關(guān)和卷積運(yùn)算中的存儲(chǔ)器尋址。

３Ｇ.７２８在ＴＭＳ３２０Ｃ６２０１上的實(shí)時(shí)實(shí)現(xiàn)

３．１硬件結(jié)構(gòu)

由上面介紹的ＴＭＳ３２０Ｃ６２０１的結(jié)構(gòu)特點(diǎn)可見(jiàn)，以Ｃ６２０１為核心器件，輔以相應(yīng)的輸入輸出電路，可完成對(duì)單路語(yǔ)音信號(hào)的實(shí)時(shí)編解碼工作，同時(shí)具備多路（如Ｔ１／Ｅ１一次群）語(yǔ)音信號(hào)的輸入輸出接口。

本文應(yīng)用了ＴＩ公司的ＴＭＳ３２０Ｃ６２０１ＥＶＭ板。板上配有單片ＴＭＳ３２０Ｃ６２０１和與串口ＭｃＢＳＰ０連接的１６位Ａ／Ｄ芯片ＣＳ４２３１。ＥＶＭ板通過(guò)ＩＳＡ總線與ＰＣ機(jī)相連，啟動(dòng)時(shí)由ＰＣ機(jī)將程序裝載入Ｃ６２０１的片內(nèi)存儲(chǔ)空間，在Ｃ６２０１全速運(yùn)行時(shí)，ＰＣ機(jī)可以查詢其運(yùn)行狀態(tài)，讀取壓縮后的Ｇ．７２８碼流，或送入待解碼的Ｇ．７２８碼流。串口０接ＣＳ４２３１，用于接收和發(fā)送模擬信號(hào)；串口１用于接收和發(fā)送已壓縮的Ｇ．７２８碼流，因此系統(tǒng)可仿真實(shí)現(xiàn)單路Ｇ．７２８語(yǔ)音編解碼。通過(guò)進(jìn)一步對(duì)算法復(fù)雜度的分析，可判斷多路Ｇ．７２８編解碼的實(shí)現(xiàn)能力。

３．２軟件開(kāi)發(fā)

編解碼軟件采用定點(diǎn)算法，用標(biāo)準(zhǔn)ＡＮＳＩＣ語(yǔ)言和ＴＭＳ３２０Ｃ６２０１匯編語(yǔ)言混合編制完成。軟件包括主處理程序和中斷服務(wù)程序，流程圖如圖２所示。

在編程中，需注意以下幾點(diǎn)：

（１）雙緩沖區(qū)的運(yùn)用

為實(shí)時(shí)處理輸入語(yǔ)音和合成語(yǔ)音，避免數(shù)據(jù)覆蓋，必須設(shè)置兩個(gè)雙緩沖區(qū)。對(duì)編碼過(guò)程而言，當(dāng)串口將語(yǔ)音信號(hào)寫(xiě)入輸入緩沖區(qū)Ａ?xí)r，編碼器處理輸入緩沖區(qū)Ｂ中已存儲(chǔ)的５個(gè)語(yǔ)音樣點(diǎn)；同理，對(duì)解碼過(guò)程，當(dāng)串口送出輸出緩沖區(qū)Ａ’中合成語(yǔ)音時(shí)，解碼器的輸出結(jié)果寫(xiě)入緩沖區(qū)Ｂ’。在中斷程序中，計(jì)數(shù)判斷何時(shí)切換相應(yīng)緩沖區(qū)。

（２）數(shù)據(jù)精度的處理

Ｃ６２０１是定點(diǎn)ＤＳＰ芯片，為確保運(yùn)算精度和防止數(shù)據(jù)溢出，在實(shí)現(xiàn)時(shí)主要采用了兩種方法：一是對(duì)某些精度要求較高的運(yùn)算，將計(jì)算的中間變量采用３２位來(lái)表示；二是對(duì)于幅度范圍變化比較大的變量或數(shù)組，如激勵(lì)增益、５０階杜賓算法的自相關(guān)數(shù)組等，采用標(biāo)量浮點(diǎn)或塊浮點(diǎn)表示，用一個(gè)字存儲(chǔ)使該數(shù)或數(shù)組歸一化所需的左移位數(shù)（ＮＬＳ），其余字存儲(chǔ)歸一化后的尾數(shù)。

（３）存儲(chǔ)空間的分配

Ｃ６２０１１Ｍ位的片內(nèi)存儲(chǔ)區(qū)包括６４Ｋｂｙｔｅ程序空間和６４Ｋｂｙｔｅ數(shù)據(jù)空間，足夠單路Ｇ．７２８編解碼算法的使用。但若應(yīng)用于多路語(yǔ)音處理，則需謹(jǐn)慎分配存儲(chǔ)空間。由于編解碼程序、常數(shù)表格等均可公用，多路應(yīng)用主要考慮數(shù)據(jù)空間的使用。對(duì)臨時(shí)變量、數(shù)組等采用公共域（ＵＮＩＯＮ）分時(shí)存儲(chǔ)技術(shù)，能有效提高存儲(chǔ)空間的利用率，確保全部數(shù)據(jù)都在片內(nèi)處理。

（４）計(jì)算量的均衡

Ｃ６２０１的高速運(yùn)算能力，使實(shí)現(xiàn)Ｇ．７２８編解碼算法不再需要考慮運(yùn)算量的均衡。但若考慮到與其它實(shí)時(shí)性要求高的控制處理模塊協(xié)調(diào)工作，則仍需按標(biāo)準(zhǔn)中介紹的方法均衡運(yùn)算量。

３.３軟件優(yōu)化

ＴＭＳ３２０Ｃ６２０１的代碼開(kāi)發(fā)流程與傳統(tǒng)ＤＳＰ截然不同，它是一個(gè)不斷調(diào)整Ｃ代碼與線性匯編代碼比例的過(guò)程，力求在性能與開(kāi)發(fā)周期上尋得最佳平衡點(diǎn)。代碼開(kāi)發(fā)有三步：

第一步，在通用的Ｃ平臺(tái)上開(kāi)發(fā)ＡＮＳＩＣ代碼，調(diào)試通過(guò)后不做任何變化地移植到Ｃ６２０１開(kāi)發(fā)平臺(tái)上，由Ｃ編譯器完成所有的優(yōu)化。利用測(cè)試工具判斷代碼性能是否達(dá)到要求，從而決定是否需要后續(xù)的優(yōu)化步驟。這一階段，開(kāi)發(fā)者不需要對(duì)ＤＳＰ有所了解，開(kāi)發(fā)容易，但Ｃ編譯器優(yōu)化后的代碼并行性差，未能充分利用Ｃ６２０１獨(dú)特的硬件結(jié)構(gòu)和軟件資源，運(yùn)行效率低。

第二步，優(yōu)化Ｃ代碼。在此階段，開(kāi)發(fā)者應(yīng)該根據(jù)Ｃ６２０１的特點(diǎn)，如充分利用數(shù)據(jù)寬度、使用內(nèi)在函數(shù)等，對(duì)Ｃ代碼加以改進(jìn)。這一階段要求開(kāi)發(fā)者了解Ｃ６２０１ＤＳＰ并掌握常用的技巧。經(jīng)過(guò)此步優(yōu)化后，代碼的效率將大幅度提高。

第三步，編寫(xiě)線性匯編代碼。當(dāng)上一步的優(yōu)化仍不能滿足要求時(shí)，就必須把那些對(duì)效率影響重大的模塊抽取出來(lái)，改由線性匯編語(yǔ)言實(shí)現(xiàn)。在這一階段，編程者一定要對(duì)Ｃ６２０１ＤＳＰ有深入的了解并具備一定的編程經(jīng)驗(yàn)，才能較好地解決諸如資源分配、消除數(shù)據(jù)的關(guān)聯(lián)性等關(guān)鍵問(wèn)題。此步優(yōu)化難度較大，但運(yùn)用于核心模塊，能顯著提高代碼的并行性。

在ＴＭＳ３２０Ｃ６２０１優(yōu)化Ｇ．７２８代碼過(guò)程中，主要應(yīng)用了以下技巧：

（１）資源分配的技巧

Ｃ６２０１的８?jìng)€(gè)功能單元能并行處理，因此在一個(gè)算法中用得最多的那個(gè)運(yùn)算單元會(huì)構(gòu)成瓶頸。最常發(fā)生的是內(nèi)存訪問(wèn)瓶頸，循環(huán)展開(kāi)是有效的解決方法。充分利用數(shù)據(jù)寬度，將半字（１６ｂｉｔ）訪問(wèn)改用字（３２ｂｉｔ）訪問(wèn)就是簡(jiǎn)單而又有效的循環(huán)展開(kāi)技術(shù)。

循環(huán)展開(kāi)是提高資源利用率的主要方法，但它所引起的代碼空間膨脹也是驚人的。在編程時(shí)，必須在程序空間和程序速度這一對(duì)矛盾中作出合適的折衷。

（２）數(shù)據(jù)關(guān)聯(lián)性簡(jiǎn)化的技巧

數(shù)據(jù)關(guān)聯(lián)性是并行編程中的最大障礙，有兩種典型情況：

① 存在循環(huán)反饋路徑

此種路徑常見(jiàn)于遞歸算法中。當(dāng)下一次的循環(huán)中必須讀取上一次循環(huán)中產(chǎn)生的數(shù)據(jù)，就形成了一條循環(huán)反饋路徑。由于反饋路徑不可能消除，唯一的方法是盡量縮短它，減少不可并行的操作。

② 生存期過(guò)長(zhǎng)

當(dāng)變量生存期過(guò)長(zhǎng)時(shí)，軟件流水化會(huì)導(dǎo)致誤操作。有兩種解決方法：一是循環(huán)展開(kāi)，因?yàn)檠h(huán)展開(kāi)會(huì)增加循環(huán)核心周期數(shù)；二是用ＭＶ指令增加一個(gè)中間變量，使原變量的生存期由兩個(gè)變量共同承擔(dān)。

（３）解決存儲(chǔ)空間沖突的技巧

此沖突是引起Ｃ６２０１執(zhí)行速度急劇下降的主要原因，但在編程時(shí)卻很容易被忽略。前面介紹的Ｃ６２０１的存儲(chǔ)區(qū)結(jié)構(gòu)，６４Ｋｂｙｔｅ的片內(nèi)數(shù)據(jù)空間分成四塊，每一塊在每個(gè)周期只能被訪問(wèn)一次，否則就會(huì)產(chǎn)生存儲(chǔ)空間沖突。執(zhí)行時(shí)，流水線會(huì)自動(dòng)暫停一個(gè)周期。

在調(diào)試、優(yōu)化程序的過(guò)程中，隨時(shí)觀察有無(wú)流水線沖突，通過(guò)調(diào)整存儲(chǔ)空間分配，可基本解決這一問(wèn)題。

３.４實(shí)驗(yàn)結(jié)果

表１給出了Ｇ．７２８編解碼算法實(shí)時(shí)實(shí)現(xiàn)時(shí)所需的計(jì)算量和內(nèi)存占用狀況。在２００ＭＨｚ主頻下，ＴＭＳ３２０Ｃ６２０１芯片處理能力為２００ＭＣＰＳ（ＭｉｌｌｉｏｎＣｙｃｌｅｐｅｒＳｅｃｏｎｄ，在最充分發(fā)揮并行潛力時(shí)，可達(dá)到１６００ＭＣＰＳ（２００×８＝１６００）。由表中可見(jiàn)，Ｇ．７２８算法實(shí)現(xiàn)編碼需２４．４ＭＣＰＳ，解碼需１４．３ＭＣＰＳ，程序空間和數(shù)據(jù)空間分別占用５５．８Ｋｂｙｔｅ和１１．４Ｋｂｙｔｅ，故單片Ｃ６２０１可實(shí)現(xiàn)四路Ｇ．７２８語(yǔ)音編解碼。

表1 G.728編解碼復(fù)雜度分析

編碼復(fù)雜度	解碼復(fù)雜度	程序空間	數(shù)據(jù)空間
24.4MCPS	14.3MCPS	55.8Kbyte	11.4Kbyte

對(duì)編解碼器還進(jìn)行了實(shí)時(shí)處理語(yǔ)音性能的實(shí)驗(yàn)。以男生、女生、音樂(lè)等多種音源輸入的實(shí)驗(yàn)表明，系統(tǒng)具有良好的適應(yīng)性。非正式試聽(tīng)測(cè)試，恢復(fù)語(yǔ)音保留了較好的講話人特征，具有較高的自然度和可懂度。

ＩＴＵ－ＴＧ．７２８標(biāo)準(zhǔn)在較低碼率下實(shí)現(xiàn)了低延時(shí)、高質(zhì)量的語(yǔ)音編解碼，在公眾通信網(wǎng)中有著廣泛的應(yīng)用。本文在新型ＴＭＳ３２０Ｃ６２０１定點(diǎn)ＤＳＰ芯片上設(shè)計(jì)了基于Ｇ．７２８的實(shí)時(shí)語(yǔ)音編解碼系統(tǒng)。由于充分發(fā)揮了Ｃ６２０１強(qiáng)大的運(yùn)算能力和系統(tǒng)接口能力，系統(tǒng)構(gòu)造簡(jiǎn)單，運(yùn)行效率高，單片Ｃ６２０１至少能實(shí)現(xiàn)四路Ｇ．７２８語(yǔ)音編解碼。

新聞中心

用ＴＭＳ３２０Ｃ６２０１實(shí)現(xiàn)多路ＩＴＵ－ＴＧ．７２８語(yǔ)音編碼標(biāo)準(zhǔn)

評(píng)論

相關(guān)推薦

技術(shù)專區(qū)