<meter id="pryje"><nav id="pryje"><delect id="pryje"></delect></nav></meter>

<label id="pryje"></label>

新聞中心

EEPW首頁(yè) > 嵌入式系統(tǒng) > 設(shè)計(jì)應(yīng)用 > G.723.1算法在DSP上的優(yōu)化

G.723.1算法在DSP上的優(yōu)化

作者：時(shí)間：2010-04-17 來源：網(wǎng)絡(luò)

加入技術(shù)交流群
- 掃碼加入
  和技術(shù)大咖面對(duì)面交流
  海量資料庫(kù)查詢

收藏

1 引言

　　G.723.1是刪組織于1996年推出的一種低碼率的語(yǔ)音編碼算法標(biāo)準(zhǔn)，也是目前該組織頒布的語(yǔ)音壓縮標(biāo)準(zhǔn)中碼率最低的一種標(biāo)準(zhǔn)。G.723.1主要用于對(duì)語(yǔ)音及其它多媒體聲音信號(hào)的壓縮，目前在一些數(shù)字音視頻傳輸、高質(zhì)量語(yǔ)音壓縮等系統(tǒng)中都得到廣泛應(yīng)用。

本文引用地址：http://www.ex-cimer.com/article/151916.htm

　　2 G.723.1算法的復(fù)雜度分析

　　將G.723.1移植到TMS320C64xx后，就可借助TI集成開發(fā)工具CCS(Code Composer Studio)的Profile功能來評(píng)估其各個(gè)子程序或函數(shù)的執(zhí)行運(yùn)算量，從而把程序的優(yōu)化集中在對(duì)程序性能影響最大的代碼上去。

　　通過分析可以看出，在G.723.1的編解碼算法中，碼本搜索所花費(fèi)的運(yùn)算量是比較大的，如Find_Best()，F(xiàn)ind_Fcbk()，F(xiàn)ind_Acbk()：另外，在LPC分析和LSP參數(shù)的計(jì)算上也有運(yùn)算量比較大的，如Comp_Lpc()，Lsp_Qnt()，Lsp_Svq()。

　　3 代碼的優(yōu)化

　　代碼優(yōu)化的工作有兩大目的：一是執(zhí)行速度提高，實(shí)現(xiàn)實(shí)時(shí)；二是盡量不擴(kuò)大程序體積(Code Size)，使之在內(nèi)存允許的范圍內(nèi)。顯然，兩者存在一定的矛盾，當(dāng)今超大規(guī)模集成電路的發(fā)展使RAM資源不再是系統(tǒng)的瓶頸，因此該部分工作的主要任務(wù)是怎樣提高執(zhí)行速度。代碼的優(yōu)化工作主要在CCS環(huán)境中進(jìn)行。優(yōu)化的原則是要充分考慮C64xx處理器超長(zhǎng)指令字、多個(gè)運(yùn)算單元和深度流水線的結(jié)構(gòu)特點(diǎn)，以及避免過多的讀寫內(nèi)存指令和程序轉(zhuǎn)移指令，充分發(fā)揮其強(qiáng)大的運(yùn)算能力。具體方法包括(次序有先后)：

　　3．1基本運(yùn)算集的優(yōu)化

　　G.723.1算法程序是用定點(diǎn)運(yùn)算完成浮點(diǎn)運(yùn)算，為了防止定點(diǎn)運(yùn)算時(shí)可能溢出，許多運(yùn)算需要進(jìn)行飽和判斷，為此程序?qū)ｉT定義了基本運(yùn)算集，實(shí)現(xiàn)諸如飽和加法、飽和乘法、除法和移位等操作。在程序中這些操作調(diào)用相當(dāng)頻繁，經(jīng)CCS的profile工具測(cè)試，基本運(yùn)算函數(shù)集的調(diào)用占用了95％以上的CPU時(shí)間。因此，我們要從基本運(yùn)算集的優(yōu)化開始。在熟悉掌握C64xx指令集的前提下，分析基本運(yùn)算集中各個(gè)函數(shù)完成的悉掌握C64xx指令集的前提下，分析基本運(yùn)算集中各個(gè)函數(shù)完成的功能和對(duì)全局變量產(chǎn)生的影響，用C64xx指令取而代之或加以改編。其中包括對(duì)跳轉(zhuǎn)和流水線的優(yōu)化討論、對(duì)乘積的飽和調(diào)整和全局變量OveRFlow的相關(guān)操作。

　　由于基本運(yùn)算集以函數(shù)形式存在，兩次跳轉(zhuǎn)f函數(shù)的調(diào)用與返回1必不可少，將引起流水線的兩次打斷，表現(xiàn)為12個(gè)指令周期的占用。將這嶁基本運(yùn)算函數(shù)集改成宏的形式，即將基本運(yùn)算內(nèi)嵌(inline)至lJ調(diào)用程序中，由此町以消除跳轉(zhuǎn)和流水線打斷帶來的指令周期占用，提高執(zhí)行速度。雖然這樣做增加了代碼長(zhǎng)度，多占用了一些內(nèi)存，但由于基本運(yùn)算函數(shù)體積均較小，再經(jīng)過一定的代碼優(yōu)化，在程序體積上的犧牲幾乎町以忽略。

　　基本運(yùn)算的函數(shù)定義在BASIC．C文件里面，如果能夠?qū)@些簡(jiǎn)單甬?dāng)?shù)進(jìn)行內(nèi)聯(lián)指令(intrinsic)的優(yōu)化，就能達(dá)到事半功倍的效果。內(nèi)聯(lián)指令是匯編指令的直接映射，具有很高的效率。與此同時(shí)帶來的一個(gè)問題是溢出保護(hù)位Overflow的判斷，這是基本函數(shù)里用來標(biāo)識(shí)溢出的全局變量，它的作用等同于CSR(Control Status Register)寄存器的SAT(Saturation)位，當(dāng)數(shù)據(jù)溢出時(shí)，SAT位被系統(tǒng)自動(dòng)設(shè)置為1，所以編解碼函數(shù)里對(duì)Overflow的判斷可以轉(zhuǎn)化成對(duì)SAT位的判斷。引用CSR寄存器時(shí)需要在最開始的時(shí)候聲明extem cregister volatile ansigned int CSR。

　　C64xx指令提供了飽和乘法指令SMPY，實(shí)現(xiàn)1616位的乘法與飽和結(jié)果調(diào)整，其執(zhí)行操作如下：

　　if(cond){

　　if((src 1*src21)!=0x80000000)

　　dst=((src 1*src2)1)；

　　else

　　dst=0x7ffffff；

　　}

　　else

　　nop；

　　將原指令中的乘法指令改為SMPY．就可以完成乘法和飽和調(diào)整兩種計(jì)算，這樣可以省去飽和調(diào)整3條指令。與此類似，其它的飽和運(yùn)算，C64xx都提供了相應(yīng)的指令實(shí)現(xiàn)，將普通運(yùn)算指令替換為飽和運(yùn)算指令，飽和結(jié)果調(diào)整部分的運(yùn)算均可以省去。

　　3．2主程序的優(yōu)化

　　主程序的優(yōu)化手段主要采用了以下幾種方法：

　　(1)使用內(nèi)聯(lián)函數(shù)(intrinsics)

　　內(nèi)聯(lián)函數(shù)是可直接映射為C64xx指令的特殊函數(shù)，它在指令前加上_”表示。例如：

　　#define L_add(L_var1，L_var2) _sadd(L_var1，L_var2)

　　#define L_mult(var1，vat2) _smpy(var1，var2)

　　等，基本函數(shù)的內(nèi)聯(lián)優(yōu)化需要對(duì)原函數(shù)的定義和內(nèi)聯(lián)指令都比較熟悉。

　　使用內(nèi)聯(lián)函數(shù)代替相應(yīng)的C語(yǔ)句是一種非常簡(jiǎn)便高效的優(yōu)化方法。如上面提到的飽和乘法，在C語(yǔ)句中。我們通常要使用兩個(gè)嵌套的條件判斷語(yǔ)句來檢查結(jié)果是否溢出，而指令int_smpy(int a．int b) 則在完成乘b的運(yùn)算后，再做一次飽和處理，這樣一條DSP指令就可完成C語(yǔ)言中多條語(yǔ)句才能完成的計(jì)算，可以節(jié)省很多時(shí)鐘周期。

　　(2)循環(huán)展開(loop―unrolling)

　　程序中的有很多的雙重循環(huán)和多暈循環(huán)(比如代數(shù)碼本搜索計(jì)算)，由于C64xx優(yōu)化器在優(yōu)化時(shí)只在最內(nèi)層循環(huán)中形成一個(gè)指令流水(最多可以達(dá)到8級(jí)流水)，這樣循環(huán)語(yǔ)句就不能充分利用軟件流水線，而且對(duì)于內(nèi)部循環(huán)次數(shù)較少的情況，消耗在prolog和eplog上的時(shí)鐘周期也不可忽視。針對(duì)這種情況，一個(gè)有效的辦法就是將雙重或多重循環(huán)展開，降低循環(huán)次數(shù)。這樣雖然代碼長(zhǎng)度增加了，但有更多的運(yùn)算能夠參加到pipeline中。由于減少了流水線排空和提高了功能單元的利用率，程序執(zhí)行速度會(huì)大大提高。

　　(3)減少分支和調(diào)用指令，減少判斷指令

　　程序中的分支、調(diào)用以及判斷指令會(huì)引起程序的跳轉(zhuǎn)，而每個(gè)跳轉(zhuǎn)指令都有5個(gè)延遲間隙。因此延長(zhǎng)了程序執(zhí)行時(shí)間；另外，循環(huán)內(nèi)跳轉(zhuǎn)也會(huì)使軟件流水受到阻塞，降低了代碼執(zhí)行效率。優(yōu)化中，可以使用內(nèi)嵌、合并判斷語(yǔ)句來減少判斷次數(shù)或用邏輯指令替代判斷的方法盡可能的消除中斷流水線指令帶來的影響。

　　(4)使用字或雙字存取和計(jì)算

　　C64xx系列DSP是32位CPU，當(dāng)16位數(shù)據(jù)在內(nèi)存中連續(xù)存放時(shí)，可利用uint_amem4(void*ptr)或double _amemd8 (void*ptr)指令進(jìn)行字或雙字?jǐn)?shù)據(jù)的讀取或存貯。這樣每次可同時(shí)存取2個(gè)或4個(gè)16位數(shù)據(jù)，由于從內(nèi)存執(zhí)行取數(shù)操作需要4個(gè)delay，所以減少存取次數(shù)可以節(jié)省大量的時(shí)鐘同期；同時(shí)，可利用C64xx指令集中特有的打包指令_pack2(unsigned a，unsigned b)，_packh2(unsigned a，unsigned b)等將兩個(gè)16位數(shù)打包成一個(gè)32位數(shù)，在進(jìn)行乘、加計(jì)算時(shí)則利用_add 2(int a，int b)、_mpy2(int a，int b)同時(shí)完成兩組16位數(shù)的加法和乘法，效率比單純16位數(shù)的加法和乘法提高一倍。

上一頁(yè) 1 2 下一頁(yè)

<a target='_blank'><img src='https://ad.eepw.com.cn/www/delivery/avw.php?zoneid=114&cb=INSERT_RANDOM_NUMBER_HERE&n=a7a83b30' border='0' alt='' /></a>
<a target='_blank'><img src='https://ad.eepw.com.cn/www/delivery/avw.php?zoneid=115&cb=INSERT_RANDOM_NUMBER_HERE&n=a3d98779' border='0' alt='' /></a>
<a target='_blank'><img src='https://ad.eepw.com.cn/www/delivery/avw.php?zoneid=116&cb=INSERT_RANDOM_NUMBER_HERE&n=abca108c' border='0' alt='' /></a>
<a target='_blank'><img src='https://ad.eepw.com.cn/www/delivery/avw.php?zoneid=117&cb=INSERT_RANDOM_NUMBER_HERE&n=a1775170' border='0' alt='' /></a>
<a target='_blank'><img src='https://ad.eepw.com.cn/www/delivery/avw.php?zoneid=118&cb=INSERT_RANDOM_NUMBER_HERE&n=a449048b' border='0' alt='' /></a>

關(guān)鍵詞： 優(yōu)化 DSP 算法 G.723.1

評(píng)論

相關(guān)推薦

高性能系列DSP上TCP2/VCP2協(xié)處理器

視頻 TI DSP VCP2 TCP2 協(xié)處理器 | 2009-10-16

TMS320LF240x DSP應(yīng)用程序設(shè)計(jì)教程

資源下載 TI TMS320LF240x DSP 應(yīng)用程序設(shè)計(jì) | 2007-12-08

嵌入式圖形界面GUI-1，需要的請(qǐng)排隊(duì)！

jackwang | 2002-05-21

AST MPX-1型彩色顯示器的電源電路圖

設(shè)計(jì)方案 MPX-1 彩色顯示器電源電路圖 | 2009-07-06

DSP芯片的原理與開發(fā)應(yīng)用

資源下載 TI DSP 開發(fā)原理 | 2007-12-15

三星電子重申 SF1.4 工藝有望于 2027 年量產(chǎn)，計(jì)劃進(jìn)軍共封裝光學(xué)領(lǐng)域

EDA/PCB 三星 1.4nm 晶圓代工 | 2024-06-13

華為最強(qiáng)科普：什么是DSP？

嵌入式系統(tǒng) DSP | 2024-05-20

實(shí)測(cè)藍(lán)牙Mesh 1.1性能更新深入理解并徹底優(yōu)化

手機(jī)與無(wú)線通信 Silicon Labs 藍(lán)牙Mesh 1.1 | 2024-07-22

嵌入式開發(fā)者都該了解的十大算法

嵌入式開發(fā)者算法 | 2024-07-16

DSP 入門教程

資源下載 TI DSP 選型技術(shù)介紹 | 2007-12-14

DSP芯片介紹

資源下載 TI DSP 芯片介紹 | 2007-12-16

C64+ 系列DSP上Cache 的應(yīng)用（第一部分）

視頻 TI DSP C64+ Cache | 2009-10-16

通信接收機(jī)：DSP、軟件無(wú)線電和設(shè)計(jì)

資源下載 DSP 軟件無(wú)線電通信接收機(jī) | 2007-12-11

KJZ2-1單相調(diào)功板電原理圖

設(shè)計(jì)方案 KJZ2-1 單相調(diào)功板電原理 | 2009-07-06

AST-1型彩色顯示器的電源電路圖

設(shè)計(jì)方案 AST-1 彩色顯示器電源電路圖 | 2009-07-06

安捷倫(Agilent)科技公司的網(wǎng)絡(luò)優(yōu)化測(cè)試儀

hpnet | 2002-05-17

超強(qiáng)整理！電機(jī)控制算法

電機(jī) 算法 BLDC | 2024-05-21

[轉(zhuǎn)帖]us/os就緒表的維護(hù)算法分析

amine | 2002-05-17

研華發(fā)布RK3588 SMARC 2.1核心模塊ROM-6881助力機(jī)器視覺應(yīng)用智能升級(jí)

工控自動(dòng)化研華 RK3588 SMARC 2.1 ROM-6881 機(jī)器視覺 | 2024-06-18

恩智浦SAF9xxx發(fā)布，汽車AI音頻處理升級(jí)！

汽車電子汽車音頻 DSP SDV 汽車娛樂系統(tǒng) | 2024-06-21

NEC JC-1404HMN-1型多頻TTL和VGA大屏幕彩色顯示器的電源電路圖

設(shè)計(jì)方案 JC-1404HMN-1 多頻大屏幕彩色顯示器電源 | 2009-07-06

充電器算法復(fù)雜傳統(tǒng)MCU難以勝任？不如試試這些集成DSP內(nèi)核的MCU

嵌入式系統(tǒng) DSP MCU | 2024-05-15

專為客戶設(shè)計(jì)的高性能器件系列

視頻 TI DSP TMS320C6474 C6474 AIF | 2009-10-16

大聯(lián)大友尚集團(tuán)推出基于ST產(chǎn)品的140W USB PD3.1快充方案

電源與新能源友尚集團(tuán) ST 140W USB PD3.1 快充方案 | 2024-07-18

TI DSP開發(fā)工具CCS上AET調(diào)試功能

視頻 TI DSP DSP AET CCS | 2009-10-16

C64+ 系列DSP上Cache 的應(yīng)用（第二部分）

視頻 TI DSP C64+ Cache | 2009-10-16

我國(guó)無(wú)線網(wǎng)絡(luò)規(guī)劃、優(yōu)化和管理的現(xiàn)狀與發(fā)展

hpnet | 2002-05-17

百盛BS-2506-1型ATX開關(guān)電源(TL494) 電路

設(shè)計(jì)方案百盛 BS-2506-1 開關(guān)電源 TL494 電路 | 2009-07-06

網(wǎng)絡(luò)維護(hù)幾種優(yōu)化工具

hpnet | 2002-05-17

SHIPT算法擠壓了外包工人如何對(duì)雇主進(jìn)行審計(jì)

智能計(jì)算 SHIPT 算法算法管理 | 2024-07-04

焦點(diǎn)

推薦視頻

技術(shù)專區(qū)

看屁屁www成人影院,亚洲人妻成人图片,亚洲精品成人午夜在线,日韩在线欧美成人 (function(){ var bp = document.createElement('script'); var curProtocol = window.location.protocol.split(':')[0]; if (curProtocol === 'https') { bp.src = 'https://zz.bdstatic.com/linksubmit/push.js'; } else { bp.src = 'http://push.zhanzhang.baidu.com/push.js'; } var s = document.getElementsByTagName("script")[0]; s.parentNode.insertBefore(bp, s); })();