基于DSP的G.729語(yǔ)音編解碼器設(shè)計(jì)
圖3是該算法精簡(jiǎn)后的流程圖。
實(shí)驗(yàn)證明,在10幀語(yǔ)音信號(hào)的編碼過(guò)程中,這部分算法優(yōu)化后平均可減少15 000次左右的L_mac運(yùn)算的調(diào)用。
3.2.2 去除不必要的溢出判斷
使用CCS中的profiler工具對(duì)ITU提供的標(biāo)準(zhǔn)C源碼進(jìn)行分析,結(jié)果表明,該算法大部分運(yùn)算都集中在basic_op.c文件中的L_add()、L_mult()等幾個(gè)基本函數(shù)上。進(jìn)一步分析發(fā)現(xiàn),這些函數(shù)在溢出判斷上花費(fèi)了大量的時(shí)間,而實(shí)際運(yùn)算中真正會(huì)產(chǎn)生溢出的地方非常少。因此,為了進(jìn)一步提高代碼效率,在完全不會(huì)產(chǎn)生溢出的地方用簡(jiǎn)單的基本運(yùn)算取代函數(shù)的調(diào)用,這樣即能大大縮短運(yùn)算時(shí)間,還能節(jié)省調(diào)用函數(shù)的開銷。例如:
這段程序中,由于-215≤a[i]≤215-1,-215≤b[i]≤215-1,那么a[i]*b[19-i]顯然不會(huì)超出區(qū)間[-231,231-1],即這一部分不會(huì)產(chǎn)生溢出問(wèn)題,因此這里的L_mult函數(shù)便可簡(jiǎn)單替換為:
這雖是一段極小的程序,但經(jīng)過(guò)這樣簡(jiǎn)單的置換后卻能減少數(shù)十個(gè)時(shí)鐘周期。在整個(gè)代碼中類似的例子很多,優(yōu)化后的效果非常明顯。
3.2.3 循環(huán)優(yōu)化
對(duì)循環(huán)的優(yōu)化一直是代碼優(yōu)化的重點(diǎn),一般的循環(huán)優(yōu)化包括:循環(huán)合并、循環(huán)展開、循環(huán)內(nèi)部的指令盡可能移到循環(huán)外等。這些方法在文獻(xiàn)中有詳細(xì)的介紹,這里就不再贅述。TMS320C54X系列芯片采用6級(jí)流水線結(jié)構(gòu),可以并行執(zhí)行多條指令,并在一定條件下可以實(shí)現(xiàn)零開銷循環(huán)處理。
評(píng)論