<meter id="pryje"><nav id="pryje"><delect id="pryje"></delect></nav></meter>
          <label id="pryje"></label>

          新聞中心

          EEPW首頁(yè) > 嵌入式系統(tǒng) > 設(shè)計(jì)應(yīng)用 > 基于ARM946E處理器的MP3解碼優(yōu)化設(shè)計(jì)

          基于ARM946E處理器的MP3解碼優(yōu)化設(shè)計(jì)

          作者: 時(shí)間:2009-05-21 來(lái)源:網(wǎng)絡(luò) 收藏

          根據(jù)硬件特點(diǎn),對(duì)實(shí)時(shí)性要求較高的關(guān)鍵程序進(jìn)行C語(yǔ)言和ARM級(jí)代碼
          4.1 減計(jì)數(shù)循環(huán)體
          IMDCT和子帶合成濾波器組2個(gè)運(yùn)算量最大部分中有多個(gè)循環(huán)體運(yùn)算,為了提高執(zhí)行效率,推薦使用減計(jì)數(shù)循環(huán)體。
          如表3所示,對(duì)于固定次數(shù)的循環(huán),減計(jì)數(shù)循環(huán)比增計(jì)數(shù)循環(huán)速度快。這是因?yàn)槊看卧鲇?jì)數(shù)循環(huán)體外加3條指令,而減計(jì)數(shù)循環(huán)體外只有2條指令,減循環(huán)終止條件為減計(jì)數(shù)到零,而不是計(jì)數(shù)增加到某個(gè)特定的限制值。由于減計(jì)數(shù)結(jié)果已存儲(chǔ)在指令條件標(biāo)志里,省去與零比較指令。

          本文引用地址:http://www.ex-cimer.com/article/152480.htm

          4.2 和內(nèi)嵌
          算法中定點(diǎn)化乘法都是通過(guò)函數(shù)調(diào)用來(lái)實(shí)現(xiàn),每次調(diào)用需要開(kāi)銷23~28個(gè)時(shí)鐘周期,其中超過(guò)15個(gè)周期用于函數(shù)調(diào)用時(shí)PC指針以及寄存器壓棧保護(hù)上。采用方式(使用關(guān)鍵字_inline聲明)或宏指令,在編譯階段代碼段將被直接展開(kāi)。另外armcc編譯器允許在C源程序中使用內(nèi)嵌(但代碼可移植性差),使用包括匯編的內(nèi)嵌函數(shù),可以使編譯器支持通常不能有效使用的ARM指令和方法,例如C編譯器不支持的ARM v5E擴(kuò)展指令。使用結(jié)合內(nèi)嵌匯編實(shí)現(xiàn)移位乘法,可使平均時(shí)鐘周期縮短為6~8個(gè)。
          4.3 ARM DSP擴(kuò)展指令的運(yùn)用
          支持ARMDSP擴(kuò)展指令,主要包括3個(gè)類型:
          (1)單周期的16×16和32×16 MAC操作;
          (2)對(duì)原有的算術(shù)運(yùn)算指令增加了飽和處理擴(kuò)展;
          (3)前導(dǎo)零(CLZ)運(yùn)算指令,提高歸一化、浮點(diǎn)運(yùn)算以及除法操作的性能。
          ARM不支持浮點(diǎn)運(yùn)算,經(jīng)過(guò)測(cè)試及分析,定點(diǎn)運(yùn)算中數(shù)值的截?cái)嗾`差選擇為28 b,其可以達(dá)到較好的音質(zhì),不會(huì)因?yàn)楸暨^(guò)多而影響播放效果。
          完成類似的乘法功能,ARM的SMULL(32×32)指令需要3個(gè)周期,而ARMDSP擴(kuò)展指令SMULWT(32×16)只需要1個(gè)周期。從數(shù)據(jù)的準(zhǔn)確性上分析,由于乘數(shù)的精度為16 b,最終結(jié)果有些差異,但由于運(yùn)算都是28 b的定點(diǎn)數(shù)值的,所以通常的運(yùn)算都是一個(gè)運(yùn)算結(jié)果跟某一個(gè)固定定點(diǎn)表中的數(shù)據(jù)相乘的。若選擇固定定點(diǎn)表中數(shù)據(jù)的高16 b數(shù)據(jù)進(jìn)行運(yùn)算,運(yùn)算的結(jié)果誤差在1 b以內(nèi)。
          為了驗(yàn)證使用ARMDSP擴(kuò)展指令的效果,在系統(tǒng)120 MHz主頻下,以128 Kb/s的壓縮速率進(jìn)行編碼測(cè)試,采用的測(cè)試文件如表4所示。

          上述3個(gè)測(cè)試文件的比特率均為128 Kb/s,使用這三首MP3歌曲進(jìn)行解碼分析結(jié)果如圖3所示。

          實(shí)驗(yàn)表明,使用ARMDSP擴(kuò)展指令比使用ARM一般指令解碼性能平均提高17.5%,主觀聽(tīng)覺(jué)上音質(zhì)效果無(wú)差異。


          5 結(jié) 語(yǔ)
          這里充分利用處理器的DSP擴(kuò)展指令特點(diǎn)提高程序代碼的執(zhí)行效率,對(duì)3個(gè)關(guān)鍵模塊:Huff-man解碼,IMDCT運(yùn)算,合成子帶濾波進(jìn)行算法優(yōu)化及簡(jiǎn)化處理,減少了各模塊的運(yùn)算量,同時(shí)從C語(yǔ)言和ARM匯編層次來(lái)優(yōu)化代碼,取得了較好的實(shí)時(shí)MP3解碼效果。


          上一頁(yè) 1 2 3 下一頁(yè)

          評(píng)論


          相關(guān)推薦

          技術(shù)專區(qū)

          關(guān)閉
          看屁屁www成人影院,亚洲人妻成人图片,亚洲精品成人午夜在线,日韩在线 欧美成人 (function(){ var bp = document.createElement('script'); var curProtocol = window.location.protocol.split(':')[0]; if (curProtocol === 'https') { bp.src = 'https://zz.bdstatic.com/linksubmit/push.js'; } else { bp.src = 'http://push.zhanzhang.baidu.com/push.js'; } var s = document.getElementsByTagName("script")[0]; s.parentNode.insertBefore(bp, s); })();