<meter id="pryje"><nav id="pryje"><delect id="pryje"></delect></nav></meter>

<label id="pryje"></label>

新聞中心

EEPW首頁 > 手機與無線通信 > 設(shè)計應(yīng)用 > 基于ADSP-BF561處理器的視頻編碼器平臺

基于ADSP-BF561處理器的視頻編碼器平臺

作者：時間：2011-02-15 來源：網(wǎng)絡(luò)

加入技術(shù)交流群
- 掃碼加入
  和技術(shù)大咖面對面交流
  海量資料庫查詢

收藏

4 DSP平臺上的代碼優(yōu)化

在VisualDSP開發(fā)環(huán)境下對代碼進行優(yōu)化的主要方法有C語言級優(yōu)化和匯編級優(yōu)化。

4.1 C語言級優(yōu)化

通過VC6的profile分析工具發(fā)現(xiàn)：移植與優(yōu)化的重點應(yīng)在運動估計部分。筆者通過比較各種算法后選擇了菱形(DS)搜索法。DS算法可采用兩種搜索模板，分別是有9個檢索點的大模板LD-SP(LargeDiamondSearchPattern)和有5個檢索點的小模板SDSP(SmallDiamondSearchPattern)。其菱形搜索示意圖如圖3所示。搜索時，先用大模板計算，當(dāng)最小塊誤差SAD點出現(xiàn)在中心點處時，再將大模板LDSP換為SDSP進行匹配運算，這時，5個點中具有最小SAD者若為中心點，則該點即為最優(yōu)匹配點，然后結(jié)束搜索，否則將繼續(xù)以此點為搜索中心進行SPSS搜索。

經(jīng)JM實驗證實，采用此種方法，可以節(jié)約大約10％的運行時間，且代碼量無太大增長。

針對DSP的特點和相關(guān)的硬件指令，設(shè)計時可對代碼進行如下優(yōu)化：

◇對程序結(jié)構(gòu)進行調(diào)整。對不適合DSP執(zhí)行的語句進行改寫，以提高代碼的并行性。

◇宏的使用。也就是將有些較短，執(zhí)行單一、調(diào)用次數(shù)多的函數(shù)改為宏。

◇循環(huán)優(yōu)化是將C語言中的for循環(huán)打開，排流水線，提高并行性。

◇計算表格化是將運行時計算的參數(shù)做成便于查找的表格常數(shù)數(shù)值，從而將運行計算轉(zhuǎn)化為編譯運算。如在量化和反量化程序中進行移位位數(shù)的處理時，可先計算出所有可能的值，而后來的運算就可以通過查表得到數(shù)值。

◇浮點數(shù)定點化。因為Blackfin561并不支持浮點運算，但原始程序代碼卻是浮點運算的格式，所以必須改成定點運算，而其修改后的執(zhí)行速度也會加快很多。

◇盡量用邏輯運算代替乘除運算。由于乘除運算指令的執(zhí)行時間要遠遠大于邏輯移位指令，尤其是除法指令，故應(yīng)盡量用邏輯移位運算來代替乘除運算，以加快指令的運行速度。

◇盡量少進行函數(shù)調(diào)用。對一些小的函數(shù)，最好是用適當(dāng)?shù)膬?nèi)聯(lián)函數(shù)將其直接寫入主函數(shù)中進行替代，而對于一些調(diào)用不多的函數(shù)，也可以直接寫入主函數(shù)內(nèi)，這樣可減少不必要的操作以提高速度。

◇減少判斷轉(zhuǎn)換。

◇盡量靜態(tài)分配內(nèi)存。

◇調(diào)用系統(tǒng)提供的豐富的內(nèi)聯(lián)函數(shù)。

此外，為了充分發(fā)揮DSP的運算能力，還必須從它的硬件結(jié)構(gòu)出發(fā)，最大限度地利用它的8個功能單元，使用軟件流水線盡量讓程序無沖突地并行執(zhí)行。也可將最耗時的函數(shù)抽取出來，用線性匯編改寫，從而最大限度的利用DSP的并行性。

4.2 匯編級優(yōu)化

匯編級優(yōu)化主要指如下幾點操作：

(1)使用寄存器資源

Blackfin561提供了8個32位數(shù)據(jù)寄存器以及一系列的地址寄存器。使用寄存器代替局部變量時，若局部變量用來保存中間結(jié)果，那么用寄存器代替局部變量可省掉很多訪問內(nèi)存的時間。

(2)使用專用指令

Blackfin561提供有求最大值、最小值、絕對值、CUP及大量視頻專用指令，應(yīng)可能用多位的指令來訪問少位的數(shù)據(jù)。通過使用這些指令能大大提高代碼的執(zhí)行速度。如用int型(32位)訪問2個short(16位)型數(shù)據(jù)時，可將其分別放在32位寄存器的高16位和低16位字段。這樣，數(shù)據(jù)讀取效率可以提高1倍，從而減少內(nèi)存訪問次數(shù)。

(3)使用并行指令和向量指令

ADSP-BF561中每條通用指令都可以和一條或兩條存儲器訪問指令并列執(zhí)行，這樣有利于ADSP-BF561的流水線滿負荷運行，更充分發(fā)揮ADSP-BF561的數(shù)據(jù)處理能力。

(4)合理存放反復(fù)調(diào)用的程序段

把被反復(fù)調(diào)用的程序段(如DCT變換和IDCT變換)放在片內(nèi)程序存儲區(qū)中，把頻繁用到的數(shù)據(jù)段(如編碼表)放在片內(nèi)數(shù)據(jù)存儲器中，而把不常用到的程序和數(shù)據(jù)段放在片外存儲器中，以避免對程序或數(shù)據(jù)進行不必要的反復(fù)搬移。

(5)合理使用內(nèi)外存儲器

BF561片內(nèi)只有256KB的存儲空間，因此當(dāng)前幀、參考幀和當(dāng)前幀的重建幀都必須放至片外存儲器，壓縮碼流若被主機讀取，也可放至片外。其它數(shù)據(jù)如程序代碼、全局變量、VLC碼表、各編碼模塊產(chǎn)生的中間數(shù)據(jù)等均可放至片內(nèi)。

(6)DMA的使用

由于CPU訪問片外存儲器的速度通常要比訪問片內(nèi)慢幾十倍，片外數(shù)據(jù)的傳輸通常成為程序運行時的瓶頸，這樣，即使代碼效率很高，流水線也會因為等待數(shù)據(jù)而被嚴重阻塞。解決這一問題的有效方法是用DMA傳送數(shù)據(jù)。程序是逐個宏塊進行編碼的，在編碼當(dāng)前宏塊的同時，先由DMA將下一個宏塊的數(shù)據(jù)、用到的參考幀數(shù)據(jù)由片外傳送至片內(nèi)，當(dāng)前宏塊做完運動補償后，DMA又將重建后的宏塊由片內(nèi)傳送至片外。這樣CPU只對片內(nèi)數(shù)據(jù)進行操作，從而使流水線可以順利進行，而壓縮碼流按逐個碼字有時間間隔地寫入，可由CPU直接寫至片外。

5 結(jié)束語

經(jīng)過用ADSP-BF561匯編語言改寫的對應(yīng)函數(shù)的優(yōu)化程序經(jīng)調(diào)試運行后，DCT，IDCT部分效率提高了大約15倍，去塊濾波部分效率提高了大約6～7倍。對于模塊中的其它部分函數(shù)，也同樣取得了良好的優(yōu)化結(jié)果。說明其優(yōu)化工作確實達到了良好的效果。

上一頁 1 2 下一頁

<a target='_blank'><img src='https://ad.eepw.com.cn/www/delivery/avw.php?zoneid=114&cb=INSERT_RANDOM_NUMBER_HERE&n=a7a83b30' border='0' alt='' /></a>
<a target='_blank'><img src='https://ad.eepw.com.cn/www/delivery/avw.php?zoneid=115&cb=INSERT_RANDOM_NUMBER_HERE&n=a3d98779' border='0' alt='' /></a>
<a target='_blank'><img src='https://ad.eepw.com.cn/www/delivery/avw.php?zoneid=116&cb=INSERT_RANDOM_NUMBER_HERE&n=abca108c' border='0' alt='' /></a>
<a target='_blank'><img src='https://ad.eepw.com.cn/www/delivery/avw.php?zoneid=117&cb=INSERT_RANDOM_NUMBER_HERE&n=a1775170' border='0' alt='' /></a>
<a target='_blank'><img src='https://ad.eepw.com.cn/www/delivery/avw.php?zoneid=118&cb=INSERT_RANDOM_NUMBER_HERE&n=a449048b' border='0' alt='' /></a>

關(guān)鍵詞： 編碼器 平臺視頻 處理器 ADSP-BF561 基于

評論

相關(guān)推薦

最新智能手機芯片數(shù)據(jù)：聯(lián)發(fā)科市場份額第一，蘋果同比下降16%

智能手機高通聯(lián)發(fā)科蘋果處理器紫光展銳 | 2024-05-23

英特爾先進封裝產(chǎn)能也吃緊，影響第二季AI PC處理器供應(yīng)

消費電子英特爾先進封裝 AI PC 處理器 | 2024-05-01

嵌入式處理器選型下

視頻嵌入式 ARM 處理器 MIPS PXA27x | 2009-10-27

嵌入式系統(tǒng)硬件接口設(shè)計上

視頻嵌入式 Xscale 處理器 S3C2410 | 2009-10-27

嵌入式處理器選型上

視頻嵌入式 ARM 處理器 CN896 MIPS | 2009-10-27

MPEG-2 視頻解碼器,1.1版

資源下載 MPEG 視頻解碼器 MPEG-2 | 2007-02-09

米爾基于NXP i.MX 93開發(fā)板的M33處理器應(yīng)用開發(fā)筆記

嵌入式系統(tǒng) 米爾 NXP .MX 93 M33 處理器 | 2024-07-03

PLD實驗練習(xí)1

資源下載編碼器譯碼妻選擇器比較器加法器 | 2007-02-09

嵌入式系統(tǒng)硬件接口設(shè)計下

視頻嵌入式處理器 SPI EP9315 S3C2410 | 2009-10-27

嵌入式系統(tǒng)綜述之二(老站轉(zhuǎn))

amine | 2002-05-18

基于VxWorks的多DSP系統(tǒng)的多任務(wù)程序設(shè)計(老站轉(zhuǎn))

amine | 2002-05-28

Nios II 處理器中文小冊子（altera）

資源下載 altera Nios II 處理器中文小冊子 | 2007-12-12

中國臺灣AI關(guān)鍵組件的發(fā)展現(xiàn)況與布局

智能計算 IC設(shè)計 PCB 散熱處理器內(nèi)存 AI | 2024-06-13

基于RC電路的一次性濾波器

設(shè)計方案基于電路一次性濾波器 | 2009-07-06

最新的ARM技術(shù)以及嵌入式發(fā)展動態(tài) 下

視頻 ARM Cortex RISC 處理器 | 2009-11-25

Microchip發(fā)布多核64位微處理器系列產(chǎn)品進一步擴展處理器產(chǎn)品線

嵌入式系統(tǒng) Microchip 64位微處理器處理器 | 2024-07-10

嵌入式系統(tǒng)綜述之三(老站轉(zhuǎn))

amine | 2002-05-18

基于MSP430F133的電子鎮(zhèn)流器綜合測試儀

設(shè)計方案基于 MSP430F133 電子鎮(zhèn)流器綜合測試儀 | 2009-07-06

[轉(zhuǎn)帖]IBM可編程網(wǎng)絡(luò)處理器

amine | 2002-05-17

透視麒麟9010：博采眾長但依舊任重道遠

手機與無線通信麒麟9010 Pura 70 處理器 Arm TCS23 Firestorm 鴻蒙NEXT | 2024-04-23

浙大數(shù)電實驗課件

資源下載數(shù)字電路比較器編碼器計數(shù)器存儲器 | 2007-02-09

快來看MCX N系列微處理器的眼睛-攝像頭接口

物聯(lián)網(wǎng)與傳感器控制器 SmartDMA 處理器攝像頭 LCD | 2024-04-12

高通被曝開發(fā)低成本驍龍 WoA 芯片：AI 算力 40 TOPS、2025Q4 推出

智能計算高通 WoA 處理器 | 2024-06-18

封閉沒有前途！Intel打造開放AI生態(tài) 誓要虎口奪食

智能計算英特爾 AI 處理器 Lunar Lake | 2024-04-16

基于運放的差動放大器

設(shè)計方案基于運放差動放大器 | 2009-07-06

CAX軟件交流

hpnet | 2002-05-28

基于D類功放專用驅(qū)動芯片驅(qū)動的高保真純正弦波逆變器1

設(shè)計方案基于功放專用驅(qū)動芯片高保真正弦波逆變器 | 2009-07-06

基于D類功放專用驅(qū)動芯片驅(qū)動的高保真純正弦波逆變器

設(shè)計方案基于功放專用驅(qū)動芯片高保真正弦波逆變器 | 2009-07-06

浙大數(shù)電實驗內(nèi)容(new)

資源下載數(shù)字電路比較器編碼器計數(shù)器存儲器 | 2007-02-09

拆解：三星Galaxy Watch 7中的Exynos W1000處理器3nm GAA工藝

消費電子三星 Galaxy Watch 7 Exynos W1000 處理器 3nm GAA | 2024-07-19

焦點

推薦視頻

技術(shù)專區(qū)

看屁屁www成人影院,亚洲人妻成人图片,亚洲精品成人午夜在线,日韩在线欧美成人 (function(){ var bp = document.createElement('script'); var curProtocol = window.location.protocol.split(':')[0]; if (curProtocol === 'https') { bp.src = 'https://zz.bdstatic.com/linksubmit/push.js'; } else { bp.src = 'http://push.zhanzhang.baidu.com/push.js'; } var s = document.getElementsByTagName("script")[0]; s.parentNode.insertBefore(bp, s); })();