<meter id="pryje"><nav id="pryje"><delect id="pryje"></delect></nav></meter>
          <label id="pryje"></label>

          新聞中心

          EEPW首頁 > 消費電子 > 設(shè)計應(yīng)用 > 基于ADSP-BF561的H.264視頻編碼器的實現(xiàn)

          基于ADSP-BF561的H.264視頻編碼器的實現(xiàn)

          作者:崔海燕,王卿 時間:2008-07-03 來源:電子元器件應(yīng)用 收藏

            3.2從機到的程序移植

          本文引用地址:http://www.ex-cimer.com/article/85224.htm

            要將端精簡的程序移植到A-BF561的開發(fā)環(huán)境Visual 下,以使其能夠初步運行,所需考慮的主要是語法規(guī)則和內(nèi)存分配等問題。 (1)除去所有編譯環(huán)境不支持的函數(shù)

            主要是除去某些與時間相關(guān)的函數(shù)、將文件操作修改為讀取文件數(shù)據(jù)緩存的操作、刪除SNR信息收集等DSP平臺實現(xiàn)不需要的代碼。還要注意:函數(shù)的聲明、數(shù)據(jù)結(jié)構(gòu)的類型要符合DSP的C語言格式。

            (2)添加與硬件相關(guān)的代碼

            該代碼包括系統(tǒng)初始化、輸出模塊代碼、中斷服務(wù)程序和碼速率控制程序等。

            (3)配置LDF文件

            因為剛移植的代碼往往數(shù)據(jù)和程序都非常大,SRAM里面肯定是放不下的,這時鏈接就會有問題。剛開始的時候,最好把所有的程序和數(shù)據(jù)都放在SDRAM里,這樣鏈接就不會有問題了。Stack和heap情況類似,都先放到SDRAM。一般在開始時,往往需要的是一個可以正確運行的程序,而速度倒在其次。

            (4) Malloc問題的解決

            DSP下的開發(fā),malloc是一個需要解決的問題。如果動態(tài)申請內(nèi)存,就算可以運行,其結(jié)果往往也是不對的。所以,最好進行靜態(tài)分配,可用數(shù)組的形式分配。

            移植完畢后,即可實現(xiàn)基于ADSP-BF561的H_264編碼,此時如果速度達不到實時編碼的要求,還可以進一步進行優(yōu)化。

            4 DSP平臺上的代碼優(yōu)化

            在Visual DSP開發(fā)環(huán)境下對代碼進行優(yōu)化的主要方法有C語言級優(yōu)化和匯編級優(yōu)化。

            4.1 C語言級優(yōu)化

            通過VC6的profile分析工具發(fā)現(xiàn):移植與優(yōu)化的重點應(yīng)在運動估計部分。筆者通過比較各種算法后選擇了菱形(DS)搜索法。DS算法可采用兩種搜索模板,分別是有9個檢索點的大模板LD-SP(Large Diamond Search Pattern)和有5個檢索點的小模板SDSP(Small Diamond Search Pattern)。其菱形搜索示意圖如圖3所示。搜索時,先用大模板計算,當(dāng)最小塊誤差SAD點出現(xiàn)在中心點處時,再將大模板LDSP換為SDSP進行匹配運算,這時,5個點中具有最小SAD者若為中心點,則該點即為最優(yōu)匹配點,然后結(jié)束搜索,否則將繼續(xù)以此點為搜索中心進行SPSS搜索。

            經(jīng)JM實驗證實,采用此種方法,可以節(jié)約大約10%的運行時間,且代碼量無太大增長。

            針對DSP的特點和相關(guān)的硬件指令,設(shè)計時可對代碼進行如下優(yōu)化:

            ◇對程序結(jié)構(gòu)進行調(diào)整。對不適合DSP執(zhí)行的語句進行改寫,以提高代碼的并行性。
            ◇宏的使用。也就是將有些較短,執(zhí)行單一、調(diào)用次數(shù)多的函數(shù)改為宏。
            ◇循環(huán)優(yōu)化是將C語言中的for循環(huán)打開,排流水線,提高并行性。
            ◇計算表格化是將運行時計算的參數(shù)做成便于查找的表格常數(shù)數(shù)值,從而將運行計算轉(zhuǎn)化為編譯運算。如在量化和反量化程序中進行移位位數(shù)的處理時,可先計算出所有可能的值,而后來的運算就可以通過查表得到數(shù)值。
            ◇浮點數(shù)定點化。因為Blackfin561并不支持浮點運算,但原始程序代碼卻是浮點運算的格式,所以必須改成定點運算,而其修改后的執(zhí)行速度也會加快很多。
            ◇盡量用邏輯運算代替乘除運算。由于乘除運算指令的執(zhí)行時間要遠遠大于邏輯移位指令,尤其是除法指令,故應(yīng)盡量用邏輯移位運算來代替乘除運算,以加快指令的運行速度。
            ◇盡量少進行函數(shù)調(diào)用。對一些小的函數(shù),最好是用適當(dāng)?shù)膬?nèi)聯(lián)函數(shù)將其直接寫入主函數(shù)中進行替代,而對于一些調(diào)用不多的函數(shù),也可以直接寫入主函數(shù)內(nèi),這樣可減少不必要的操作以提高速度。
            ◇減少判斷轉(zhuǎn)換。
            ◇盡量靜態(tài)分配內(nèi)存。
            ◇調(diào)用系統(tǒng)提供的豐富的內(nèi)聯(lián)函數(shù)。

            此外,為了充分發(fā)揮DSP的運算能力,還必須從它的硬件結(jié)構(gòu)出發(fā),最大限度地利用它的8個功能單元,使用軟件流水線盡量讓程序無沖突地并行執(zhí)行。也可將最耗時的函數(shù)抽取出來,用線性匯編改寫,從而最大限度的利用DSP的并行性。

            4.2匯編級優(yōu)化

            匯編級優(yōu)化主要指如下幾點操作:

            (1)使用寄存器資源

            Blackfin561提供了8個32位數(shù)據(jù)寄存器以及一系列的地址寄存器。使用寄存器代替局部變量時,若局部變量用來保存中間結(jié)果,那么用寄存器代替局部變量可省掉很多訪問內(nèi)存的時間。

            (2)使用專用指令

            Blackfin561提供有求最大值、最小值、絕對值、CUP及大量視頻專用指令,應(yīng)可能用多位的指令來訪問少位的數(shù)據(jù)。通過使用這些指令能大大提高代碼的執(zhí)行速度。如用int型(32位)訪問2個short(16位)型數(shù)據(jù)時,可將其分別放在32位寄存器的高16位和低16位字段。這樣,數(shù)據(jù)讀取效率可以提高1倍,從而減少內(nèi)存訪問次數(shù)。

            (3)使用并行指令和向量指令

            ADSP-BF561中每條通用指令都可以和一條或兩條存儲器訪問指令并列執(zhí)行,這樣有利于ADSP-BF561的流水線滿負荷運行,更充分發(fā)揮ADSP-BF561的數(shù)據(jù)處理能力。

            (4)合理存放反復(fù)調(diào)用的程序段

            把被反復(fù)調(diào)用的程序段(如DCT變換和IDCT變換)放在片內(nèi)程序存儲區(qū)中,把頻繁用到的數(shù)據(jù)段(如編碼表)放在片內(nèi)數(shù)據(jù)存儲器中,而把不常用到的程序和數(shù)據(jù)段放在片外存儲器中,以避免對程序或數(shù)據(jù)進行不必要的反復(fù)搬移。

            (5)合理使用內(nèi)外存儲器

            BF561片內(nèi)只有256KB的存儲空間,因此當(dāng)前幀、參考幀和當(dāng)前幀的重建幀都必須放至片外存儲器,壓縮碼流若被主機讀取,也可放至片外。其它數(shù)據(jù)如程序代碼、全局變量、VLC碼表、各編碼模塊產(chǎn)生的中間數(shù)據(jù)等均可放至片內(nèi)。

            (6)DMA的使用

            由于CPU訪問片外存儲器的速度通常要比訪問片內(nèi)慢幾十倍,片外數(shù)據(jù)的傳輸通常成為程序運行時的瓶頸,這樣,即使代碼效率很高,流水線也會因為等待數(shù)據(jù)而被嚴重阻塞。解決這一問題的有效方法是用DMA傳送數(shù)據(jù)。程序是逐個宏塊進行編碼的,在編碼當(dāng)前宏塊的同時,先由DMA將下一個宏塊的數(shù)據(jù)、用到的參考幀數(shù)據(jù)由片外傳送至片內(nèi),當(dāng)前宏塊做完運動補償后,DMA又將重建后的宏塊由片內(nèi)傳送至片外。這樣CPU只對片內(nèi)數(shù)據(jù)進行操作,從而使流水線可以順利進行,而壓縮碼流按逐個碼字有時間間隔地寫入,可由CPU直接寫至片外。

            5 結(jié)束語

            經(jīng)過用ADSP-BF561匯編語言改寫的對應(yīng)函數(shù)的優(yōu)化程序經(jīng)調(diào)試運行后,DCT,IDCT部分效率提高了大約15倍,去塊濾波部分效率提高了大約6~7倍。對于模塊中的其它部分函數(shù),也同樣取得了良好的優(yōu)化結(jié)果。說明其優(yōu)化工作確實達到了良好的效果。


          上一頁 1 2 下一頁

          關(guān)鍵詞: 視頻編碼 處理器 通信 PC DSP

          評論


          相關(guān)推薦

          技術(shù)專區(qū)

          關(guān)閉
          看屁屁www成人影院,亚洲人妻成人图片,亚洲精品成人午夜在线,日韩在线 欧美成人 (function(){ var bp = document.createElement('script'); var curProtocol = window.location.protocol.split(':')[0]; if (curProtocol === 'https') { bp.src = 'https://zz.bdstatic.com/linksubmit/push.js'; } else { bp.src = 'http://push.zhanzhang.baidu.com/push.js'; } var s = document.getElementsByTagName("script")[0]; s.parentNode.insertBefore(bp, s); })();