基于TMS320DM3730的H.264編碼器移植與優(yōu)化方法研
摘要:提出了一種在TI公司高性能數(shù)字信號處理器TMS320DM3730上進(jìn)行H.264編碼器(即x264編碼器)移植與優(yōu)化的方法,詳細(xì)描述了在CCS4.2開發(fā)平臺上進(jìn)行x264編碼器移植工作的基本原理和需要注意的問題。為了提高編碼速度,針對DM3730處理器的結(jié)構(gòu)特點,對x264編碼器進(jìn)行了優(yōu)化,主要方法包括編譯器優(yōu)化、內(nèi)存優(yōu)化、C語言代碼優(yōu)化及匯編代碼優(yōu)化。對x264編碼器進(jìn)行的CIF格式編碼測試結(jié)果表明,在均值信噪比略微降低的前提下,編碼速度得到了顯著提高,因此獲得了更優(yōu)的編碼效率。
關(guān)鍵詞:TMS320DM3730;H.264標(biāo)準(zhǔn);x264編碼器;移植與優(yōu)化
H.264/AVC是ISO/IEC和ITU-T聯(lián)合推出的新一代的視頻編碼標(biāo)準(zhǔn)。其具有高壓縮率、高圖像質(zhì)量、良好的網(wǎng)絡(luò)親和性等優(yōu)點,被廣泛的應(yīng)用于各個視頻相關(guān)產(chǎn)業(yè)中。在相同的圖像質(zhì)量的前提下,和傳統(tǒng)的視頻標(biāo)準(zhǔn)MPEG-4相比,H.264的碼率只有MPEG-4的1/3。但是,H.2 64算法非常復(fù)雜,要實現(xiàn)實時編碼是比較困難的。因此,如何將H.264編碼器進(jìn)行移植和優(yōu)化,使其用于實際產(chǎn)品中成為了研究的熱點。
DSP芯片技術(shù)的快速發(fā)展為實現(xiàn)嵌入式多媒體技術(shù)提供了可能。TMS320DM3730(簡稱DM3730)作為TI公司2010年推出的高性能芯片,以其ARM+DSP結(jié)構(gòu)體系、運算速度快、眾多多媒體接口等優(yōu)點成為進(jìn)行嵌入式系統(tǒng)開發(fā)首選平臺之一。
常用的H.264編碼器有JM編碼器、x264編碼器,T264編碼器,x264編碼器作為其中應(yīng)用最廣,效率最好的編碼器,是進(jìn)行嵌入式開發(fā)的首選H.264編碼器。故本文在DM3730數(shù)字媒體處理器上進(jìn)行x264編碼器的移植與優(yōu)化。本文首先介紹了DM3730的基本的結(jié)構(gòu)和特點;然后結(jié)合DM3730的DSP,介紹了x264編碼器的移植和優(yōu)化;最后進(jìn)行編碼測試,結(jié)果表明編碼器移植的正確性,編碼速度得到了極大提高。
1 DM3730簡單介紹
DM3730數(shù)字媒體處理器是美國德州儀器(TI)推出的一款高性能達(dá)芬奇(DaVinci)芯片,由1 GHz的ARM Coretex—A8和800 MHz的TMS320 C64x+DSP Core兩部分組成,并集成了包括3D圖像處理器,圖像采集,USB2.0等模塊。其整體結(jié)構(gòu)如圖1所示。
DM3730中ARM核作為主控制部分,負(fù)責(zé)整個芯片部分的設(shè)備的配置和控制、內(nèi)存的分配、同外部接口的數(shù)據(jù)的交換;DSP核主要進(jìn)行數(shù)據(jù)的處理和計算,其主頻高達(dá)800MHz,采用VLIW(超長指令字)體系結(jié)構(gòu),包含8個獨立的功能單元,每個功能單元在每個時鐘周期執(zhí)行一條指令,最高運算速度高達(dá)6 400 MMACS(百萬乘法累加周期每秒)。同時擁有A、B兩個通用寄存器組。每個都有32個32-bits寄存器組成,每個通用寄存器都可以存放數(shù)據(jù)、地址和指針。
2 x264的移植
CCS(Code Composer Stdio)是TI公司提供的用于C語言開發(fā)的開發(fā)平臺,該平臺可以使用C語言進(jìn)行DSP程序的開發(fā)。本文基于CCS4.2平臺進(jìn)行x264編碼器的移植,具體流程如圖2所示。
評論