基于OMAP3的視頻解碼器的通用解碼方案
在視頻編解碼過程中,運動估計、DCT/IDCT和像素插值占據(jù)了大量的運算時間,0MAP平臺提供的硬件加速單元可以高效地完成上述運算,而幾乎不占用CPU時鐘(這里,不占用是指運算過程,實際上數(shù)據(jù)的輸入輸出仍需要花費少量時間);同時,優(yōu)化的軟件加速單元也可以較快地完成運算。以DCT/IDCT為例,耗時情況如表1所列。
由表1可知,硬件DCT耗時約為軟件DCT的1/7,硬件IDCT耗時約為軟件IDCT的1/4.5。因此,采用硬件加速模塊可以極大地提高運算速度并降低功耗。
對于最新的H.264以及AVS標準,需要采用OMAP3530才能發(fā)揮0MAP系列的硬件加速優(yōu)勢。OMAP3530的硬件加速器集成了加速模塊的半像素插值,采用的整數(shù)DCT/IDCT類變換硬件加速模塊,而且集成了去塊效應濾波器。在通用計算機上,H.264的解碼過程中各部分所需的時間如表2所列。
從表2中可以看出,在H.264的解碼過程中,環(huán)路濾波、插值以及反變換反量化占據(jù)了超過70%的計算時間。因此,用0MAP3530來進行H.264以及AVS的解碼時,如果能有效地利用0MAP3530的硬件加速資源,可以提高計算效率,實現(xiàn)實時解碼。另外,除了硬件加速器之外,0MAP3530的體系結構比較適合于視頻處理,這主要基于以下考慮:
?、倌壳笆袌錾贤瞥龅恼狭薃RM與DSP的多媒體專用芯片并不多,OMAP可以使用單一芯片實現(xiàn)嵌入式操作系統(tǒng)(Linux、WinCE等)的功能,并且可以獲得TI廣大的第三方提供的豐富的算法支持。基于操作系統(tǒng)的編程更靈活方便,便于產(chǎn)品的軟件升級。相比之下,單一的DSP無法實現(xiàn)操作系統(tǒng)的功能,若額外采用ARM構建操作系統(tǒng),成本以及硬件軟件復雜度無疑會大于采用OMAP平臺。
?、诠牡目紤]。表3列出了OMAPl510上運行MPEG4解碼時的功耗情況。
可以看出,在OMAPl510平臺上,對于QCIF(常用的標準化圖像格式)、15 fps的應用來說,功耗在9.9~28.5mW。對于常見的650 mAh時的手機電池,大概可以連續(xù)工作34~59小時,這對一般的應用來說顯然是夠用的。而TI的另一款專用多媒體處理芯片DM642,其功耗為1.5W,是OMAP的50~150倍。對于便攜式的多媒體終端而言,由于并不需要太高的運算處理能力,采用OMAP平臺既能滿足需要,又可以節(jié)約電池電力。
?、鬯俣鹊目紤]。TMS320C64X+最多可以并行執(zhí)行8條指令,所以理論上的最大速度是4 160 MIPS(520MHz)。這一點相比目前最快的多媒體處理芯片DM642(4 800 MIPS,600 MHz)來說稍低,但兩者的目標定位不同。DM642主要用于實時編碼等對速度要求較高的場合,而0MAP主要用于手持設備的解碼。以H.264算法的Base Profilc為例,復雜度比MPEG-4高20%~30%。對于MPEG4,在QCIF、15 fps下需要28 MIPS;對應的H.264算法的Base Profile要求40 MIPS的運算速度。
評論