Tensilica發(fā)布四款用于SoC設(shè)計(jì)的視頻處理引擎
——
Diamond Standard VDO 引擎在處理器上通過軟件方式來實(shí)現(xiàn)所有視頻關(guān)鍵處理的功能,包括網(wǎng)絡(luò)抽象層(network abstraction layer,)、圖像層、條代層(slice layer)、比特流解析、以及熵解編碼,包括在H.264 Main Profile解碼器中進(jìn)行CABAC(Context-Adaptive Bin
ary Arithmetic Coding)解碼。大多數(shù)其他解決方案都忽略了該功能,或采用獨(dú)立的復(fù)雜且不可編程的硬件模塊,或利用700MHz普通CPU來實(shí)現(xiàn)該功能(這種方法明顯增加功耗)。通過在指令集擴(kuò)展中實(shí)現(xiàn)對CABAC的支持,Tensilica創(chuàng)造出一款低頻低功耗, 面積少于典型CABAC硬件一半的CABAC模塊。
Diamond VDO系列提供Baseline Profile和Main Profile兩種解決方案 –Main Profile提供更佳的數(shù)據(jù)壓縮率和視頻質(zhì)量,是面向高級(jí)手機(jī)和PMP應(yīng)用的D1或者更高分辨率的更好的編解碼機(jī)制。大多數(shù)其他的SoC視頻解決方案只實(shí)現(xiàn)Baseline Profile的視頻效果。
Tensilica總裁兼CEO Chris Rowen表示,“Tensilica已準(zhǔn)備好向那些將開發(fā)高品質(zhì)視頻產(chǎn)品的半導(dǎo)體制造商和系統(tǒng) OEM公司提供全部經(jīng)過測試的新產(chǎn)品解決方案。希望創(chuàng)造出象HiFi音頻引擎一樣的成功方案。HiFi音頻引擎已被廣泛應(yīng)用于數(shù)十款流行的手機(jī)設(shè)備中,其中包括摩托羅拉公司最新KRZR和RIZR手機(jī)。”
基于Xtensa處理器技術(shù)的架構(gòu)
為開發(fā)新的Diamond Standard VDO系列,Tensilica采用了Xtensa®可配置且可擴(kuò)展處理器技術(shù),創(chuàng)造了一個(gè)雙處理器的子系統(tǒng)模塊,包括一個(gè)集成DMA引擎,能以極低時(shí)鐘速率實(shí)現(xiàn)完整D1 Main profile的解碼和ASP編碼(完整的H.264 Main profile解碼僅需172MHz,而MPEG-4 Advanced Simple Profile (ASP)的解碼僅需156MHz)。
Diamond VDO雙核架構(gòu)包括基于Xtensa架構(gòu)配置得到的一個(gè)流處理器和一個(gè)像素處理器。流處理器指令集對視頻數(shù)據(jù)(熵解碼、運(yùn)動(dòng)向量的預(yù)測等等)的串行式處理進(jìn)行了優(yōu)化。流處理器需要32K字節(jié)的本地?cái)?shù)據(jù)存儲(chǔ)器,40K本地指令存儲(chǔ)器。其指令的寬度優(yōu)化到32位。像素處理器指令集采用SIMD(單指令多數(shù)據(jù))技術(shù),對像素?cái)?shù)據(jù)的并行式處理進(jìn)行了優(yōu)化。像素處理器需要40K本地?cái)?shù)據(jù)存儲(chǔ)器,24K本地指令存儲(chǔ)器。處理器之間的內(nèi)部通信是通過一個(gè)128位的直連接口實(shí)現(xiàn)的,而外部視頻引擎接口通信是通過2個(gè)32位的總線實(shí)現(xiàn)的。
Tensilica在Diamond VDO系列中定義了400多條視頻專用指令,與通用DSP或通用32位微處理器相比,性能顯著提升。這些指令是針對視頻處理中性能要求苛刻的部分優(yōu)化得到的,這些算法部分包括:CABAC,它可得到H.264 Main profile視頻的更高壓縮效果;CAVLC(Context-adaptive variable-length coding),是一種用于H.264 Baseline Profile和 Main Profile的低復(fù)雜度壓縮算法;Deblocking:去塊效應(yīng),可減少在高壓縮視頻碼流中的由塊效應(yīng)所引起的失真;Transforms:各種變換(H.264中有很多種變換,在這是說支持多種變換)進(jìn)行空間域的壓縮變換,類JPEG處理;運(yùn)動(dòng)補(bǔ)償和運(yùn)動(dòng)估計(jì),用于在低速碼率條件下得到高質(zhì)量畫面的算法。
Tensilica提供全套軟件包 —— 包括解碼器和編碼器
Tensilica針對新Diamond VDO引擎開發(fā)了編碼器和解碼器,客戶能直接從Tensilica購買到軟硬件完整的解決方案,SoC設(shè)計(jì)工程師不用依賴第三方應(yīng)用提供商。Tensilica同時(shí)提供全套與之適配的軟件開發(fā)工具鏈,包括一個(gè)基于ECLIPSE框架的高級(jí)集成開發(fā)環(huán)境、一個(gè)世界級(jí)編譯器、一個(gè)周期精確(cycle-accurate)并兼容SystemC的指令集仿真器、以及完整的工業(yè)標(biāo)準(zhǔn)GNU工具鏈。另外,Tensilica廣泛的合作伙伴網(wǎng)絡(luò)提供操作系統(tǒng)、調(diào)試工具、ICE解決方案、以及其他有助于將Tensilica處理器快速設(shè)計(jì)進(jìn)其產(chǎn)品中的支持。
基于處理器的視頻解碼的靈活性
新Diamond VDO引擎相比與基于硬件的視頻加速器和常規(guī)CPU結(jié)合的傳統(tǒng)方式會(huì)相當(dāng)受歡迎。首先,Diamond VDO IP核減少了系統(tǒng)主控CPU的全部視頻解碼任務(wù)– 包括全部比特流解析。傳統(tǒng)的硬件加速器僅可減少如運(yùn)動(dòng)估計(jì)那樣的像素處理工作,而將大部分計(jì)算負(fù)擔(dān)(經(jīng)常需要100MHz的持續(xù)的主控CPU開銷)交由系統(tǒng)控制器來完成。
第二,傳統(tǒng)解決方案包括了一個(gè)CPU和一個(gè)硬件加速器,當(dāng)數(shù)據(jù)通過系統(tǒng)總線在CPU和加速器間進(jìn)行傳輸時(shí)會(huì)產(chǎn)生大量的功耗 –通常出于方便,其他方案不計(jì)算這部分功耗,這樣使得他們宣
稱的硬件加速器模塊本身的消耗很低。
第三,當(dāng)Diamond VDO引擎沒有被用于進(jìn)行視頻處理時(shí),可隨時(shí)以一種相當(dāng)于有500多 Dhrystone MIPS處理能力的通用CPU 來執(zhí)行其他系統(tǒng)任務(wù) – 相反一個(gè)特定的視頻硬件模塊是不能被重用的。
第四,Diamond VDO引擎是可編程的,因此可支持今后出現(xiàn)的視頻標(biāo)準(zhǔn)。
最后,Diamond VDO引擎面積小,其面積在130nm工藝下僅有8mm2(包括處理器邏輯和內(nèi)部存儲(chǔ)器)。
SoC的小面積低功耗解決方案
Diamond Standard VDO系列針對移動(dòng)應(yīng)用而優(yōu)化,比其他競爭產(chǎn)品具有更小面積、更低的功耗。通過運(yùn)用Xtensa處理器的一種特征-細(xì)粒度門控時(shí)鐘再結(jié)合可編程的電源管理指令(可以降低各種負(fù)載情況下視頻處理的功耗),其動(dòng)態(tài)功耗被降至最低。進(jìn)一步的能耗利用率的提升是通過DMA引擎和流處理器與像素處理器間的接口實(shí)現(xiàn),而后者令外部存儲(chǔ)器帶寬要求降至最低。在節(jié)省面積方面,例如,Diamond 383VDO,其面積包括存儲(chǔ)器僅占10 mm2;全功能Diamond 388VDO可在D1分辨率下,提供完全的H.264 Main profile解碼和MPEG-4 ASP編碼的支持,而其包括存儲(chǔ)器的面積僅有 12 mm2,且在TSMC 0.13G工藝技術(shù)下運(yùn)行速度為200MHz。
評論