用定制DSP設(shè)計MPEG-4無線視頻產(chǎn)品
這樣得到的工作平臺與基準平臺相比,增加了一個ALU和四個MPEG-4 DDCU:比特流DDCU、量化/反量化DDCU、半像素DDCU和DCT/IDCT DDCU(見圖2)。在起始平臺的基礎(chǔ)上添加這些運算單元,目的就是在不增大指令存儲或數(shù)據(jù)存儲的前提下,盡可能降低對時鐘速率(MHz)的要求。完成這些操作之后,我們得到了這樣一個用戶應(yīng)用引擎,該引擎可以用帶寬只有18MHz的DSP完成每秒15幀的CIF格式圖像的解碼,同時還能滿足這種3G無線視頻應(yīng)用的其他關(guān)鍵要求(低功率、小晶片尺寸以及低時鐘速率)。
從圖3中可以看出DDCU對加快整個應(yīng)用運行速度的作用。圖中第一條表示在標準CU構(gòu)成的基準平臺上,整個運算時間在IDCT、運動補償(MC)以及可變長度編碼和反量化(VLD/DQnt)這幾種DDCU之間的分布情況。
可以看出,在這幾種DDCU中,MC部分占用時鐘周期最多。因此我們在工作平臺上添加了一個DDCU來加速半像素內(nèi)插操作,提高MC部分的速度。一旦MC部分所占用的時鐘周期數(shù)大幅降低,VLD/DQnt馬上就上升成為了限制整個應(yīng)用性能的最主要因素。針對這一情況,再添加一個比特流 DDCU和一個量化/反量化DDCU,又進一步提高了性能。這樣,最初的基準平臺已經(jīng)經(jīng)過了兩次組合。此時,再將IDCT DDCU加入其中,整個應(yīng)用的性能就得到了更大的提高。圖3中的最后一條給出了三次組合后整個應(yīng)用需要耗費的時鐘周期。
上面介紹的只是一個典型案例。一般而言,在無線視頻應(yīng)用的開發(fā)中,按照以上這幾步進行操作,我們就可以快速地構(gòu)造一個優(yōu)化的引擎,為移動電話或PDA設(shè)備開發(fā)出收發(fā)MPEG-4視頻信息的功能。更妙的是,在構(gòu)造起這個引擎的同時還可以解放一部分處理器資源,使之有余力去支持其他的一些新興功能,比如MP3音頻、網(wǎng)絡(luò)瀏覽,甚至更多。
評論