Linux下Cold Fire 片內(nèi)SRAM的應(yīng)用程序優(yōu)化設(shè)計(jì)
本文以MP3解碼器為例,介紹了一種在嵌入式Linux系統(tǒng)下配置使用處理器片內(nèi)SRAM的應(yīng)用方案,有效提高了代碼的解碼效率,降低了執(zhí)行功耗。該方案不論在性能還是成本上都得到了很大改善。
1 硬件平臺和軟件架構(gòu)
硬件平臺采用Freescale公司的MCF5329EVB開發(fā)板。終端硬件包括ColdFire5329處理器、32 KB的片內(nèi)SRAM、1 800×600矩陣LCD顯示屏、9×3陣列矩陣鍵盤、I2S音頻解碼芯片、64 MB的SDRAM、10/100M以太網(wǎng)接口,以及3個(gè)UART接口。軟件構(gòu)架如圖1所示,主要包括MP3解碼器、音頻驅(qū)動、鍵盤驅(qū)動和用戶圖形界面(GUI)等模塊。采用μClinux作為操作系統(tǒng)。μClinux針對嵌入式應(yīng)用的特點(diǎn)作了較大的簡化和修改,支持多種文件系統(tǒng)和多任務(wù)處理,而且具有相對完整的網(wǎng)絡(luò)體系協(xié)議,因而特別適合嵌入式應(yīng)用。
2 MP3解碼算法分析
本文選用MP3解碼程序作為方案驗(yàn)證代碼。MPEG-1/2 Audio Layer 3是專門針對音樂和語音數(shù)據(jù)設(shè)計(jì)的有損壓縮算法。該算法的解碼過程比較復(fù)雜,主要包括反向修正離散余弦變換(IMDCT)、逆量化、Huffman解碼、子帶綜合等功能模塊。讀入一段MP3數(shù)據(jù)后,首先要檢測數(shù)據(jù)流中的同步字,以確定一幀數(shù)據(jù)的開始;然后提取幀頭信息,特別是解碼所需要的一些參數(shù),同時(shí)分離出幀邊信息和主數(shù)據(jù);之后對邊信息數(shù)據(jù)解碼得到Huffman解碼信息和逆量化信息,再經(jīng)過重新排序、立體聲處理、反混疊處理、IMDCT變換和子帶綜合濾波器組后,就可以得到PCM輸出。
MP3解碼流程如圖2所示。大致分為兩個(gè)階段,即數(shù)據(jù)流控制階段和數(shù)值計(jì)算階段。數(shù)據(jù)流控制階段包括幀同步、邊帶信息解碼和Huffman解壓縮等過程。其中,Huffman解壓縮是對編碼數(shù)據(jù)進(jìn)行操作,其他過程則是對幀控制部分進(jìn)行操作。
3 基于片內(nèi)SRAM的優(yōu)化設(shè)計(jì)方案
3.1 方案分析
SRAM指令執(zhí)行速度要比DRAM快得多。Cold-Fire5329處理器內(nèi)部集成了32 KB的SRAM,本設(shè)計(jì)方案將充分利用處理器片內(nèi)SRAM來對解碼程序進(jìn)行優(yōu)化。首先對源代碼中的主要解碼函數(shù)進(jìn)行分析,如表1所列??梢钥吹津?qū)動寫函數(shù)(write)、子帶綜合(MPEGSUB_synthesis)、反向修正離散余弦變換(imdct_I)和快速離散余弦變換(fast_dct)對處理器資源消耗較大,幾乎占用80%的解碼時(shí)間。根據(jù)分析結(jié)果,分別把音頻驅(qū)動程序和上述解碼函數(shù)放進(jìn)SRAM中執(zhí)行,以提高流媒體解碼器的執(zhí)行速度,降低其對處理器資源的消耗。
3.2 配置音頻驅(qū)動程序到片內(nèi)SRAM中執(zhí)行
Linux操作系統(tǒng)把內(nèi)核和運(yùn)行在其上的應(yīng)用程序分成兩個(gè)管理層次,也就是常說的“內(nèi)核態(tài)”和“用戶態(tài)”。內(nèi)核態(tài)具有較高的應(yīng)用權(quán)限,可以控制處理器內(nèi)存的映射和分配方式。音頻驅(qū)動程序是系統(tǒng)內(nèi)核的重要組成部分,工作在內(nèi)核態(tài),實(shí)現(xiàn)不斷從用戶空間解碼文件中讀取音頻信息,以及驅(qū)動音頻芯片播放聲音等相關(guān)功能。通過修改μClinux-2.6內(nèi)核代碼,可以將音頻驅(qū)動程序配置到片內(nèi)SRAM中執(zhí)行,主要通過修改系統(tǒng)鏈接文件來實(shí)現(xiàn)。系統(tǒng)鏈接文件用于將輸入文件根據(jù)一定的規(guī)則合并成一個(gè)輸出文件,并對符號與地址進(jìn)行綁定。
評論