<meter id="pryje"><nav id="pryje"><delect id="pryje"></delect></nav></meter>
          <label id="pryje"></label>

          新聞中心

          EEPW首頁 > 嵌入式系統(tǒng) > 設(shè)計應(yīng)用 > 基于多任務(wù)嵌入式應(yīng)用的MP3實時解碼系統(tǒng)

          基于多任務(wù)嵌入式應(yīng)用的MP3實時解碼系統(tǒng)

          作者: 時間:2009-01-20 來源:網(wǎng)絡(luò) 收藏

          1 引 言

            是目前世界上流行的音頻格式之一,采用MPEG-1標(biāo)準(zhǔn)的Audio LayerⅢ壓縮編碼格式,具有高壓縮率和保真度。的解碼功能大多以專用解碼芯片的形式應(yīng)用于多種消費類電子產(chǎn)品中。采用軟解碼的方式實現(xiàn)實時播放功能可以充分利用硬件資源,節(jié)省芯片面積,有利于降低設(shè)計成本,同時軟件方式可移植性好,解碼質(zhì)量可通過軟件參數(shù)設(shè)定,具有更大的靈活性,便于系統(tǒng)升級。隨著主流嵌入式微處理器ARM的處理能力越來越強,這種實現(xiàn)方式也已經(jīng)成為眾多嵌入式設(shè)計公司研究的焦點。

            與專用解碼芯片相比,采用軟件方式實現(xiàn)MP3實時解碼的瓶頸在于解碼效率。在嵌入式系統(tǒng)中,單個任務(wù)的執(zhí)行效率以及任務(wù)間的調(diào)度方式將直接影響整個系統(tǒng)在一定硬件資源條件下的實時響應(yīng)速度。因此,在嵌入式系統(tǒng)中采用軟解碼方式實現(xiàn)MP3實時播放,必須通過優(yōu)化算法提高解碼效率,在保證實時性的基礎(chǔ)上降低對硬件資源的要求。

          2 設(shè)計思想

            MP3解碼需要經(jīng)過大量的數(shù)據(jù)處理。首先對MP3數(shù)據(jù)流進(jìn)行幀同步并解出頭信息和邊信息供解碼主數(shù)據(jù)使用,之后對主數(shù)據(jù)依次進(jìn)行霍夫曼解碼、反量化、IMDCT以及子帶合成濾波,最終輸出PCM碼流。整個解碼過程如圖1所示。對定點化開源解碼程序各模塊執(zhí)行時間進(jìn)行測試,找出關(guān)鍵耗時模塊并對其采用改進(jìn)型快速算法;在保證一定音質(zhì)的前提下,根據(jù)解碼運算特征降低運算精度,從而在基于ARM926EJ-S處理器開發(fā)平臺上實現(xiàn)對MP3音樂(碼率為192 kb/s,采樣率為44.1 kHz,立體聲編碼模式)的解碼;在實時播放方面,提出雙Buffer輪換DMA傳送的設(shè)計方案,為高效任務(wù)調(diào)度的實現(xiàn)提供有利條件。

          基于多任務(wù)嵌入式應(yīng)用的MP3實時解碼系統(tǒng)

          3 系統(tǒng)實現(xiàn)過程

          3.1 硬件系統(tǒng)

            本文采用的嵌入式系統(tǒng)是以ARM926EJ-S處理器為核心的SoC開發(fā)平臺,最高運行主頻為190 MHz,支持ARMv5T指令集,存儲器包括SDRAM和NAND FLASHROM,外圍設(shè)備包括DMA控制器、中斷控制器、USB控制器、UART、控制器、I2S控制器以及定時/計數(shù)器。整個硬件系統(tǒng)的架構(gòu)如圖2所示。

          基于多任務(wù)嵌入式應(yīng)用的MP3實時解碼系統(tǒng)

            MP3文件和程序代碼通過USB線下載并分別存放入NAND FLASH ROM和SDRAM;解碼MP3文件得到的PCM碼流送入I2S控制器輸出;UART控制器可實現(xiàn)串口打印輸出調(diào)試信息,跟蹤程序運行狀態(tài);定時/計數(shù)器用于測試解碼時間,對解碼各個模塊進(jìn)行耗時分析。

          3.2 代碼移植

            搭建好硬件平臺后,對各硬件模塊進(jìn)行初始化,并加載文件系統(tǒng),完成軟件平臺的搭建。將開源的MP3解碼程序代碼移植到軟件平臺上,這一過程主要是針對平臺的文件系統(tǒng),對文件讀寫函數(shù)進(jìn)行替換,并將屏幕打印替換為串口打印操作。移植后的代碼實現(xiàn)對MP3文件進(jìn)行解碼,并輸出為PCM碼流文件。利用CoolEdit對輸出PCM碼流文件進(jìn)行測試播放,輸出音質(zhì)良好。

          3.3 耗時分析

            成功移植后,對代碼進(jìn)行耗時分析,找出耗時最大的功能模塊,確定重點優(yōu)化對象。該系統(tǒng)采用硬件定時/計數(shù)器作為測試工具,將計數(shù)器的計數(shù)頻率調(diào)配為1 MHz,可實現(xiàn)1μs的測試精度。在ARM工作主頻為150 MHz的條件下,對100幀MP3數(shù)據(jù)的解碼過程進(jìn)行耗時測試,測試結(jié)果如表1所示。根據(jù)表1測試數(shù)據(jù)可知,子帶合成濾波占了整個解碼時間的60%以上,是決定解碼速度的最關(guān)鍵模塊;其次是長塊IMDCT運算,占了整個解碼時間的10%以上。因此,子帶合成濾波與長塊IMDCT成為優(yōu)化重點。

          基于多任務(wù)嵌入式應(yīng)用的MP3實時解碼系統(tǒng)

          3.4 解碼算法分析與優(yōu)化

          3.4.1 子帶合成濾波算法優(yōu)化

            子帶合成濾波是MP3解碼過程中最耗時的關(guān)鍵流程,該解碼系統(tǒng)采用Konstantinos Konstantinides提出的改進(jìn)型算法對其進(jìn)行優(yōu)化。子帶合成濾波的標(biāo)準(zhǔn)算法涉及從32值變換到64值的矩陣運算,Konstantinos Konstantinides提出的改進(jìn)型算法將矩陣運算進(jìn)行一系列變化,最終歸結(jié)于32點DCT變換,而DCT變換有類似于FFT的快速算法(FCT),從而加速了整個子帶合成濾波過程。由DCT變換到矩陣運算的轉(zhuǎn)換過程如圖3所示,其中S和V分別為矩陣運算的32點輸入序列和64點輸出序列,A,B均為16點矢量。

          3.4.2 IMDCT算法優(yōu)化

            IMDCT采用Szu-Wei Lee提出的快速算法進(jìn)行優(yōu)化,該算法充分利用余弦函數(shù)的對稱性,將N點IMDCT運算經(jīng)過一系列變形,最終轉(zhuǎn)化為N/4點的SDCT-Ⅱ運算,其轉(zhuǎn)化流程如圖4所示。對短塊IMDCT使用該算法并沒有帶來較大的速度改善,故只對長塊應(yīng)用。相比于直接運算的648次乘法和612次加法,優(yōu)化后的長塊。IM-DCT運算量下降為43次乘法和115次加法。

          3.4.3 低精度乘法

            在ARM指令集中的乘法指令有2類:32 b×32 b→64 b長乘法指令(MULL,MLAL)和32 b×32 b→32 b短乘法指令(MUL,MLA),前者的指令周期為3+m,而后者為2+m。由于解碼過程中,尤其是子帶合成濾波過程,乘法指令使用非常頻繁,如果能夠使用短乘法指令進(jìn)行乘法運算,將會大大提高系統(tǒng)性能。

          基于多任務(wù)嵌入式應(yīng)用的MP3實時解碼系統(tǒng)

            該系統(tǒng)的定點運算過程采用Q28定點表示法,若采用長乘法指令運算,得到的64位結(jié)果中有效位只有第28~59位,低28位和高4位都是無用的,需要通過移位去除。根據(jù)解碼過程中運算系數(shù)的定點表示特征,可以在乘法運算前預(yù)先對操作數(shù)進(jìn)行移位,以便使編譯器采用短乘法指令進(jìn)行運算。在子帶合成濾波過程中,定點化濾波系數(shù)的低12位均為0。根據(jù)這一特征,可將濾波系數(shù)預(yù)先右移14位再進(jìn)行乘法運算,這一過程僅損失2位精度。另外,在子帶濾波快速算法的DCT運算結(jié)果參加乘法運算前,預(yù)先右移12位,最后將子帶濾波的輸出結(jié)果右移2位。經(jīng)過3次右移操作后的輸出結(jié)果共降低16位精度,對于16位PCM輸出剛好滿足精度要求。

            經(jīng)過以上一系列優(yōu)化處理后,主要解碼耗時模塊的改善情況如表2所示。

          基于多任務(wù)嵌入式應(yīng)用的MP3實時解碼系統(tǒng)

          3.5 實時播放方案設(shè)計

            該系統(tǒng)采用雙Buffer輪換DMA傳送的方案實現(xiàn)實時播放,整個播放流程如圖5所示。其中n為解碼當(dāng)前幀的幀序號,第一幀序號為0;buffer0和buffer1分別用于存放當(dāng)前播放幀的PCM數(shù)據(jù)和下一幀的PCM數(shù)據(jù)。DMA傳送采用LLI傳送方式,可實現(xiàn)將2個buffer存放的PCM數(shù)據(jù)輪換向I2S FIFO傳送,因此只需在解碼完第1幀后啟動一次DMA傳送。

          基于多任務(wù)嵌入式應(yīng)用的MP3實時解碼系統(tǒng)

            該方案的實現(xiàn)原理是在一幀MP3數(shù)據(jù)解碼時間遠(yuǎn)小于1幀PCM數(shù)據(jù)播放時間(采樣率為44.1 kHz時,一幀PCM播放時間為26.1 ms)這一前提條件下,播放當(dāng)前幀PCM數(shù)據(jù)的同時開始解碼下一幀MP3數(shù)據(jù)。因此在解碼完下一幀數(shù)據(jù)后,需要等待當(dāng)前幀播放完畢,再繼續(xù)解碼。在圖5中,這一等待過程采用的是查詢DMA傳送結(jié)束標(biāo)志的方式,這使得CPU一直處于忙狀態(tài),白白消耗了系統(tǒng)資源。然而在嵌入式系統(tǒng)中,這段等待時間恰恰是非常有利用價值的。MP3實時解碼可以一個任務(wù)的形式存在于多任務(wù)系統(tǒng)中,將圖5中的查詢過程改為休眠M(jìn)P3解碼任務(wù),同時將DMA中斷打開,在中斷服務(wù)程序中喚醒解碼任務(wù),那么在解碼完畢下一幀后便可釋放CPU資源,將DMA中斷發(fā)生前的這段等待時間用于調(diào)度其他進(jìn)程,例如JPEG解碼任務(wù)和GUI任務(wù),從而實現(xiàn)播放音樂、播放圖片和用戶操作3者的高效協(xié)同工作。

          4 結(jié) 語

            本文給出的MP3在基于ARM926EJ-S核心的SoC硬件平臺上,對MP3解碼算法和實時播放方案進(jìn)行優(yōu)化設(shè)計。實驗結(jié)果證明,該系統(tǒng)可在處理器主頻僅為36 MHz的條件下流暢播放MP3音樂(碼率為192 kb/s),可嵌入數(shù)碼相框、MP4等產(chǎn)品中實現(xiàn)MP3實時播放功能



          評論


          相關(guān)推薦

          技術(shù)專區(qū)

          關(guān)閉
          看屁屁www成人影院,亚洲人妻成人图片,亚洲精品成人午夜在线,日韩在线 欧美成人 (function(){ var bp = document.createElement('script'); var curProtocol = window.location.protocol.split(':')[0]; if (curProtocol === 'https') { bp.src = 'https://zz.bdstatic.com/linksubmit/push.js'; } else { bp.src = 'http://push.zhanzhang.baidu.com/push.js'; } var s = document.getElementsByTagName("script")[0]; s.parentNode.insertBefore(bp, s); })();