<meter id="pryje"><nav id="pryje"><delect id="pryje"></delect></nav></meter>

<label id="pryje"></label>

新聞中心

EEPW首頁(yè) > 嵌入式系統(tǒng) > 設(shè)計(jì)應(yīng)用 > 嵌入式軟件代碼壓縮技術(shù)剖析

嵌入式軟件代碼壓縮技術(shù)剖析

作者：時(shí)間：2012-08-06 來(lái)源：網(wǎng)絡(luò)

加入技術(shù)交流群
- 掃碼加入
  和技術(shù)大咖面對(duì)面交流
  海量資料庫(kù)查詢

收藏

對(duì)于嵌入式軟件而言，代碼尺寸是越小越好。壓縮代碼以適應(yīng)受到成本或空間限制的存儲(chǔ)子系統(tǒng)已經(jīng)成為嵌入式系統(tǒng)開(kāi)發(fā)的一項(xiàng)重要事務(wù)。ARM、MIPS、IBM以及ARC都提供了降低存儲(chǔ)器占用的技術(shù)，本文將對(duì)這幾種架構(gòu)中代碼壓縮 技術(shù)的實(shí)現(xiàn)進(jìn)行比較分析。

本文引用地址：http://www.ex-cimer.com/article/148657.htm

如今，存儲(chǔ)子系統(tǒng)的成本高于微處理器已不再稀奇。因此，選擇一款能節(jié)約存儲(chǔ)成本的處理器就變得很有意義。編寫(xiě)緊湊的代碼只是事情的一個(gè)方面，而處理器的指令集對(duì)存儲(chǔ)器的消耗同樣影響很大。對(duì)于代碼密度很差的處理器而言，無(wú)論怎樣絞盡腦汁地去壓縮你的C源代碼都于事無(wú)補(bǔ)。如果你關(guān)注存儲(chǔ)器的消耗，選擇恰當(dāng) 的處理器并精心調(diào)整代碼是明智的。

并不是所有的處理器都擁有或需要代碼壓縮，只有32位的RISC(精簡(jiǎn)指令集計(jì)算機(jī))處理器需要代碼壓縮，因?yàn)镽ISC處理器代碼密度較差。 RISC處理器在過(guò)去是設(shè)計(jì)用于通用計(jì)算機(jī)和工作站，在其設(shè)計(jì)時(shí)認(rèn)為存儲(chǔ)器價(jià)格便宜。盡管存儲(chǔ)器價(jià)格可能便宜，但如果能占用更少的存儲(chǔ)器不是更便宜嗎?對(duì) 于蜂窩電話以及其他成本控制嚴(yán)格的嵌入式系統(tǒng)應(yīng)用而言，在RAM或ROM上5美元的成本差異，就能導(dǎo)致量產(chǎn)時(shí)利潤(rùn)的巨大差別。通常，存儲(chǔ)器的大小是固定的，而產(chǎn)品的功能特性卻各異。緊湊的目標(biāo)代碼意味著可以實(shí)現(xiàn)更多的自動(dòng)撥號(hào)、更好的語(yǔ)音識(shí)別能力，或者可能是更清晰的屏幕顯示。

在32位嵌入式處理器中，ARM、MIPS以及PowerPC曾是首先尋找出降低其存儲(chǔ)器消耗、提高代碼密度方法的幾種處理器。更早一些的處理器，如摩托羅拉的68k系列以及英特爾的x86系列，并不需要代碼壓縮。事實(shí)上，其標(biāo)準(zhǔn)代碼密度都比RISC處理器的代碼壓縮模式還要高。

易于使用的Thumb技術(shù)

我們先從ARM的代碼壓縮方案(Thumb)講起，因?yàn)槠涫褂脧V泛、有很好的支持，是一個(gè)典型處理器代碼壓縮方案，并相當(dāng)簡(jiǎn)潔、有效。

Thumb實(shí)際上是添加到ARM的標(biāo)準(zhǔn)RISC指令集之上的獨(dú)立指令集。在你的代碼中，你可以通過(guò)一條模式切換指令在這兩種指令集之間進(jìn)行切換。Thumb指令集架構(gòu)(Instruction Set Architecture, ISA)是由大約36條16位指令組成，僅靠這些指令是完成不了太多任務(wù)的，但Thumb指令集包括了基本的加法、減法、循環(huán)移位以及跳轉(zhuǎn)指令。通過(guò)使用這些較短的指令替換ARM標(biāo)準(zhǔn)的32位指令，可以將某些代碼的規(guī)模減小大約20%到30%。但有一些問(wèn)題需要引起注意：

首先，Thumb代碼和標(biāo)準(zhǔn)ARM代碼不能混雜使用，必須顯式地在兩種模式間進(jìn)行切換，就好像Thumb是一套完全不同的指令集(實(shí)際上也是)。這迫使程序員將所有的16位代碼與32位代碼分開(kāi)并隔離到獨(dú)立的模塊中。

其次，由于Thumb是經(jīng)過(guò)簡(jiǎn)化和精簡(jiǎn)的指令集架構(gòu)，在Thumb模式中無(wú)法完成所有你希望的工作。Thumb模式無(wú)法進(jìn)行諸如處理中斷、長(zhǎng)跳轉(zhuǎn)、原子存儲(chǔ)器(atomic memory)操作，或協(xié)處理器操作等。Thumb有限的指令意味著僅對(duì)基本的算術(shù)和邏輯操作有用，其他的任何工作必須使用ARM的標(biāo)準(zhǔn)32位指令集來(lái)完成。

Thumb的限制不僅表現(xiàn)在指令集上，當(dāng)處于Thumb模式中，ARM處理器將僅有8個(gè)寄存器(而不是16個(gè))，這些寄存器無(wú)法像標(biāo)準(zhǔn)模式下 ARM代碼那樣進(jìn)行條件執(zhí)行和移位或循環(huán)移位操作。在標(biāo)準(zhǔn)ARM代碼和Thumb代碼間進(jìn)行參數(shù)傳遞并不困難，只要將參數(shù)放到堆棧中或通過(guò)處理器的前8個(gè) 寄存器就可以了。

從標(biāo)準(zhǔn)模式到Thumb模式之間的來(lái)回切換也要消耗時(shí)間，而且還要增加代碼。此外，還需要幾十個(gè)前導(dǎo)(preamble)以及后同步指令 (postamble)來(lái)組織指針并清空CPU的流水線。如果在Thumb模式中運(yùn)行的代碼小于幾十條指令，就不值得為之付出這樣的開(kāi)銷。

最后，Thumb還對(duì)于性能有著少許的影響。通常，使用Thumb指令對(duì)代碼進(jìn)行壓縮會(huì)導(dǎo)致代碼運(yùn)行速度降低大約15%，這主要是由于在16位模式和32位模式間切換所引起的。Thumb指令還不如32位的標(biāo)準(zhǔn)指令靈活，因此，和32位代碼相比，常常需要更多的指令來(lái)完成同樣的工作。從積極的一方面來(lái)說(shuō)，由于其指令長(zhǎng)度只有32位指令集的一半，Thumb使得緩存的使用效率更高。

如果任務(wù)能夠在這些限制下完成，Thumb可以節(jié)約不少成本。Thumb技術(shù)已經(jīng)得到每一款A(yù)RM處理器的支持，無(wú)論用戶使用與否，多數(shù)ARM編譯器以及匯編程序都支持Thumb指令集。因此，采用Thumb的體驗(yàn)應(yīng)該相當(dāng)輕松。

MIPS處理器

理解了Thumb技術(shù)后，MIPS16e就沒(méi)什么新奇的了。一些MIPS處理器中增加了另外的16位指令集，與ARM系統(tǒng)非常類似。 MIPS16e指令集包括了一組16位的標(biāo)準(zhǔn)MIPS算法、邏輯以及跳轉(zhuǎn)指令的簡(jiǎn)化版本。其使用和Thumb一樣，也需要在標(biāo)準(zhǔn)模式和MIPS16e模式之間來(lái)回切換，這也將導(dǎo)致付出時(shí)間和增加代碼的開(kāi)銷。除非能在“壓縮”模式上運(yùn)行相當(dāng)長(zhǎng)時(shí)間，否則沒(méi)有必要進(jìn)行模式切換。其代碼壓縮效率和ARM差不多，對(duì)于多數(shù)程序而言，也是20%到30%。

MIPS16e和Thumb都不能對(duì)代碼進(jìn)行真正的壓縮，它們只是對(duì)部分指令提供了可替換的操作碼，而且得到的壓縮比是依賴于短操作碼和長(zhǎng)操作碼的總長(zhǎng)度的比值。也就是說(shuō)，依賴于代碼所完成的任務(wù)，諸如操作系統(tǒng)和中斷處理例程等系統(tǒng)級(jí)代碼根本就不能使用16位指令，因此不能獲得代碼壓縮效果。一般的算法，只要不使用任何大操作數(shù)，就能得到很好的壓縮效率。最后，別忘了數(shù)據(jù)是無(wú)法進(jìn)行壓縮的，只有代碼能夠被壓縮。如果你應(yīng)用代碼中包括了大量的靜態(tài) 數(shù)據(jù)結(jié)構(gòu)，所能得到的總存儲(chǔ)器節(jié)約是非常小的。還有，15%的性能損失也許很不值得。另一方面，MIPS16e和Thumb都是免費(fèi)的(假定你的處理器已經(jīng)包含了它們)，選用它們的成本非常低。

PowerPC的CodePack技術(shù)

值得提前說(shuō)明的是，IBM的CodePack方法是各種代碼壓縮技術(shù)中最復(fù)雜的。與Thumb和MIPS16e不同，CodePack系統(tǒng)是真正對(duì)運(yùn)行代碼進(jìn)行壓縮，就好像在PowerPC軟件中運(yùn)行WinZip。CodePack會(huì)分析并壓縮整個(gè)程序，生成的用戶代碼必須在運(yùn)行中解壓縮并執(zhí)行壓縮版本。盡管很復(fù)雜，CodePack和其它技術(shù)一樣提供20%到30%的空間節(jié)省。

CodePack是一項(xiàng)很有吸引力的技術(shù)。在使用該技術(shù)時(shí)，只須和平常一樣使用標(biāo)準(zhǔn)工具編譯嵌入式PowerPC代碼就行，CodePack甚至對(duì)已有的代碼也能使用(無(wú)論有沒(méi)有源代碼)。在將代碼寫(xiě)入ROM或裝入磁盤(pán)之前，運(yùn)行CodePack壓縮工具對(duì)代碼進(jìn)行壓縮。壓縮工具會(huì)分析代碼指令的分布并生成一對(duì)專門(mén)針對(duì)這個(gè)程序代碼的鍵值。當(dāng)運(yùn)行壓縮后的代碼時(shí)，擁有CodePack功能的處理器使用這一對(duì)鍵值來(lái)在運(yùn)行中解開(kāi)壓縮的代碼，就好像直接運(yùn)行壓縮后的代碼。解壓縮會(huì)對(duì)處理器的流水線產(chǎn)生很小的延遲，但是其影響被取指延遲以及其它延遲所掩蓋。對(duì)于絕大多數(shù)應(yīng)用，CodePack帶來(lái)的性能影響是可以忽略的。

但是，CodePack還有一些其它的影響。由于每一個(gè)壓縮的程序都有其單獨(dú)的壓縮鍵值，CodePack本質(zhì)上既是壓縮系統(tǒng)也是加密系統(tǒng)。沒(méi) 有鍵值，無(wú)論你自己還是其它任何人都無(wú)法運(yùn)行相應(yīng)的程序。如果丟失了或者未獲得相應(yīng)的鍵值，壓縮后的程序只是一堆無(wú)用的亂碼，這也意味著壓縮后的 PowerPC程序不是二進(jìn)制代碼兼容的。除非同時(shí)包括其解壓縮鍵值，否則無(wú)法輕易地和其它系統(tǒng)交換壓縮后的程序。這會(huì)使嵌入式系統(tǒng)軟件的現(xiàn)場(chǎng)分配稍微有些復(fù)雜。

另外，CodePack為每個(gè)程序生成兩個(gè)鍵值是因?yàn)橹噶畹母?6位和低16位是分別進(jìn)行壓縮的。IBM的工程師發(fā)現(xiàn)每一條PowerPC指令的高半字(操作碼就在其中)和低半字(其內(nèi)容通常為操作數(shù)、偏移量或掩碼)的分布頻度是不一樣的。對(duì)它們分別使用不同的壓縮算法會(huì)使壓縮效果比僅使用任何單一算法要好，這就是CodePack對(duì)程序所做的事。

ARCompact

ARC International公司又采用了另外的代碼壓縮方法。因?yàn)锳RCtangent處理器有用戶可定義的指令集，ARC(及其用戶)可以對(duì)指令集進(jìn)行隨心所欲的修改。作為ARCompact，ARC公司決定加入一組16位指令來(lái)改進(jìn)其處理器的代碼密度。

而ARCompact與Thumb以及MIPS16e的區(qū)別在于可以將16位代碼和32位代碼任意混雜。由于沒(méi)有模式切換，代碼中任意分布的少許16位指令無(wú)須為之付出什么開(kāi)銷。在任何可能的情況下，ARC的編譯器的默認(rèn)配置會(huì)產(chǎn)生16位操作(為了強(qiáng)制編譯器生成32位代碼或與舊的處理器保持兼容，你可以關(guān)掉這個(gè)功能)。

ARC可以混合不同長(zhǎng)度代碼而不必付出相應(yīng)的開(kāi)銷，是因?yàn)槠渲噶罴軜?gòu)要比ARM和MIPS新。那些RISC架構(gòu)的指令集(包括PowerPC) 在指令字中沒(méi)有指明指令長(zhǎng)度的位。諸如ARC或Tensilica的新偽RISC架構(gòu)，以及像x86和68k舊的架構(gòu)擁有這些位。無(wú)論是出于無(wú)意還是遠(yuǎn) 見(jiàn)，變長(zhǎng)度指令架構(gòu)因?yàn)楦o湊的代碼而具優(yōu)勢(shì)。

Thumb的改進(jìn)版--Thumb-2

就在最近，ARM對(duì)其代碼壓縮系統(tǒng)進(jìn)行了改造并發(fā)布了Thumb-2。Thumb-2并不是Thumb的升級(jí)，相反，它是另起爐灶，并且可以完全代替Thumb和原先的ARM指令集。Thumb-2有些類似ARCompact或摩托羅拉的68k，可以無(wú)需模式切換就運(yùn)行16位與32位混合代碼。總的來(lái)說(shuō)，Thumb-2提供的代碼壓縮效率要略差，但其性能損失也較小。

為了做到這一點(diǎn)，ARM需要在其操作碼映射中找到一個(gè)突破口(hole)，他們?cè)贐L指令(條轉(zhuǎn)并連接指令，是Thumb和ARM模式之間切換的指令)中找到了需要的突破口。在原有的指令集中，BL指令有一些位沒(méi)有使用，這些原先未定義的位給全新的指令集提供了切換入口。其編碼確實(shí)不怎么樣，但確實(shí)很有效。

Thumb-2最大的優(yōu)勢(shì)在于它是一套完整的指令集，程序無(wú)需切換回“標(biāo)準(zhǔn)”32位ARM模式，原先Thumb模式的限制再也沒(méi)有了。程序現(xiàn)在可以處理中斷、設(shè)置MMU、管理緩存，和真正的微處理器并沒(méi)什么不同。

Thumb-2還是需要損失一定的性能。盡管沒(méi)有了模式切換開(kāi)銷，與標(biāo)準(zhǔn)ARM代碼相比，它還是要花費(fèi)多一些的Thumb-2指令來(lái)完成特定的任務(wù)。對(duì)于ARM處理器而言，這些額外的指令(以及額外的周期)會(huì)使速度降低大約15%到20%。

未來(lái)的ARM處理器最終將只運(yùn)行Thumb-2代碼。由于它用一套單一的更多壓縮指令的指令集有效地取代了ARM和Thumb指令集，為什么不會(huì)最終徹底取代它們呢?但問(wèn)題是ARM的軟件兼容性怎么辦?直到現(xiàn)在，所有的ARM處理器(除了Intel的XScale)都是二進(jìn)制兼容。盡管支持 Thumb-2的新型處理器將能運(yùn)行現(xiàn)有的ARM和Thumb代碼，但反之則不行。當(dāng)Thumb-2廣泛推廣后，它將創(chuàng)建一套單獨(dú)但等價(jià)的軟件庫(kù)。

linux操作系統(tǒng)文章專題:linux操作系統(tǒng)詳解（linux不再難懂）

<a target='_blank'><img src='https://ad.eepw.com.cn/www/delivery/avw.php?zoneid=114&cb=INSERT_RANDOM_NUMBER_HERE&n=a7a83b30' border='0' alt='' /></a>
<a target='_blank'><img src='https://ad.eepw.com.cn/www/delivery/avw.php?zoneid=115&cb=INSERT_RANDOM_NUMBER_HERE&n=a3d98779' border='0' alt='' /></a>
<a target='_blank'><img src='https://ad.eepw.com.cn/www/delivery/avw.php?zoneid=116&cb=INSERT_RANDOM_NUMBER_HERE&n=abca108c' border='0' alt='' /></a>
<a target='_blank'><img src='https://ad.eepw.com.cn/www/delivery/avw.php?zoneid=117&cb=INSERT_RANDOM_NUMBER_HERE&n=a1775170' border='0' alt='' /></a>
<a target='_blank'><img src='https://ad.eepw.com.cn/www/delivery/avw.php?zoneid=118&cb=INSERT_RANDOM_NUMBER_HERE&n=a449048b' border='0' alt='' /></a>

關(guān)鍵詞： 技術(shù) 剖析壓縮代碼軟件 嵌入式

評(píng)論

相關(guān)推薦

2024 CCF嵌入式技術(shù)生態(tài)與產(chǎn)業(yè)發(fā)展論壇(CCF ETIF 2024)邀請(qǐng)函

嵌入式系統(tǒng) CCF 嵌入式 | 2024-07-16

大家在互相借鑒吧!--嵌入式系統(tǒng)詞匯表

jackwang | 2002-05-14

半導(dǎo)體行業(yè)出現(xiàn)六項(xiàng)合作案！

嵌入式系統(tǒng) 嵌入式 MCU 晶圓代工 | 2024-06-03

大家在互相借鑒吧!--嵌入式系統(tǒng)詞匯表

jackwang | 2002-05-14

華清遠(yuǎn)見(jiàn)嵌入式在線視頻教程——2、嵌入式系統(tǒng)的選擇與開(kāi)發(fā)

視頻華清遠(yuǎn)見(jiàn) 嵌入式 | 2008-07-09

華清遠(yuǎn)見(jiàn)嵌入式在線視頻教程——4、基于ARM的嵌入式開(kāi)發(fā)

視頻華清遠(yuǎn)見(jiàn) 嵌入式 | 2008-07-14

研華：AI引領(lǐng)邊緣計(jì)算變革，打造嵌入式產(chǎn)業(yè)新未來(lái)

智能計(jì)算研華 AI 邊緣計(jì)算嵌入式 | 2024-05-31

軟件框架｜學(xué)會(huì)MCU實(shí)用模塊

嵌入式系統(tǒng) 軟件 MCU 模塊框架 | 2024-06-18

STM32的結(jié)構(gòu)解析STM32的結(jié)構(gòu)解析

嵌入式系統(tǒng) 嵌入式 STM32 | 2024-06-26

華為軟件編程規(guī)范和范例

資源下載華為軟件編程規(guī)范范例 | 2007-02-09

對(duì)數(shù)壓縮方式數(shù)字音頻處理器(DAC76、MN5110)

設(shè)計(jì)方案對(duì)數(shù) 壓縮方式數(shù)字音頻處理器 DAC76 MN511 | 2009-07-06

多普達(dá)系統(tǒng)解鎖軟件漢化版

資源下載多普達(dá) 系統(tǒng)解鎖軟件漢化 | 2007-12-16

華清遠(yuǎn)見(jiàn)嵌入式在線視頻教程——3、嵌入式Linux開(kāi)發(fā)應(yīng)用介紹

視頻華清遠(yuǎn)見(jiàn) 嵌入式 | 2008-07-09

江波龍DDR3L解決方案

網(wǎng)絡(luò)與存儲(chǔ) 江波龍存儲(chǔ) 嵌入式 | 2024-05-31

６２.４Ｖ／１０Ａ充電機(jī)原理剖析

設(shè)計(jì)方案 62.4V 電機(jī) 原理剖析 | 2009-07-06

H-Converter

資源下載命令行的轉(zhuǎn)換工具軟件 H-Converter | 2007-11-29

值得收藏｜分享幾款免費(fèi)的電路設(shè)計(jì)軟件

電路設(shè)計(jì) 軟件 | 2024-05-28

配μP的超聲波干擾探測(cè)系統(tǒng)(基于DSP和模糊邏輯技術(shù)的超聲波干擾探測(cè)器US0012)

設(shè)計(jì)方案超聲波干擾探測(cè) 系統(tǒng) 基于模糊邏輯技術(shù) 探測(cè)器 U | 2009-07-06

華清遠(yuǎn)見(jiàn)嵌入式在線視頻教程——1、走近嵌入式系統(tǒng)

視頻華清遠(yuǎn)見(jiàn) 嵌入式 | 2008-07-08

嵌入式操作系統(tǒng)大比拼

jackwang | 2002-05-13

軟件項(xiàng)目文檔模板

資源下載軟件文檔模板 | 2008-01-03

大家在互相借鑒吧!--嵌入式系統(tǒng)詞匯表

jackwang | 2002-05-14

嵌入式開(kāi)發(fā)者都該了解的十大算法

嵌入式開(kāi)發(fā)者算法 | 2024-07-16

EEPW攜手2024國(guó)際嵌入式展打造豐富技術(shù)盛宴

嵌入式系統(tǒng) 嵌入式上海國(guó)際嵌入式 MCU | 2024-06-05

華清遠(yuǎn)見(jiàn)嵌入式在線視頻教程——5、嵌入式Linux移植和u-boot

視頻華清遠(yuǎn)見(jiàn) 嵌入式 | 2008-07-14

摩托羅拉168VA手機(jī)汽車(chē)充電器剖析

設(shè)計(jì)方案摩托羅拉 168VA 手機(jī) 汽車(chē) 充電器剖析 | 2009-07-06

增加軟關(guān)斷技術(shù)的驅(qū)動(dòng)電路

設(shè)計(jì)方案增加軟關(guān) 技術(shù) 驅(qū)動(dòng) | 2009-07-06

2024上海嵌入式展如何？夠垂直！

嵌入式系統(tǒng) 嵌入式江波龍凌華 Lattice 鼎陽(yáng)科技貿(mào)澤電子 IAR 樹(shù)莓派普源精電易靈思 | 2024-06-14

51系列單片機(jī)模擬軟件（漢化）

資源下載 ATMEL 51單片機(jī) 軟件 | 2007-12-15

大家在互相借鑒吧!--嵌入式系統(tǒng)詞匯表

jackwang | 2002-05-14

焦點(diǎn)

推薦視頻

技術(shù)專區(qū)

看屁屁www成人影院,亚洲人妻成人图片,亚洲精品成人午夜在线,日韩在线欧美成人 (function(){ var bp = document.createElement('script'); var curProtocol = window.location.protocol.split(':')[0]; if (curProtocol === 'https') { bp.src = 'https://zz.bdstatic.com/linksubmit/push.js'; } else { bp.src = 'http://push.zhanzhang.baidu.com/push.js'; } var s = document.getElementsByTagName("script")[0]; s.parentNode.insertBefore(bp, s); })();