測(cè)試響應(yīng):基準(zhǔn)測(cè)試能有效地比較能量效率嗎?
要點(diǎn)
功率基準(zhǔn)測(cè)量的是完成一項(xiàng)任務(wù)的能量,而不是能耗率。
能量效率逐漸成為區(qū)分兩個(gè)類似處理器的一種更重要的因素。
功率基準(zhǔn)測(cè)試必須使能耗與“足夠好”的性能處理有效點(diǎn)均衡。
現(xiàn)在還不太清楚如何能公正地采用一種一致的方法測(cè)量能量效率。
用來(lái)比較兩種可供選擇的處理器的相對(duì)性能的基準(zhǔn),嚴(yán)格說(shuō)來(lái)是提高設(shè)計(jì)生產(chǎn)率的工具。基準(zhǔn)測(cè)試本身并不能使技術(shù)難題得以解決,但卻能縮短開發(fā)人員為某個(gè)項(xiàng)目挑選處理器所花的時(shí)間。也就是說(shuō),在理想情況下,標(biāo)準(zhǔn)化的基準(zhǔn)測(cè)試為開發(fā)人員提供一種方法,可以像挑選蘋果一樣快速而準(zhǔn)確地比較可供選擇的產(chǎn)品。嵌入式處理器基測(cè)試準(zhǔn)的現(xiàn)實(shí)情況是,難以提供一種簡(jiǎn)單、快速、綜合的處理方法來(lái)對(duì)各類應(yīng)用系統(tǒng)和處理器體系結(jié)構(gòu)進(jìn)行挑蘋果式的比較。除了處理器性能基準(zhǔn)之外,幾個(gè)團(tuán)體目前還在研究能對(duì)處理器的功率和能量效率進(jìn)行有意義的描述和比較的方法。
用來(lái)比較處理器性能的基準(zhǔn)已經(jīng)存在很多年了,這些基準(zhǔn)的核心都強(qiáng)調(diào)一段時(shí)間內(nèi)處理器能夠完成多少工作,而忽略或不重視達(dá)到這種性能水平所需的功率效率和成本。為了弄清楚什么樣的數(shù)據(jù)可以揭示一個(gè)系統(tǒng)在某個(gè)應(yīng)用的設(shè)計(jì)和實(shí)現(xiàn)中的工作情況,需要依賴于使用某套基準(zhǔn)的人(參考文獻(xiàn)1)。雖然市場(chǎng)調(diào)查資料仍然引用著指令/秒等綜合處理器性能的數(shù)據(jù),但是,由于其對(duì)處理器在特定場(chǎng)境下的運(yùn)行情況提供的相關(guān)信息少之又少,所以這些數(shù)據(jù)對(duì)于設(shè)計(jì)人員來(lái)說(shuō)通常沒有什么用處。
BDTI公司(伯克利設(shè)計(jì)技術(shù)公司)、EEMBC(EDN 嵌入式微控制器基準(zhǔn)財(cái)團(tuán))和SPEC公司(標(biāo)準(zhǔn)性能評(píng)估公司)等基準(zhǔn)團(tuán)體都支持強(qiáng)調(diào)處理器在執(zhí)行專用任務(wù)時(shí)的性能的基準(zhǔn)集。BDTI公司和EEMBC的研究人員都在研究如何擴(kuò)展其基準(zhǔn)測(cè)試集,為的是測(cè)量和比較處理器在執(zhí)行專用任務(wù)時(shí)的能量效率(附文《能量與功率》),而不是測(cè)量和比較功耗。這些任務(wù)的范圍不只是測(cè)量一種功能(如FFT)和表征較高級(jí)別任務(wù)性能(如音頻或視頻解碼器級(jí))的地址的執(zhí)行效率。
與生成處理器性能基準(zhǔn)相比,確定并執(zhí)行有意義的能量效率基準(zhǔn)更具挑戰(zhàn)性。性能基準(zhǔn)測(cè)試目前側(cè)重于測(cè)量處理器的最大處理性能。當(dāng)開發(fā)人員試圖確定某款處理器是否能夠提供實(shí)現(xiàn)某組功能所需的性能,特別是在只有一組數(shù)目有限的候選處理器能夠滿足項(xiàng)目的性能要求時(shí),這一信息是非常有用的。然而,隨著能夠滿足給定性能閾值的處理器數(shù)目不斷增加,功耗或能量效率就成為區(qū)分這些候選處理器的更重要的因素。
雖然在有源模式下,處理器功耗占總系統(tǒng)功耗的百分比很小,但是,應(yīng)用系統(tǒng)正在處理呈指數(shù)增長(zhǎng)的計(jì)算負(fù)荷(例如在處理較大圖像時(shí)),而且更需要較好的處理器能量效率。作為一個(gè)新興的實(shí)例,供患者在家中使用的醫(yī)療設(shè)備(例如可佩戴的和植入的健康監(jiān)測(cè)裝置)除了處理不斷增加的計(jì)算負(fù)荷之外,還有尺寸上的限制,不得不使用微型電池,而這些電池必須能夠持續(xù)使用很長(zhǎng)的時(shí)間——也許長(zhǎng)達(dá)數(shù)年。
一個(gè)器件的功耗是其靜態(tài)功耗和動(dòng)態(tài)功耗之和。在正常工作條件下,動(dòng)態(tài)功率超過(guò)靜態(tài)功率。對(duì)于長(zhǎng)期休眠或待機(jī)工作的應(yīng)用系統(tǒng)來(lái)說(shuō),靜態(tài)功耗成為決定電池壽命的一個(gè)主導(dǎo)因素。晶體管漏電是靜態(tài)功耗的最大分量。隨著柵極介質(zhì)厚度的減小,晶體管漏電反而呈指數(shù)增長(zhǎng)。這種情況表明,隨著晶體管幾何尺寸的不斷縮小,漏電電流會(huì)增大。處理器設(shè)計(jì)師可以采用多種技術(shù)來(lái)將靜態(tài)功耗降到最低,同時(shí)要使應(yīng)用系統(tǒng)開發(fā)人員能夠降低動(dòng)態(tài)功耗(參考文獻(xiàn)2)。降低靜態(tài)功耗的技術(shù)有:在非關(guān)鍵路徑的電路中使用速度較慢的晶體管;對(duì)漏電的快速晶體管進(jìn)行鈍化;動(dòng)態(tài)控制晶體管襯底的本體偏置。
下列公式可描述處理器的動(dòng)態(tài)功耗:P=CFV2,式中,C是處理器的動(dòng)態(tài)電容,F(xiàn)是時(shí)鐘頻率或開關(guān)頻率,而V是電源電壓。處理器設(shè)計(jì)師使用包括低功耗工作模式、頻率換算和電壓換算等在內(nèi)的功率管理技術(shù),來(lái)使應(yīng)用系統(tǒng)開發(fā)人員能將動(dòng)態(tài)功耗降低到最小。
復(fù)雜性上升
一個(gè)系統(tǒng)的專用軟件及其使用處理器資源的方法都會(huì)對(duì)處理器的能量效率產(chǎn)生很大的影響,而這種情況使如何定義、測(cè)量和標(biāo)定一個(gè)執(zhí)行特定應(yīng)用任務(wù)的處理器的能量效率變得極其復(fù)雜(附文《反直覺的能量效率》)。采用可公用的參考代碼來(lái)進(jìn)行基準(zhǔn)測(cè)試是不切實(shí)際的。首先,開發(fā)人員很可能從來(lái)不會(huì)原樣使用這一參考代碼,但會(huì)根據(jù)目標(biāo)處理器的體系結(jié)構(gòu)、資源以及任何可用的專用加速器,對(duì)該代碼進(jìn)行優(yōu)化。
使用非優(yōu)化參考代碼的不合理性對(duì)于各種性能基準(zhǔn)測(cè)試來(lái)說(shuō)沒有什么不同。然而,性能基準(zhǔn)測(cè)試的優(yōu)化(例如采用EEMBC公司的“full-fury”基準(zhǔn)測(cè)試)可能會(huì)不切實(shí)際地使用內(nèi)存及其它處理器資源來(lái)獲得最高的性能。功率基準(zhǔn)測(cè)試必須考慮這種情況:當(dāng)開發(fā)人員優(yōu)化參考代碼時(shí),必須在能耗和利用該代碼得到“足夠好”性能之間保持平衡。性能基準(zhǔn)測(cè)試目前忽視了這一要求。
因此,要獲得適合于某一處理器一系列性能點(diǎn)的有效功率基準(zhǔn)測(cè)試,可能會(huì)涉及到使用不同算法、軟件代碼和片上資源。這一要求對(duì)設(shè)計(jì)師在不同性能點(diǎn)上對(duì)同一器件進(jìn)行挑蘋果式比較的能力會(huì)產(chǎn)生很大的影響,更不用說(shuō)這一要求在比較不同的處理器體系結(jié)構(gòu)時(shí)意味著什么了。然而,這種情況是不切實(shí)際的,原因就在于基準(zhǔn)應(yīng)該是一種提高開發(fā)生產(chǎn)率的工具,有助于設(shè)計(jì)師迅速考察候選的體系結(jié)構(gòu)和配置,并且更快地做出折衷的決策。
一種折衷方案是在多個(gè)性能點(diǎn)上,在多個(gè)時(shí)鐘頻率和多個(gè)電壓下執(zhí)行相同的優(yōu)化代碼,這意味著,當(dāng)處理器廠商將功率基準(zhǔn)測(cè)試應(yīng)用于處理器時(shí),該廠商的優(yōu)化代碼應(yīng)該針對(duì)性能有效點(diǎn)?;鶞?zhǔn)測(cè)試數(shù)據(jù)在該有效點(diǎn)及其附近最適宜,而對(duì)遠(yuǎn)離該有效點(diǎn)的性能點(diǎn)則可能失去有效性。因此,處理器廠商必須標(biāo)出目標(biāo)的性能有效點(diǎn);不過(guò),對(duì)于用標(biāo)準(zhǔn)化的性能閾值進(jìn)行的專用基準(zhǔn)測(cè)試來(lái)說(shuō),這一問(wèn)題可能并不重要。
更多挑戰(zhàn)
EEMBC公司總裁Markus Levy說(shuō):“在硬件上運(yùn)行基準(zhǔn)測(cè)試集是很容易的,但測(cè)量能耗卻是很困難的。與之相反,測(cè)量IP(知識(shí)產(chǎn)權(quán))內(nèi)核的能耗是很容易的,而在IP內(nèi)核上運(yùn)行基準(zhǔn)測(cè)試集卻是很困難的。”這種說(shuō)法表明:EEMBC公司的基準(zhǔn)測(cè)試能以處理器速度在硬件上執(zhí)行,但卻要在數(shù)天的周期內(nèi)使用IP內(nèi)核的門級(jí)網(wǎng)表進(jìn)行仿真。同樣地,將測(cè)量裝置連接到硬件的什么地方,在測(cè)量中應(yīng)該包含哪些系統(tǒng)子部件,測(cè)量何時(shí)開始和何時(shí)終止,這些有時(shí)是不明顯的。在進(jìn)行IP內(nèi)核仿真時(shí),獲得任何位置的數(shù)據(jù)是一件相對(duì)簡(jiǎn)單的事情,給仿真配備儀器就是了。
評(píng)論