兼顧處理器效能與功耗 大小核設(shè)計(jì)架構(gòu)突起
圖4 big.LITTLE切換模式DVFS曲線圖
big.LITTLE MP支援非對稱叢集運(yùn)作
至于big.LITTLE MP模式則進(jìn)一步將軟體堆疊分配到兩個叢集中各個處理器,如此一來,所有CPU皆可同時運(yùn)作,將系統(tǒng)效能提升到最高點(diǎn)。
由于big.LITTLE系統(tǒng)可經(jīng)由CCI-400達(dá)到快取記憶體的一致性,因此有另一種模式能讓Cortex-A15及Cortex-A7處理器同時運(yùn)作并同步執(zhí)行程式碼,稱為big.LITTLE MP,基本上可看作一種異質(zhì)性多工處理模型。這是big.LITTLE系統(tǒng)最先進(jìn)且最具彈性的模式,能跨越兩個叢集調(diào)整單一執(zhí)行環(huán)境。
在這種使用模式下,若執(zhí)行緒有上述處理效能方面的需求,便可開啟Cortex-A15處理器核心并同時透過Cortex-A7處理器核心執(zhí)行任務(wù)。如果沒有這方面需求,則只須開啟Cortex-A7處理器,在實(shí)際應(yīng)用上,不同叢集的處理器核心不一定一致,而big.LITTLE MP比較容易支援非對稱的叢集。
調(diào)降低頻運(yùn)算多余功耗 big.LITTLE嶄露頭角
big.LITTLE技術(shù)之所以受到IC設(shè)計(jì)業(yè)者矚目,原因就是一般行動工作量對效能的需求各有不同,必須找到最合適的核心處理。圖5顯示的是目前搭載Cortex-A9的行動裝置中,兩個核心在DVFS、閑置與完全關(guān)機(jī)狀態(tài)下所花費(fèi)時間的百分比,(a)處代表最高頻率操作點(diǎn);(b)處則代表最低頻率操作點(diǎn),介于兩者之間則屬中級頻率。
圖5 big.LITTLE切換模式DVFS曲線圖
除DVFS狀態(tài),作業(yè)系統(tǒng)電源管理也會使中央處理器閑置,圖中(c)處代表閑置時間,當(dāng)CPU閑置的時間夠長,系統(tǒng)電源控制軟體將完全關(guān)閉其中一個核心以節(jié)省耗電,圖中(d)處便代表這部分。
從圖5可清楚看出應(yīng)用程式處理器在好幾種普通工作量下,都有相當(dāng)多時間處于低頻率狀態(tài),在big.LITTLE系統(tǒng)里,系統(tǒng)單晶片(SoC)可利用耗能較低的Cortex-A7核心,執(zhí)行最高操作頻率以外的所有工作。以相同方式分析更為密集的工作量,Cortex-A7處理器對應(yīng)出低于1GHz頻率的機(jī)會仍然很大。
事實(shí)上,自2011年起,使用者層級軟體已能在big.LITTLE排程上運(yùn)轉(zhuǎn),不過,那只是在處理器核心與互聯(lián)的軟體模型環(huán)境上發(fā)展。為完整評估big.LITTLE系統(tǒng)效能、功耗及調(diào)校是否合宜,還須打造一個能讓使用者軟體全速運(yùn)轉(zhuǎn)的測試晶片。
ARM測試晶片早在2012年初夏即由晶圓代工廠完成,并在短短幾周內(nèi)開始搭配參考設(shè)計(jì)板運(yùn)轉(zhuǎn),支援完整版的Linux系統(tǒng)及Android 4.0作業(yè)系統(tǒng)。這個測試晶片包含一個雙核心Cortex-A15叢集、一個三核心Cortex-A7叢集,以及CCI-400快取一致匯流排架構(gòu)。會影響部分使用者評效基準(zhǔn)的繪圖處理器并不包括在內(nèi),但平臺仍可支援Linux、Android作業(yè)系統(tǒng)與效能測試軟體。
測試晶片的Cortex-A15最高頻率達(dá)1.2GHz,Cortex-A7則為1GHz。效能評析結(jié)果顯示,雖然測試晶片上的記憶體系統(tǒng)效能不如 big.LITTLE SoC量產(chǎn)后的預(yù)測水準(zhǔn),但Cortex-A15與Cortex-A7中央處理器的效能仍落在預(yù)期范圍內(nèi)。
用來測試big.LITTLE效能的任務(wù)量,主要基于Android 4.0系統(tǒng),透過網(wǎng)頁進(jìn)行網(wǎng)路瀏覽器效能循環(huán),背景則有音效播放。在此實(shí)例中均以相當(dāng)密集的工作量搭配對性能需求不高的背景活動,網(wǎng)路瀏覽器每2秒便進(jìn)行網(wǎng)頁循環(huán),每頁卷動達(dá)500畫素,因此對系統(tǒng)效能需求相對較高。
這組結(jié)論屬于較早期的測試結(jié)果,用來測試初版big.LITTLE MP修正程式組,將Linux排程程式從一個完整而平衡的排程模式調(diào)整成big.LITTLE模式。預(yù)期未來在更多業(yè)者投入軟體修正后,效能與能耗將更進(jìn)一步改善,而其他可調(diào)校的部分也將有相關(guān)解決方案被提出。
另外,測試晶片缺少GPU,使CPU的負(fù)載高過搭載GPU系統(tǒng)在卸載狀態(tài)下的負(fù)載水準(zhǔn),而在CPU負(fù)載較低的狀況下,可能會較常使用LITTLE核心,進(jìn)而達(dá)到節(jié)能目的。它包含一套基本的電壓及頻率操作點(diǎn),但沒有對單一處理器核心做獨(dú)立的電源開關(guān)設(shè)計(jì),因此big.LITTLE系統(tǒng)單晶片量產(chǎn)后測試結(jié)果可望提升。舉例來說,后臺任務(wù)效能便可節(jié)省超過70%能耗。
big.LITTLE MP模式下半年出爐
IC設(shè)計(jì)業(yè)者正全力投入big.LITTLE開發(fā),然而,各界最常見的疑問就是應(yīng)選擇哪一種軟體模式?目前主要是在CPU切換與big.LITTLE MP之間擇一,而兩種方式各有正反意見。在CPU切換方面,由于big及LITTLE核心處于搭配成對的狀態(tài),因此對稱式的拓?fù)淠茼槙尺\(yùn)作;而big及 LITTLE核心數(shù)量不同的非對稱式拓?fù)鋭t須額外的運(yùn)轉(zhuǎn)。
由于Cortex-A7中央處理器核心體積較小,因此可使用四個LITTLE核心加上一到兩個big核心,這種作法可能會具有吸引力。從正面角度來看,中央處理器切換讓電源及效能的調(diào)校更為容易,可重復(fù)利用既有的作業(yè)系統(tǒng)電源管理程式碼,代表實(shí)作將有多年的研發(fā)及測試結(jié)果作為支援。加上不必調(diào)整核心排程程式,范圍比執(zhí)行big.LITTLE MP模式更為簡化,而軟體模式也能日趨成熟。
整體而言,CPU切換是一種極佳解決方案,2013上半年后可望進(jìn)入量產(chǎn),相關(guān)IC設(shè)計(jì)業(yè)者亦正研擬升級至big.LITTLE MP模式,以提供更多元的處理器運(yùn)算解決方案。big.LITTLE MP具有多項(xiàng)技術(shù)優(yōu)勢,雖技術(shù)尚未完全成熟,但目前的測試結(jié)果已相當(dāng)不錯。由于此模式也支援非對稱式拓?fù)?,故毋須調(diào)整軟體即可完全利用系統(tǒng)中所有核心,對提升晶片效能并降低功耗更有利。
舉例來說,big.LITTLE MP能同步利用所有核心在短時間內(nèi)達(dá)到最高效能,或?qū)ig與LITTLE核心上的DVFS設(shè)定與排程程式設(shè)定調(diào)成不同狀態(tài),以節(jié)省更多電力。不過彈性提升仍有其代價,晶片商與系統(tǒng)業(yè)者均須增加調(diào)校動作,才能從big.LITTLE MP平臺獲取完整的效能及能耗優(yōu)勢。
這與過去一直為主流,由晶片和晶圓代工廠將作業(yè)系統(tǒng)能源管理設(shè)定,以及DVFS參數(shù)資料,依裝置需求轉(zhuǎn)化為行動系統(tǒng)單晶片平臺的作法并無太大差異。 big.LITTLE MP模式將切換模式延伸并納入新的參數(shù)資料,不僅更為節(jié)能,更能為經(jīng)過效能優(yōu)化的big核心增加系統(tǒng)回應(yīng)度。
評論