連結(jié)多種運(yùn)算核心 HSA架構(gòu)提高處理器能源效率
異質(zhì)運(yùn)算架構(gòu)(HSA)將有助實(shí)現(xiàn)高效能、低功耗處理器設(shè)計(jì)。隨著HSA標(biāo)準(zhǔn)和軟體解決方案日益成熟,處理器研發(fā)人員將能利用此技術(shù)促進(jìn)系統(tǒng)單晶片(SoC)內(nèi)部的異質(zhì)核心協(xié)同運(yùn)作,并透過軟體將復(fù)雜任務(wù)分配至最合適的運(yùn)算單元,進(jìn)而兼顧高運(yùn)算效率和低能源消耗。
本文引用地址:http://www.ex-cimer.com/article/201609/303492.htm異質(zhì)運(yùn)算的時(shí)代終于來臨,恰好能夠解救處理器設(shè)計(jì)者脫離為迎合摩爾定律的28奈米(nm)新制程成本增加問題。處理器設(shè)計(jì)師不必只是仰賴昂貴的低功率電晶體,而是可以透過系統(tǒng)架構(gòu)改善,將軟體工作負(fù)載分配至不同異質(zhì)運(yùn)算單元,藉此協(xié)助降低能源消耗。
業(yè)界大廠合力推動(dòng) HSA技術(shù)受矚目
近年來,處理器能源效率的進(jìn)步,多半是因?yàn)槌⌒突雽?dǎo)體制程的迅速發(fā)展,隨著制造技術(shù)的推陳出新,每一電晶體的成本不斷提高,異質(zhì)系統(tǒng)架構(gòu)(Heterogenous System Architecture, HSA)等替代技術(shù)因此而崛起。
不同于仰賴相同通用中央處理器(CPU)核心的同質(zhì)處理器架構(gòu),HSA連結(jié)多種運(yùn)算核心,如CPU、繪圖處理器(GPU)、數(shù)位訊號(hào)處理器(DSP)、現(xiàn)場(chǎng)可編程閘陣列(FPGA)及固定功能硬體等,各類核心針對(duì)不同類型的應(yīng)用工作負(fù)載而優(yōu)化。
由超微半導(dǎo)體(AMD)、安謀國際(ARM)、Imagination、聯(lián)發(fā)科、高通(Qualcomm)、三星電子(Samsung Electronics)與德州儀器(TI)等所設(shè)立的“HSA基金會(huì)”,旨在確保應(yīng)用程式能夠?qū)⑷蝿?wù)分配至對(duì)于特定工作負(fù)載具有最高電源效率的超微次世代繪圖核心(GCN)運(yùn)算單元,藉此妥善管理應(yīng)用程式執(zhí)行。HSA基金會(huì)建立一套連接異質(zhì)運(yùn)算核心的開放標(biāo)準(zhǔn),讓各家業(yè)者得以各自發(fā)展支援共同軟體基礎(chǔ)架構(gòu)的解決方案,從而實(shí)現(xiàn)具有高效能及高電源效率的異質(zhì)應(yīng)用。
同時(shí)支援x86/ARM架構(gòu) HSA實(shí)現(xiàn)跨平臺(tái)設(shè)計(jì)
超微半導(dǎo)體于2014年初發(fā)表A系列加速處理器(APU)--Kaveri,可支援HSA功能。軟體業(yè)者能夠利用該系統(tǒng),設(shè)計(jì)出廣泛部署支援HSA之應(yīng)用程式所需的軟體開發(fā)工具。
HSA的重要特性之一是能跨平臺(tái)支援x86產(chǎn)品及安謀國際架構(gòu)產(chǎn)品,并具備開發(fā)系統(tǒng),可供開發(fā)支援HSA中間語言(HSAIL)的編譯器及其他工具,促進(jìn)真正的可攜式應(yīng)用。2014年6月首次公開發(fā)布HSA系統(tǒng)架構(gòu)規(guī)格(暫定為版本1.0)后,現(xiàn)已有更多軟體開發(fā)團(tuán)隊(duì)能夠得知HSA的詳情,進(jìn)而利用更為簡(jiǎn)單的HSA異質(zhì)運(yùn)算編程模型開發(fā)出新的節(jié)電演算法。
由于目前系統(tǒng)效能擴(kuò)展受限于電力消耗,超微半導(dǎo)體已著手研發(fā)支援高度平行任務(wù),可于CPU與GPU間無縫平移的異質(zhì)運(yùn)算形式。這項(xiàng)技術(shù)創(chuàng)新構(gòu)成HSA的基礎(chǔ),帶來加強(qiáng)能源效率,同時(shí)提升效能并維持可編程性的契機(jī)。而要整合CPU與GPU于同一晶片,關(guān)鍵就在于GPU的設(shè)計(jì)。
每單位能源消耗所完成的工作是通用的能源效率指標(biāo)。舉例來說,一臺(tái)筆記型電腦的效率越高,就能讓使用者以越少的電池耗電量及越低的發(fā)熱程度完成相同任務(wù)。就行動(dòng)運(yùn)算而言,美國能源之星計(jì)畫(United States Energy Star Program)制定一套典型耗能的合理概算標(biāo)準(zhǔn);特別的是,這套標(biāo)準(zhǔn)是以“短期閑置”電力為主要依據(jù)。
一般而言,存取文件或打開網(wǎng)頁之后,使用者會(huì)花時(shí)間檢視結(jié)果。這樣的閑置期間在現(xiàn)代系統(tǒng)中可能短如按鍵輸入之間或影片訊框之間的間隔,這段時(shí)間處理器會(huì)進(jìn)入低耗電狀態(tài)。因此,超微半導(dǎo)體將運(yùn)算能力除以標(biāo)準(zhǔn)能源使用,定義為其行動(dòng)裝置晶片的通常使用效率。例如,將兩臺(tái)效能相近的筆記型電腦相較,使用者必然偏好電池續(xù)航力較長(zhǎng)的機(jī)種。同樣地,若將兩臺(tái)電池續(xù)航力相同的筆記型電腦相較,使用者必然也會(huì)傾向選擇效能較高且反應(yīng)速度較快的那一臺(tái)。這兩種情況都能透過標(biāo)準(zhǔn)使用能源效率指標(biāo)具體呈現(xiàn)。
超微半導(dǎo)體計(jì)畫于未來6年之內(nèi)將標(biāo)準(zhǔn)使用能源效率提升二十五倍,且已委托市場(chǎng)分析公司Tirias Research技術(shù)分析師就此目標(biāo)加以評(píng)估,并為超微半導(dǎo)體所做研究的結(jié)果統(tǒng)整成一份技術(shù)白皮書,公布于Tirias Research網(wǎng)站。
為達(dá)成二十五倍如此積極的目標(biāo),超微半導(dǎo)體將廣泛運(yùn)用各種資源,除著重架構(gòu)、設(shè)計(jì)及軟體等方面之外,還將輔以矽晶圓制程技術(shù)。具體而言,超微半導(dǎo)體將聚焦于以下三大面向:
.智慧即時(shí)電源管理的改善
這些改良有助于降低閑置耗電,并發(fā)揮快速完成工作以更快回復(fù)低耗電狀態(tài)的“加速進(jìn)入閑置模式(Race To Idle)”優(yōu)點(diǎn)。
.強(qiáng)化異質(zhì)運(yùn)算能力
HSA能夠幫助APU提升一般工作負(fù)載效能(如以PCMark 8 v2.0等產(chǎn)業(yè)標(biāo)準(zhǔn)為基準(zhǔn)測(cè)試所示),以及新興的視覺導(dǎo)向互動(dòng)工作負(fù)載(如自然使用者介面連同影像及語音辨識(shí))。
.高電源效率實(shí)施的創(chuàng)新
透過運(yùn)用如先進(jìn)功率閘控、低電壓操作等技術(shù)以及進(jìn)一步整合系統(tǒng)組件等做法,提升APU矽智財(cái)(IP)效率。
Tirias Research指出,將降低閑置耗電及智慧化電源管理所達(dá)成的節(jié)電功效,同時(shí)與異質(zhì)運(yùn)算效能提升和程序改善相結(jié)合。超微半導(dǎo)體應(yīng)能達(dá)成在2014?2020年之間實(shí)現(xiàn)二十五倍標(biāo)準(zhǔn)使用能源效率改善的目標(biāo)。
超微半導(dǎo)體目前已將筆記型電腦中的GPU、記憶體控制器、輸入/輸出(I/O)控制器及周邊匯流排等系統(tǒng)組件全部都整合于單一晶粒中,可實(shí)現(xiàn)同時(shí)監(jiān)控 CPU與GPU的精密化電源管理。這項(xiàng)技術(shù)能夠有效平衡兩種單元之間的電力最佳化,將散熱能力集中在最須要散熱的單元。除此之外,將GPU移至CPU晶粒,可以減少所需要之記憶體介面數(shù)量,同時(shí)還可以達(dá)到省電之效果。
超微半導(dǎo)體的智慧電源管理以專用晶??刂破髯粉櫣?、溫度及各主要組件活動(dòng)情形,使APU進(jìn)一步提升效率。這種功率微控制器就像是“APU交響曲”的指揮,在正確的時(shí)間將處理重點(diǎn)導(dǎo)向正確的位置,其可快速回應(yīng)熱事件,控制器能夠快速分配電力到CPU的特定部位,以發(fā)揮最大效能與效率。另外,也能判斷各單元何時(shí)最無活動(dòng)現(xiàn)象,并將其運(yùn)作降低至最小狀態(tài)或?qū)⒅耆P(guān)閉。
處理元件若能以最短時(shí)間完成工作,然后進(jìn)入最深休眠狀態(tài),即達(dá)到其最大能源效率。這種“加速進(jìn)入閑置模式”行為對(duì)于網(wǎng)頁瀏覽、文件編輯和相片編輯等多數(shù)消費(fèi)者導(dǎo)向任務(wù)都很有助益。協(xié)調(diào)GPU與CPU的使用能夠使APU更快完成任務(wù),然后降低功率、減少總耗能(能量=功率×時(shí)間)。此一耗電狀態(tài)過渡時(shí)間應(yīng)極短,使單元盡快降低功率,讓處理器能夠在使用者進(jìn)行按鍵輸入或影片訊框之間,就可進(jìn)入閑置狀態(tài)。
評(píng)論