ARM Mali-G71 詳細解讀
Mali-G71圖形處理器(GPU)是Mali 高性能GPU家族最新推出的頂級產(chǎn)品。Mali-G71基于全新Bifrost架構(gòu),代表了高端移動圖像處理性能的最高水平,進一步奠定了Mali在競爭激烈GPU市場的主導(dǎo)地位。
本文引用地址:http://www.ex-cimer.com/article/201609/303311.htmMali-G71研發(fā)期間充分參考了包括虛擬現(xiàn)實(VR)、增強現(xiàn)實(AR)、以及3D游戲在內(nèi)等高端移動應(yīng)用核心需求,這些應(yīng)用場景將繼續(xù)快速發(fā)展;同時,包括Vulkan及OpenCL 2.0在內(nèi)的現(xiàn)代API也是研發(fā)要點。“貪吃蛇”的時代早已成為歷史,移動游戲行業(yè)的飛速發(fā)展令人目不暇接,即便是高端設(shè)備也越來越無法滿足下一代移動游戲的要求。針對這一問題,Mali-G71著眼于下一代移動圖像處理技術(shù),讓搭載Mali-G71的設(shè)備更強勁、更高效、更出色。使用Mali-G71 GPU的設(shè)備,其圖像處理性能甚至可與中端筆記本相媲美。
關(guān)于Bifrost架構(gòu)
Mali的全新Bifrost架構(gòu)標(biāo)志著GPU領(lǐng)域的飛躍以及移動圖像處理技術(shù)的未來。Bifrost架構(gòu)設(shè)計蘊含大量創(chuàng)新和優(yōu)化,下面將對此做簡要說明。
指令組著色器(Claused Shader)將指令集分組到預(yù)先設(shè)置好的程序塊,使指令組可以自動執(zhí)行且不會中斷?;诖?,我們可以確保所有外部依賴在子句執(zhí)行前便已就緒;通過設(shè)計執(zhí)行單元,臨時結(jié)果也無需訪問寄存器組。這便緩解了對寄存器文件的壓力,顯著降低功耗;通過簡化執(zhí)行單元的控制邏輯,GPU的面積也得以縮小。
指令組著色器顯著降低功耗
Bifrost架構(gòu)的另一創(chuàng)新在于其采用基于Quad的矢量化技術(shù)。Midgard GPU采用單指令多數(shù)據(jù)結(jié)構(gòu)(SIMD )矢量化技術(shù),管道階段一次只執(zhí)行單一線程;且非常依賴著色器代碼執(zhí)行向量指令。Quad矢量化技術(shù)最高支持四線程同步執(zhí)行,共享控制邏輯,降低執(zhí)行單元的填充難度,使用率將近100%,深度匹配開發(fā)人員編寫著色器代碼的最新方法。
高可拓展性
前代高性能移動GPU只支持1到16核擴展。為了滿足移動設(shè)備不斷提高的性能需求,全新Mali-G71支持1到32核拓展。利用Mali-G71的高可擴展性,無論DTV設(shè)備、高性能智能手機,還是最新的VR設(shè)備;無論是移動版本還是單機版本,均可實現(xiàn)強勁的圖像處理性能。Mali-G71的可拓展性及 40% 的面積效率提升,助力合作伙伴更能隨心所欲地按照目標(biāo)要求開發(fā)系統(tǒng),在功耗、效率和成本間實現(xiàn)平衡,更精準(zhǔn)地實現(xiàn)產(chǎn)品在目標(biāo)市場的定位。
適用于高端游戲
移動游戲正迅速成為世界各地游戲玩家的首選游戲平臺。2017年,移動游戲市場規(guī)模超過400億美元,較2016年增加100億美元。移動設(shè)備性能的不斷提高,為移動游戲市場的持續(xù)增長奠定了基礎(chǔ);隨著復(fù)雜性逐年上升,移動游戲市場的增長也面臨挑戰(zhàn)。數(shù)年前發(fā)布的游戲演示程序,其頂點數(shù)量只有現(xiàn)在的一半,因此對功耗和效率的要求更高。如果應(yīng)用程序繼續(xù)以這一速率發(fā)展,32核可拓展性將成為高端移動設(shè)備的標(biāo)準(zhǔn)配置。此外,Mali-G71 在相似條件下的能效比Mali-T880高出20%,受散熱限制的高端設(shè)備也可以擁有更持久的性能。
支持Vulkan和OpenCL2.0
我們必須充分關(guān)注API的發(fā)展,畢竟,API定義了開發(fā)人員與底層硬件的交互方式。作為一家GPU和CPU技術(shù)公司,我們需要不斷滿足開發(fā)人員的需求,才能保證終端用戶獲得最佳設(shè)備體驗。近年來,發(fā)展的一大趨勢就是允許開發(fā)人員以低級別權(quán)限訪問硬件;因此,Khronos公司應(yīng)勢推出全新 Vulkan 1.0 API。類似地,OpenCL2.0提升了異構(gòu)計算對開發(fā)人員的友好度;將來,隨著OpenCL2.0設(shè)備投放市場,更為典型的使用案例將會逐漸涌現(xiàn)。得益于完整硬件一致性,Mali-G71不僅支持Vulkan 1.0和OpenCL 2.0 Full Profile,還支持細紋理緩沖及共享虛擬內(nèi)存;同時,還可降低軟件開發(fā)難度,優(yōu)化終端用戶體驗。
轉(zhuǎn)為虛擬現(xiàn)實(VR)量身打造
虛擬現(xiàn)實是圖像處理領(lǐng)域的熱門話題,包括虛擬現(xiàn)實如何實現(xiàn),需要什么條件,如何為用戶提供最佳的VR體驗等三個方面。Mali-G71 GPU正是基于這類需求量身打造。VR技術(shù)全面的性能需求,意味著高端設(shè)備的GPU技術(shù)必須具有更高能效。另外,攝像頭和屏幕等手機組件也正以前所未有的速度發(fā)展,并且設(shè)備的受熱性能也面臨嚴(yán)峻挑戰(zhàn)。因此,GPU必須全力降低能耗。
Mali GPU系列產(chǎn)品支持多項先進VR優(yōu)化功能,營造最佳移動VR體驗。利用前置緩沖技術(shù),無需離屏緩沖區(qū)便可直接向前置緩存區(qū)提交數(shù)據(jù),節(jié)約時間,降低延遲;Mali同時支持API“多視角”拓展,應(yīng)用程序每次可向驅(qū)動提交單幀繪畫指令,驅(qū)動可為每只眼睛分配具體任務(wù),顯著降低應(yīng)用和驅(qū)動CPU的處理時間。針對基于Midgard和Bifrost的Mali GPU,我們進一步優(yōu)化了頂點處理技術(shù),單次頂點處理,雙眼共享結(jié)果。除上述特色外,還有多項其他特色,使Mali-G71成為未來移動VR的首選。
強大的內(nèi)容保護
如今,我們使用手機的頻率越來越高;對許多人來講,臺式機或筆記本已經(jīng)不是必需品,因為手機即可處理所有事情,比如下載、瀏覽內(nèi)容、向其他設(shè)備傳輸文件等。近期上市的Mali-DP650顯示處理器可處理4k內(nèi)容,Mali-G71將內(nèi)容無縫、保真地將內(nèi)容傳輸?shù)诫娨暽?。盡管4k還沒有在手機上普及,但當(dāng)在其他4k設(shè)備上瀏覽內(nèi)容時,性能不會有任何損失。
評論