<meter id="pryje"><nav id="pryje"><delect id="pryje"></delect></nav></meter>

<label id="pryje"></label>

新聞中心

EEPW首頁 > EDA/PCB > 業(yè)界動態(tài) > 行動處理器將整合更多GPU

行動處理器將整合更多GPU

作者：時間：2013-12-24 來源：慧聰電子網

加入技術交流群
- 掃碼加入
  和技術大咖面對面交流
  海量資料庫查詢

收藏

　　高階行動裝置對多媒體等視覺體驗的要求愈來愈高，促使行動處理器開發(fā)商大舉整合更多GPU核心，期借助平行運算能力，分散CPU運算負擔，進而強化繪圖與視覺表現。

本文引用地址：http://www.ex-cimer.com/article/203076.htm

　　在全球消費性市場中，智慧手機與平板裝置無疑是最熱門的產品，根據顧能(Gartner)所發(fā)布的最新預測指出，2013年手機出貨量將超過十八億支，較2012年成長3.7%;平板的出貨量將上看一億八千四百萬臺，成長42.7%，呈現高速增長態(tài)勢。

　　尤其值得關注的是高階行動裝置產品更不斷推陳出新，給用戶的視覺性應用體驗已接近個人電腦(PC)、電視等級，即可提供豐富、流暢的二維(2D)或三維(3D)使用者繪圖介面(GUI)、視網膜(Retina)級的高畫質、快速的網頁呈現及攝影功能，以及更逼真的3D游戲等。

　　在一臺小小的行動裝置上要達到這些使用體驗，對于開發(fā)者而言，設計門檻已愈來愈高。以3D游戲為例，要讓行動裝置達到與PC、電視同級的游戲體驗，須提升的視覺效果包括實體表現、動態(tài)照明、高動態(tài)范圍材質(HDRTexture)、先進陰影效果、幾何細節(jié)、次表面散射(SubsurfaceScattering)，以及動態(tài)反射(DynamicReflection)等。

　　所幸，最關鍵的行動處理器架構不斷升級，除出現整合中央處理器(CPU)和繪圖處理器(GPU)的異質多核心架構外，GPU的數量及處理能力也大幅提升，成為實現流暢、長時效視覺體驗的最大功臣。以下將剖析先進GPU在架構上的變化與最新進展。

　　實現更酷炫繪圖功能異質多核心SoC勢不可當

　　愈來愈多中高階行動裝置配置四核心CPU的行動處理器，以輝達(NVIDIA)的Tegra系列來說，自Tegra3開始，就已進入4+1的多核心架構，即四顆效能核心加一顆省電核心，而最新一代的Tegra4，同樣采用4+1的多核心架構，但處理器核心從前代的Cortex-A9提升為Cortex-A15;至于Tegra4i則仍采用Cortex-A9(r4)CPU。

　　雖然CPU的數目愈多，意味著處理效能也跟著提升，但因CPU的序列處理特性，愈多核心意味著應用程式撰寫亦愈困難;相較之下，由于GPU具備平行處理特性，能以近線性化來擴充效能，因此增加GPU數目所提升的效益，會比CPU顯著許多。

　　在此情況下，整合CPU與GPU的異質多核心架構，就成了必然之勢。而當GPU核心更多，也讓開發(fā)者有更大空間和彈性去做出更酷的繪圖效果、更細膩的細節(jié)表現及更生動的情境塑造，讓行動視覺與游戲的體驗大幅提升。

　　Tegra4的GPU子系統(tǒng)就是很好的例子，它從前代的十二顆GeForceGPU核心，一舉提高到七十二顆，六倍的核心數也帶來六倍于Tegra3的繪圖效能。Tegra4及Tegra3在GPU效能表現上的差異，請參考表1。在系統(tǒng)配置上，其架構中有所謂的頂點著色器(VertexShader)和畫素著色器(PixelShader);前者讓工程師可自訂場景(Scene)中頂點的轉換過程，后者則是用來控制畫面上每個畫素的著色計算。

整合更多GPU核,移動處理器大開“眼”界

　　整合更多GPU核,移動處理器大開“眼”界

　　更進一步來看，Tegra4的作法是將七十二顆GeForce核心拆分為二十四顆VertexShader與四十八顆PixelShader。其中每四顆VertexShader組成一組頂點處理引擎(VertexProcessingEngine,VPE)，所以有六顆VPE，分別具有16KB、96-entry快取記憶體，能夠有效降低向外部晶片存取資料的需求。在相同時脈下，新的GeForce核心可以帶來1.5倍于Tegra3的效能，而前后代VertexShader數量相差六倍，相乘之下差距達九倍之多。此外，Tegar4總共具有四組畫素管線(PixelFragmentShaderPipeline)，每組畫素管線可細分為三組算術邏輯單元(ALU)，每個ALU則是由四顆GeForce核心(即PixelShader)組成。在實際運作時，會以ALU做為最小層級的單元，并稱為多功能處理單元(Multi-FunctionUnit,MFU)，因此Tegar4總共具有十二組MFU，MFU可執(zhí)行函數、三角函數、對數、倒數、平方根及MOV等指令(組合語言中的復制)(圖1、2)。

圖1 Tegra4的邏輯性繪圖處理管線流程圖

　　圖1 Tegra4的邏輯性繪圖處理管線流程圖

圖2 Tegra 4的GPU架構方塊圖

　　圖2 Tegra 4的GPU架構方塊圖

　　降低多核心SoC耗電量架構設計擔當重任

　　對于行動裝置而言，電池的使用壽命與效能/功能表現占有同樣重要的地位。同樣是四核心行動晶片，因個別架構不同，往往也有不同的效能與功耗表現。以Tegra4來說，除采用安謀國際(ARM)最先進的CPU核心外，透過可變對稱式多重處理(vSMP)架構，可依照使用需求進行調配，讓四顆效能核心發(fā)揮最大處理能力，并可視工作量，分別自動啟用及停用各顆核心，以大幅節(jié)省電力。

　　為了提升續(xù)航力，Tegra4延續(xù)Tegra3的省電概念，在晶片中加入第五顆處理器核心，不過名稱從協(xié)同核心(CompanionCore)改為省電核心(BatterySaverCore)。當裝置處于背景處理郵件、社交軟體同步，或是播放影片、音樂等低效能需求情境時，系統(tǒng)將關閉效能核心，并使用省電核心負責執(zhí)行程式。

　　就晶片設計觀之，多核心處理器必定會面臨記憶體頻寬和整體系統(tǒng)功率的重大瓶頸，為了因應此議題，Tegra4提出雙通道(2x32位元)的記憶體子系統(tǒng)作法。此外，為減少對晶片外記憶體的存取使用需求，Tegra4的GPU架構中規(guī)畫頂點、畫素、材質(Texture)專用的快取記憶體，讓運算任務盡量在晶片內部完成，以提升處理效益和降低功耗。

　　另一個降低系統(tǒng)單晶片(SoC)功耗的重要策略，就是采用先進的電源管理技術。以Tegra4來說，即采用多層級時脈閘控(MultipleLevelsofClockGating)、顯示要求群組(DisplayRequestGroupig)、動態(tài)電壓與頻率調節(jié)(DVFS)等多種電源管理技術，針對不同使用情境將電源需求降至最低。

　　運算型攝影架構助力行動裝置影像效能升級

　　再從應用端來看GPU架構的發(fā)展，今日的使用者非常仰賴行動裝置來進行照相和和錄影功能，且希望達到專業(yè)級的效果。不過，相較于相機，手機或平板裝置在先天性上就難以配置太大的鏡頭，這時想得到高品質的影像，就得靠更先進的影像處理技術，甚至是運用電腦演算法來創(chuàng)造影像。

　　為了提升消費型行動影像體驗，真正捕捉到「稍縱即逝」的瞬間畫面，Tegra4內建Chimera運算型攝影架構，它融合CPU、GPU及影像訊號處理器(ISP)的處理能力，讓裝置制造商得以大幅強化行動影像。在此架構下，行動裝置能夠即時擷取高品質的Always-On高動態(tài)范圍照片和影片、高動態(tài)范圍全景攝影和持續(xù)的點觸追蹤(Tap-to-Track)等功能。

　　以高動態(tài)范圍全景攝影來說，其中運用廣角或「魚眼」鏡頭的效果，通常是只在昂貴的數位單眼相機才具備的功能。Chimera架構讓相機在移動時即可擷取場景，毋須依循特定的方位進行掃描，并可任意從左右、上下或對角線等方向移動，讓使用者可隨心所欲運用更多角度和任何順序的影像，即時「描繪」一張全景相片。持續(xù)型Tap-to-Track技術則讓使用者能在拍照時，針對場景中的一個人物或物件進行自動曝光和鎖定，隨后無論對焦主體移動位置，或者相機調整到另一個更好的拍攝角度，相機都會自動追蹤原先已鎖定的主體。持續(xù)型的Tap-to-track功能也能隨著相機移動調整曝光，避免影像主體或背景有曝光不足或過度曝光的現象。

　　更進一步來看，Chimera架構能為人所不能的原因，憑藉的是其影像處理的速度高達每秒執(zhí)行約一千億次的數學運算。同時，它導入了許多先進演算法，包括運用X光電腦斷層掃描(CT)器、深度太空望遠鏡和間諜衛(wèi)星所使用的電腦運算技術，進而排除從前無法解決的問題，讓行動影像的呈現效果就像人類肉眼看到的世界一樣，有很多不同的景物、地點和場景，并富含各種的光線變化。

　　異質多核心SoC擴張應用版圖

　　異質多核心的SoC架構的優(yōu)勢明顯，加上由行動市場所驅動的技術演進日漸成熟，使得更多嵌入式應用也開始選擇導入這類的行動處理器，其中一個快速成長的市場，即是車用電子領域，特別是車內資訊娛樂(IVI)系統(tǒng)、數位儀表板、駕駛支援等應用，皆仰賴更強大的GPU/CPU來加以支援。

　　以IVI系統(tǒng)來說，須要提供逼真的3D地圖和地形、時髦流暢的使用者介面，以及功能豐富的音訊系統(tǒng)。透過在行動應用已證實可行的Tegra行動處理器，汽車制造商可以更快將這些功能整合至車輛當中。在視覺處理方面，輝達即特別為車商開發(fā)出基于Tegra行動處理器的視覺運算模組(VisualComputingModule,VCM)。

　　相較于更新周期較長的其他車載電子系統(tǒng)，汽車用戶期待自己的IVI系統(tǒng)和行動應用有相似的體驗。透過這套VCM模組式設計，車商就能將快速發(fā)展的行動處理器技術獨立出來開發(fā)與整合，進而能在不同的車款中快速建置IVI車載系統(tǒng)，此舉也有助于大幅節(jié)省開發(fā)時間和成本。

　　舉例來說，知名汽車品牌商奧迪(Audi)即導入VCM并推出具連網功能的AudiMIB系統(tǒng)，讓AudiConnect平臺可隨時完整更新Google地球影像和Google地圖街景服務的360度全景圖。它同時也能實現其他網路資料的傳輸，如即時汽油價、天氣預測及Google本地搜尋的有用資訊。

　　挑選CPU與GPU軟體開發(fā)支援/開發(fā)工具成指標

　　除了先進的硬體功能外，軟體開發(fā)的支援及開發(fā)工具也是開發(fā)者選擇GPU/CPU的關鍵。如前所述，Tegra系列的彈性化架構，讓開發(fā)者能運用客制化的演算法來調整GPU架構，進而得到更突出的視覺效果。不僅如此，在Tegra開發(fā)人員工具(TegraAndroidDeveloperPack)中支持包括CPU采樣分析(TegraProfiler)和GPU分析(PerfHUDES)等功能，NsightTegra則提供Android本地端的開發(fā)環(huán)境，讓開發(fā)者能更方便且快速的達成工作目標。

　　在更高的GPU繪圖效能帶動下，可以預見行動或車載裝置將能享有更佳的視覺體驗。另一個值得關注的發(fā)展，則是未來透過瀏覽器實現3D場景、高畫質顯示及快速反應游戲的需求將會浮現，背后驅動的力量則來自HTML5及WebGL等技術的發(fā)展。

　　事實上，HTML5已能支援GPU的應用，愈來愈多瀏覽器也開始運用GPU來加速其視覺表現。在跨裝置、跨平臺的網站上提供強大視覺內容的時代即將來臨，這將會帶來很大的商機，當然，挑戰(zhàn)也不小呢!

<a target='_blank'><img src='https://ad.eepw.com.cn/www/delivery/avw.php?zoneid=114&cb=INSERT_RANDOM_NUMBER_HERE&n=a7a83b30' border='0' alt='' /></a>
<a target='_blank'><img src='https://ad.eepw.com.cn/www/delivery/avw.php?zoneid=115&cb=INSERT_RANDOM_NUMBER_HERE&n=a3d98779' border='0' alt='' /></a>
<a target='_blank'><img src='https://ad.eepw.com.cn/www/delivery/avw.php?zoneid=116&cb=INSERT_RANDOM_NUMBER_HERE&n=abca108c' border='0' alt='' /></a>
<a target='_blank'><img src='https://ad.eepw.com.cn/www/delivery/avw.php?zoneid=117&cb=INSERT_RANDOM_NUMBER_HERE&n=a1775170' border='0' alt='' /></a>
<a target='_blank'><img src='https://ad.eepw.com.cn/www/delivery/avw.php?zoneid=118&cb=INSERT_RANDOM_NUMBER_HERE&n=a449048b' border='0' alt='' /></a>

關鍵詞： GPU核 移動處理器

評論

相關推薦

百花齊放！第 13 代酷睿臺式機產品家族、移動處理器家族、N 系列處理器齊聚 CES 2023

智能計算酷睿移動處理器英特爾 CES 2023 | 2023-01-04

因移動市場達不到期望英特爾取消所有新的移動處理器開發(fā)計劃

消費電子英特爾移動處理器 | 2016-12-08

x86做移動芯片真不行？為Intel“平反”

嵌入式系統(tǒng) SoC 移動處理器智能手機 ARM架構處理器 | 2017-06-04

從“蜂鳥”到自主架構貓鼬” 回顧三星移動處理器15年進化史

三星移動處理器 | 2016-02-03

14年來最高 AMD已拿下37.5%的x86處理器市場份額

消費電子 AMD 移動處理器 | 2020-09-27

英特爾推第10代Core H系列移動處理器

英特爾 Core H 移動處理器 | 2020-04-07

“大法”出手索尼自研移動處理器靠不靠譜？

手機與無線通信索尼移動處理器 | 2017-07-06

移動處理器發(fā)展新方向，整合更多的GPU將成為主流？

設計方案 CPU 移動處理器 GPU SoC T | 2015-08-20

高通帝國非一日煉成，多極化布局聯(lián)發(fā)科難追

嵌入式系統(tǒng) 高通 LTE 聯(lián)發(fā)科移動處理器 | 2014-11-04

盤點：移動處理器已經是強弩之末？

消費電子移動處理器高通三星 | 2015-02-26

架構與ISA：移動處理器的真正關鍵

嵌入式系統(tǒng) 架構 ISA 移動處理器 | 2016-10-15

焦點

推薦視頻

技術專區(qū)

關閉

看屁屁www成人影院,亚洲人妻成人图片,亚洲精品成人午夜在线,日韩在线欧美成人 (function(){ var bp = document.createElement('script'); var curProtocol = window.location.protocol.split(':')[0]; if (curProtocol === 'https') { bp.src = 'https://zz.bdstatic.com/linksubmit/push.js'; } else { bp.src = 'http://push.zhanzhang.baidu.com/push.js'; } var s = document.getElementsByTagName("script")[0]; s.parentNode.insertBefore(bp, s); })();