告別32位移動(dòng)計(jì)算 Arm TCS23再次提升性能極限
為了滿足定義未來(lái)計(jì)算的復(fù)雜需求,并確保數(shù)百萬(wàn)開(kāi)發(fā)者能夠輕松地在 Arm 架構(gòu)的平臺(tái)上無(wú)縫開(kāi)發(fā),Arm不斷突破計(jì)算平臺(tái)的能力極限。Arm 2023 全面計(jì)算解決方案在設(shè)計(jì)時(shí)充分考慮了智能手機(jī)的需求,包含了基于全新第五代 GPU架構(gòu)、可實(shí)現(xiàn)終極視覺(jué)體驗(yàn)的全新Arm Immortalis? GPU,助力 Arm 面向下一代人工智能(AI)保持性能領(lǐng)先的全新 Armv9 CPU 集群,以及可為數(shù)百萬(wàn) Arm 開(kāi)發(fā)者提供更易訪問(wèn)軟件的全新增強(qiáng)技術(shù)。Arm 產(chǎn)品營(yíng)銷副總裁 Ian Smythe直言,Arm將以上元素全部結(jié)合在全新的全面計(jì)算解決方案中,為整個(gè)系統(tǒng)的關(guān)鍵工作負(fù)載帶來(lái)了顯著提升。
作為 Arm 2023 全面計(jì)算解決方案(TCS23)的重要特點(diǎn),所有新 CPU 均支持 64 位計(jì)算和 Armv9 安全創(chuàng)新功能,能夠抵御更高級(jí)別的數(shù)字威脅,并提供可擴(kuò)展的解決方案,從而為更廣泛的市場(chǎng)帶來(lái)更多高級(jí)的功能。TCS23代表著Arm遷移到 64 位系統(tǒng)的任務(wù)已經(jīng)完成,此次TCS23的產(chǎn)品均基于Arm全新的架構(gòu),在Arm內(nèi)部成為V9.2,代表了完全只支持64位軟件生態(tài)的全新V9.2架構(gòu)再次大幅提升Arm內(nèi)核產(chǎn)品的性能功耗比。此外,Arm 的內(nèi)存標(biāo)記擴(kuò)展(MTE)功能,支持開(kāi)發(fā)者在應(yīng)用部署前后,都能檢測(cè)和避免內(nèi)存安全漏洞,為用戶提供功能安全及信息安全的數(shù)字體驗(yàn)。通過(guò) Armv9 架構(gòu)的 CPU,Arm提供了 MTE 功能,它已經(jīng)努力消除占所有軟件漏洞中 70% 的內(nèi)存安全漏洞。
Arm 所發(fā)布的全新的 TCS23 是針對(duì)移動(dòng)計(jì)算的最優(yōu)選的計(jì)算平臺(tái),它包括了最尖端的 CPU 技術(shù)和 GPU 技術(shù),能夠讓游戲開(kāi)發(fā)者以及人工智能應(yīng)用開(kāi)發(fā)者實(shí)現(xiàn)沉浸式體驗(yàn)的打造。除了在硬件方面,它還包括軟件以及安全保駕護(hù)航的一些技術(shù)。
首款基于第五代架構(gòu)的 GPU——Immortalis-G720,它專為旗艦智能手機(jī)而設(shè)計(jì),可帶來(lái)15%的性能提升,減少了多達(dá)40%的內(nèi)存帶寬用量,有助于實(shí)現(xiàn)更出色且持久的幀率,最終帶來(lái)更高質(zhì)量的圖形,實(shí)現(xiàn)更扣人心弦的視覺(jué)感受。在相同的配置下,相較于前一代產(chǎn)品,Immortalis-G720 的性能提高了 15%,而面積僅增加 2% 。其中,前一代產(chǎn)品已經(jīng)證實(shí)在面積效率方面勝出相近競(jìng)品高達(dá) 20%。
此次Arm全新的Immortalis-G720采用的是全新的第五代GPU架構(gòu)。據(jù)介紹,該架構(gòu)專為滿足多種圖形用例而設(shè)計(jì),是Arm迄今為止最高效的GPU架構(gòu),重新定義了部分圖形管道,以優(yōu)化內(nèi)存帶寬,從而在移動(dòng)設(shè)備上支持高幾何負(fù)載的下一代游戲和實(shí)時(shí)3D應(yīng)用,同時(shí)帶來(lái)更順暢、并與PC端和游戲主機(jī)媲美的游戲體驗(yàn)。同時(shí),Arm還推出了新的Arm Mali-G720和Mali-G620,該兩款分別是去年Mali-G715和Mali-G615的升級(jí)產(chǎn)品,旨在將高端移動(dòng)圖形功能快速地推向更廣大的消費(fèi)終端市場(chǎng)。
作為 Arm 2023 全面計(jì)算解決方案的一部分,全新 Armv9 Cortex 計(jì)算集群已連續(xù)三年實(shí)現(xiàn)兩位數(shù)的性能提升。與Cortex-X3相比,新的Cortex-X4作為第四代X內(nèi)核性能提高了 15%,并帶來(lái)了一個(gè)可以顯著降低功耗多達(dá)40%的高能效微架構(gòu),而面積僅增加了10%。Arm表示,制程工藝和計(jì)算能力的結(jié)合是實(shí)現(xiàn)最高性能和最高效設(shè)計(jì)的關(guān)鍵。在新一代CPU設(shè)計(jì)中,Arm在TSMC N3E制程工藝上順利完成了業(yè)內(nèi)首個(gè)Cortex-X4流片。
全新的大核處理器 Cortex-A720 和全新小核 Cortex-A520,與其上一代相比,雙雙在能效方面都提高了 20%。Cortex-A720 是業(yè)界主流的 CPU IP,可提高持續(xù)性能,是新 CPU 集群的核心主力,而Cortex-A520 是最出眾的的高效性能核心。為了完善全新的CPU集群,arm推出了全新DSU-120 ,專門(mén)為了滿足高要求的多線程用例而設(shè)計(jì)。CPU集群提供更多的DSU電源模式,以支持更高效地使用更大的L3緩存,并減少外部 DRAM 流量,從而實(shí)現(xiàn)性能更佳、效率更高的 SoC。Arm 的全面計(jì)算戰(zhàn)略就是通過(guò)一整套針對(duì)特定工作負(fù)載而設(shè)計(jì)和優(yōu)化的 IP,這些IP可作為一個(gè)完整的系統(tǒng),無(wú)縫地協(xié)同工作。Arm 始終站在技術(shù)前沿,通過(guò)不斷提升硬件的機(jī)器學(xué)習(xí)功能,讓開(kāi)發(fā)者能充分利用AI 和 ML 工作負(fù)載的優(yōu)勢(shì)。
Arm 終端事業(yè)部產(chǎn)品管理高級(jí)總監(jiān) Kinjal Dave特別提到,所有產(chǎn)品都是基于最新一代的Armv9.2 架構(gòu),同時(shí)基于全新的DynamIQ共享單元之上,帶來(lái)更多的可擴(kuò)展性和更細(xì)致的電源控制模式,確保客戶在需要的時(shí)候可以獲得完整的性能和帶寬,在不需要的時(shí)候可以通過(guò)非常細(xì)的顆粒度去降低功率。除此之外,Arm還為最新的工藝節(jié)點(diǎn)和庫(kù)優(yōu)化了IP,并且利用在 RTL 方面的專長(zhǎng)配置物理 IP,以此在先進(jìn)的技術(shù)上,為基于Arm產(chǎn)品的設(shè)計(jì)、制造提供了優(yōu)化的EDA流程與物理實(shí)現(xiàn)。隨著Arm為未來(lái)幾代開(kāi)發(fā) TCS 解決方案,Arm將持續(xù)擴(kuò)大物理 IP 產(chǎn)品組合,用以支撐合作伙伴的實(shí)施團(tuán)隊(duì),讓他們能在 Arm 技術(shù)中去攫取所有可能的性能和效率的提升。
同時(shí),TCS23 中的軟件,包括三大支柱即性能、安全以及開(kāi)發(fā)者的可訪問(wèn)性。一個(gè)非常核心的工作負(fù)載就是機(jī)器學(xué)習(xí),它也是軟件工作中非常重要的一部分。因此,在 TCS23 中Arm更新了軟件庫(kù)。比如 Arm NN 以及 Arm Compute Library (ACL),這些都是開(kāi)源的軟件庫(kù),開(kāi)發(fā)者可以利用它來(lái)優(yōu)化在 Armv9架構(gòu) CPU 和 GPU 上面機(jī)器學(xué)習(xí)的復(fù)雜性。自 2023 年 1 月以來(lái),Arm NN和 ACL 已經(jīng)通過(guò)谷歌的 Google Play Store 在安卓系統(tǒng)上提供,而且已經(jīng)有超過(guò) 1 億日活躍用戶。此外,到 2024 年,不管是Arm NN還是 ACL 都可以使用谷歌的移動(dòng)平臺(tái),意味著開(kāi)發(fā)者能夠在可下載的項(xiàng)目,在默認(rèn)狀態(tài)下更新到網(wǎng)絡(luò)最新的版本,同時(shí)意味著能在基于 Arm 架構(gòu)上實(shí)現(xiàn)開(kāi)發(fā)者獲得最高可能的機(jī)器學(xué)習(xí)的潛力。關(guān)于機(jī)器學(xué)習(xí)方面的性能表現(xiàn),ML 已經(jīng)成了SoC上非常重要的工作負(fù)載,所以有效處理 ML 是Arm TCS 核心需求之一。在過(guò)去的三代 TCS 中,Arm 為 CPU 和 GPU 都引入了專門(mén)矩陣的 ML 指令,在 TCS23 中Arm持續(xù)優(yōu)化硬件和 Arm 計(jì)算庫(kù)軟件。
這些全新的CPU設(shè)計(jì)可用于3A級(jí)游戲、全天候生產(chǎn)力和后臺(tái)任務(wù)等用例。同時(shí),為了完善全新的CPU集群,Arm推出了全新DSU-120,專為滿足要求苛刻的多線程使用場(chǎng)景而設(shè)計(jì),支持從可穿戴設(shè)備到智能手機(jī)、筆記本電腦的眾多設(shè)備。一個(gè)全面解決方案需要有 DSU 才完整的,DSU 不光可以把所有的 IP 很好地結(jié)合在一起,同時(shí)也是催化劑,能夠?qū)崿F(xiàn)CPU集群最好的性能和效率。今年的 DSU 實(shí)現(xiàn)了三方面的提升,第一是可伸縮性。首先在可伸縮性方面,在一個(gè)集群中可以支持高達(dá)14核的數(shù)量,同時(shí)它能夠支持 24M 或者最高達(dá) 32M 的3級(jí)緩存,這可以針對(duì)筆記本及筆記本以上的一些設(shè)備進(jìn)行使用。第二個(gè)提升體現(xiàn)在新的 PPA 上,它首先可以進(jìn)一步降低漏電,同時(shí)支持更多新的電源模式,總體的目標(biāo)當(dāng)然是進(jìn)一步提高電效,從而延長(zhǎng)電池壽命。第三是全新的一些功能,因?yàn)樗腔谧钚碌腁rmv9.2的架構(gòu),因此它可以去支持比如帶寬分區(qū)還有節(jié)點(diǎn)最大化和納入一些新的接口。Arm 終端事業(yè)部產(chǎn)品管理總監(jiān) Saurabh Pradhan介紹,DSU 的伸縮性可大可小,根據(jù)具體的應(yīng)用,最小的配置可以是一個(gè)小核,最大的配置可以是10+4,所以一個(gè)DSU最多可以支持14個(gè)核,如果合作伙伴的核超過(guò)了14個(gè),可以使用多個(gè) DSU。所以 TCS23要性能有性能,要效率也有效率,Cortex-X4 提供的是終極的性能,Cortex-A720 提供的是持續(xù)的性能,而 Cortex-A520 能夠提供最好的功效。所以所有這三款的 IP 都是基于Armv9.2架構(gòu)且與最新的 DSU-120 搭配使用。
總體而言,Arm的全面計(jì)算戰(zhàn)略就是通過(guò)一整套針對(duì)特定工作負(fù)載而設(shè)計(jì)和優(yōu)化的IP,這些IP可作為一個(gè)完整的系統(tǒng),無(wú)縫地協(xié)同工作。此外,Arm為全球開(kāi)發(fā)者提供軟件和安全解決方案,其中Arm的開(kāi)源軟件庫(kù)Arm NN和Arm Compute Library已在安卓平臺(tái)上面向Google應(yīng)用開(kāi)放,目前已擁有超一億的日活用戶,可支持開(kāi)發(fā)者優(yōu)化運(yùn)行在Armv9 CPU和Arm GPU的機(jī)器學(xué)習(xí)工作負(fù)載。
評(píng)論