Arm發(fā)布全新終端計算子系統(tǒng),引領(lǐng)AI驅(qū)動下的移動設(shè)備性能革新
5 月 30 日,Arm發(fā)布了最新的 Arm 終端計算子系統(tǒng) (Arm CSS for Client),為移動設(shè)備行業(yè)帶來了新的突破。隨著人工智能 (AI) 發(fā)展的逐漸深入,AI帶給了我們越來越多的體驗提升,我們正在見證 AI 從手機(jī)到筆記本電腦所取得的顯著創(chuàng)新,并由此誕生了 AI 智能手機(jī)和 AI PC。就在這AI的浪潮之下,Arm所發(fā)布的終端 CSS 旨在加速設(shè)備端AI 的發(fā)展,為智能手機(jī)、筆記本電腦、可穿戴設(shè)備和數(shù)字電視等設(shè)備提供更強(qiáng)大的性能和更高的能效。
Arm 終端事業(yè)部產(chǎn)品管理副總裁James McNiven在日前舉辦的媒體溝通會上介紹了Arm發(fā)布的終端 CSS。
James McNiven表示,Arm終端CSS將物理實現(xiàn)與 Armv9 的 AI 優(yōu)勢結(jié)合在一起,整合了最新的 Armv9.2 CPU 和最新的 Immortalis GPU,最新的 CoreLink 系統(tǒng)互連和系統(tǒng)內(nèi)存管理單元 (SMMU),并優(yōu)化到內(nèi)存及 SoC 其他部分的計算路徑。其中,Arm首次在終端領(lǐng)域為CPU 和 GPU 提供物理實現(xiàn),不僅簡化了 SoC 設(shè)計流程,還可確保了產(chǎn)品上市速度。
本次發(fā)布的重頭戲是最新的 Armv9 CPU —— Arm Cortex-X925,以及 Immortalis GPU —— Arm Immortalis-G925。
我們先來看看Cortex-X925,命名的改變代表的不止是新一代的設(shè)計,更是性能的大幅提升。對此James McNiven進(jìn)一步談到,Cortex-X925 是 Cortex-X 推出以來取得最高 IPC 同比增幅的 CPU,通過結(jié)合新設(shè)計所實現(xiàn)的微架構(gòu)改進(jìn)和頻率提升,Cortex-X925 在 Geekbench 中實現(xiàn)了 36% 的單線程性能增長。以 AI 性能為例,與去年的 Cortex-X CPU 相比,詞元 (Token) 首次響應(yīng)時間提高了 41%,其LLM的初始響應(yīng)能力有了顯著改善。Arm是怎么做到如此顯著的性能提升的呢?James McNiven在現(xiàn)場對媒體進(jìn)行了深入的闡述,得益于微架構(gòu)的顯著演進(jìn)——Arm迄今為止最寬的解碼和矢量設(shè)計帶來了巨幅的提升,實現(xiàn)了 50% TOPS 數(shù)的增長。通過更強(qiáng)的可配置性和更大的私有 L2 緩存大小,保留進(jìn)出過CPU的指令和數(shù)據(jù)。而且Arm的 RTL 和物理設(shè)計團(tuán)隊之間也展開了進(jìn)一步協(xié)作,針對3nm工藝,提升頻率和效率。
而在GPU方面,Arm帶來了全新的Arm Immortalis-G925。與CPU的命名一致,作為Arm性能最強(qiáng)、效率最高的 GPU,其在名字上也作出了相應(yīng)的調(diào)整。在各種圖形應(yīng)用上,Immortalis-G925 的性能同比提高了 37%;而在多個 AI/ML 網(wǎng)絡(luò)上進(jìn)行測量時,實現(xiàn)了約 34% 的性能提升。此外,還有光線追蹤技術(shù)。2022 年,Immortalis 將光線追蹤技術(shù)引入智能手機(jī)。今年,Arm大幅提高了光線追蹤技術(shù)在面對復(fù)雜物體時的表現(xiàn),其性能提升高達(dá) 52%。
在 CSS 上的效率方面,James McNiven介紹到,與 Cortex-A720 相比,Cortex-A725 的能效提高了 35%。該成果源于Arm改進(jìn)了微架構(gòu),并善用工藝和物理 IP 優(yōu)化?!靶『恕盋ortex-A520 CPU 也隨著工藝和物理實現(xiàn)的提升而得到了改進(jìn)。至于圖形效率,Arm發(fā)現(xiàn)在提供與去年終端平臺相同水平的游戲性能下,《堡壘之夜》等手游的功耗降低了 30%。至于可擴(kuò)展性,Arm的合作伙伴可以利用這一系列不同的 CPU 和 GPU 選項,針對大屏幕計算、智能手機(jī)、數(shù)字電視和可穿戴設(shè)備等精心設(shè)計自己的解決方案。
除了通過 CSS 推動性能和效率提升之外,Arm也一直始終致力于為每一位安卓設(shè)備用戶提高性能。在 Cortex-X925 帶來的 30% 性能提升基礎(chǔ)上,Arm對網(wǎng)頁瀏覽器進(jìn)行了改進(jìn),使其性能提高了 23%。除了 Chrome,中國的手機(jī)廠商也將這些改進(jìn)引入到其瀏覽器中。與此同時,Arm繼續(xù)攜手 Google,推動其安卓動態(tài)性能框架 (Android Dynamic Performance Framework) 的發(fā)展。在最新版本的框架中,實現(xiàn)高端內(nèi)容的每幀能耗降低了 25%,幀速率則提高了 35%。此外,Arm還調(diào)整了安卓工作負(fù)載在不同 CPU 核心之間的平衡方式,從而為 YouTube 節(jié)省了高達(dá) 10% 的功耗。針對 Google 的 AV1 視頻編解碼器,Arm對其進(jìn)行了軟件優(yōu)化,使當(dāng)下安卓設(shè)備的視頻性能最多可提高 40%。
Arm 終端 CSS 的發(fā)布標(biāo)志著移動設(shè)備行業(yè)邁向了新的階段,將推動設(shè)備端 AI 應(yīng)用的普及和發(fā)展。開發(fā)者可以利用終端CSS 的強(qiáng)大性能和軟件支持,打造出更加智能、高效和用戶體驗更佳的設(shè)備。
圖:Arm 終端事業(yè)部產(chǎn)品管理副總裁James McNiven(圖左)與 vivo 首席芯片規(guī)劃專家夏曉菲(圖右)分享雙方合作
vivo作為Arm的合作伙伴也來到了溝通會的現(xiàn)場,vivo 首席芯片規(guī)劃專家夏曉菲表示,vivo 非常注重用戶體驗,在 Arm CSS 的技術(shù)基礎(chǔ)之上,vivo與 Arm 密切合作,共同推動開發(fā)者生態(tài),使手機(jī)更流暢更好用,同時也為設(shè)備端帶來了前沿的 AI 體驗。Arm 持續(xù)加大 AI 技術(shù)上的布局。相信大家會看到 Arm CSS 里面集成更多更強(qiáng)大的 AI 能力,同時提供一個更加廣泛的針對開發(fā)者的開發(fā)環(huán)境,能夠讓所有的開發(fā)者基于通用平臺開發(fā)出自己基于端側(cè)的生成式 AI 應(yīng)用和體驗。
Arm 終端CSS 的發(fā)布為移動設(shè)備行業(yè)帶來了新的機(jī)遇,將推動設(shè)備端 AI 應(yīng)用的快速發(fā)展。其卓越的的高性能、高效率和高可擴(kuò)展性,將幫助開發(fā)者打造出更加智能、高效和用戶體驗更佳的設(shè)備,為消費(fèi)者帶來更加美好的未來。
評論