<meter id="pryje"><nav id="pryje"><delect id="pryje"></delect></nav></meter>
          <label id="pryje"></label>

          新聞中心

          EEPW首頁 > 嵌入式系統(tǒng) > 設計應用 > Arm終端計算子系統(tǒng)為AI用戶體驗提供計算平臺

          Arm終端計算子系統(tǒng)為AI用戶體驗提供計算平臺

          作者:Arm 終端事業(yè)部產品管理高級總監(jiān)Kinjal Dave 時間:2024-06-13 來源:EEPW 收藏

          人工智能 (AI)正在改變消費電子設備,并且革新生產力、創(chuàng)造力和娛樂體驗,這將帶來更高程度的自動化、沉浸感和個性化,為開發(fā)者和最終用戶提供海量機會。隨著推動移動端系統(tǒng)級芯片 (SoC) 的設備端生成式 AI 的發(fā)展,AI 技術正持續(xù)演進。

          本文引用地址:http://www.ex-cimer.com/article/202406/459860.htm

          依托于全面計算解決方案的成功,我們宣布推出面向消費電子設備的全新計算子系統(tǒng),即 (CSS)。作為 AI 體驗的計算基礎,它能在最廣泛類別的消費電子設備中,實現性能、效率和可擴展性的跨越式提升。

          終端CSS囊括最新的Armv9.2 Cortex CPU集群和 Arm Immortalis 與 Arm Mali GPU、CoreLink 互連系統(tǒng) IP,以及知名代工廠采用三納米工藝生產就緒的 CPU 和 GPU 物理實現。該平臺為我們的合作伙伴提供了生產芯片的最快途徑。通過物理實現,Arm 的合作伙伴能夠利用前沿三納米工藝的各種優(yōu)勢,同時實現高度靈活、可定制的芯片設計。

          深入了解Arm終端CSS

          Arm 終端 CSS 采用最新 Armv9.2 CPU 集群,其中集成了 Arm 目前最高性能的 Arm Cortex-X925 CPU、最高效的 Cortex-A725 CPU 和更新后的 Cortex-A520 CPU。這為AI和其他實際用例計算工作負載提供出色的性能和效率。

          1718271740278215.png

          圖 Arm終端CSS涵蓋哪些要素?

          最新的CoreLink互連實現了Arm終端CSS的系統(tǒng)集成和擴展。集成的系統(tǒng)級緩存 (SLC) 通過減少 DRAM 帶寬和訪問來實現更出色的系統(tǒng)能效。系統(tǒng)內存管理單元(SMMU)通過第二階段轉換加強安全性,以便支持如安卓虛擬化框架 (AVF) 等虛擬化安全框架。

          憑借基于第五代 GPU 架構、面向旗艦智能手機所設計的 Arm Immortalis-G925,Arm 終端 CSS 實現了驚人的圖形和主機級別的游戲性能。通過增強的性能和能效,用戶可以在移動設備上享受更長時間、更沉浸式的游戲體驗。

          Arm 終端 CSS 將成為第一代采用三納米工藝節(jié)點的安卓 SoC 的一部分,從而在芯片中實現出色的功耗、性能和面積 (PPA)。作為終端 CSS 的一部分,Arm 的物理實現能夠全面釋放三納米工藝技術的潛力,為高端平臺充分發(fā)揮 PPA 優(yōu)勢,并為我們的合作伙伴打造芯片創(chuàng)建最快途徑。

          我們攜手領先的代工廠合作伙伴,協(xié)同設計并交付 CPU 和 GPU 物理實現,其中包括流片就緒的 Cortex-X925 CPU 以及 Immortalis-G925 三納米工藝的物理實現。這將有助于我們的合作伙伴在三納米工藝上取得 PPA 優(yōu)勢,同時通過生產就緒的芯片解決方案來縮短芯片的開發(fā)與部署時間。此外,我們的合作伙伴能夠靈活地使用 Arm 終端 CSS 來構建特定市場、具差異化特色的 CPU 集群和 GPU。

          突破計算和AI性能的極限

          終端 CSS 是 Arm 目前面向安卓系統(tǒng)速度最快的平臺,與 2023 Arm 全面計算解決方案 (TCS23) 平臺相比,在關鍵基準和一般計算用例方面取得了顯著改進。其中包括:

          ●   通過 Geekbench 6 單核分數測量可知,得益于新的 Cortex-X925,峰值性能提高 36%;

          ●   在前十大應用中,五款應用的平均啟動時間加快了 33%,不僅提高了生產力,也帶來了流暢的移動體驗;

          ●   通過Speedometer 2.1瀏覽器基準測量時,網頁瀏覽速度加快了 60%;

          ●   在包括光線追蹤和可變速率著色 (VRS) 基準等七項圖形基準中,峰值圖形性能平均提高 30%。

          1718271777440628.png

          圖 Arm終端CSS的一些性能優(yōu)勢

          Arm 終端 CSS 平臺提供由 AI 驅動的消費電子設備體驗。今年早些時候,我們展示了大語言模型 (LLM) 如何在移動設備上的 Arm CPU 進行本地運行。借助終端 CSS,LLM 將得以在 Arm CPU 上更好地運行,帶來更快的響應速度。當運行 Llama 3 LLM 和 Phi-3 LLM時,該平臺可將詞元 (Token) 首次響應時間分別縮短 42% 以及 46%。

          1718271815347387.png

          圖 通過Arm終端CSS在Arm CPU上運行LLM

          此外,得益于新Arm CPU和GPU所取得的技術進展,在廣泛的通用 AI 網絡上,Arm 終端 CSS 的 AI 推理性能獲得了顯著的提升。例如,采用 Cortex-X925 時,推理速度加快 59%;采用 Immortalis-G925 時,AI 推理速度加快 36%。此外,通過在終端 CSS 的 CPU 集群配置中利用一顆額外的 Cortex-X925 CPU,我們觀察到在 17 個主流網絡中,針對 int8 和 fp16 數據類型的 AI 推理性能提高了驚人的 2.7 倍。這些在 AI 推理方面的改進可在一系列 AI 用例中實現無縫順暢的用戶體驗。

          1718271857328817.png

          圖 Arm終端CSS提升AI推理

          Arm終端CSS在計算攝影和AI攝像頭等AI用例中的表現尤為優(yōu)異。要想拍攝出美輪美奐且具有逼真焦外成像效果(讓背景模糊并聚焦所選主體)的照片和視頻,這并非易事。AI 攝像頭的焦外成像管線由深度估計、分割、摳圖和混合等多個階段組成,可生成高質量的影像結果。與 TCS23 相比,通過 CPU 上針對焦外成像工作負載的 AI 處理,終端 CSS 的焦外成像性能提升了 24%。這意味著用戶可以在不影響電池續(xù)航時間的前提下,在照片和視頻上獲得更快、更順暢的焦外成像效果。

          1718271999843234.png

          圖 通過Arm終端CSS提升AI攝像頭性能

          此外,通過軟件和工具的結合,Arm 終端 CSS 的性能與功耗得以獲得進一步優(yōu)化。Arm 新推出的 Kleidi包含了經高度優(yōu)化的機器學習 (ML) 軟件內核集合 KleidiAI,能讓開發(fā)者在通過高度優(yōu)化的生成式 AI 框架運行 AI 工作負載時,全面釋放 Arm CPU 的潛力。這意味著開發(fā)者能夠面向各類設備,基于盡可能高的性能,快速構建 AI 應用。

          為了獲得更具沉浸感和更長時間的游戲體驗,Arm 終端 CSS 實現了兩位數的性能和能效提升,其中包括在一系列熱門的手游中,平均以每秒 120 幀的速度運行時,在相同功耗下可帶來 37% 的平均性能提升,同時 GPU 功耗降低 30%。

          可擴展的性能覆蓋各類消費電子設備市場

          Arm 致力于讓每個人都能享有 AI,并通過可應用在各類和各種不同外觀設計的消費電子設備的終端 CSS,不斷提升性能和效率。

          Arm 終端 CSS 可擴展應用至市面上最高性能的消費電子設備,包括新一代 AI PC。其中的 Cortex-X925 與 Cortex-X4 CPU 相比,其TOPS 提高 50%。終端 CSS 為 PC 市場提供專用的可擴展平臺。該平臺采用 Cortex-X925 以提供一流的單線程性能,并通過近期更新的 DSU-120(在單個 CPU 集群內提供多達 14 個 CPU 核心)提供最佳的性能可擴展性。除了 SVE2,更多的 Armv9 架構的功能,包括已在移動端生態(tài)系統(tǒng)驗證的安全性技術,如指針驗證 (PAC)、分支目標識別 (BTI) 和內存標記擴展 (MTE) 等,也將引入 PC 市場。

          通過終端 CSS,Arm 可為消費電子設備市場的各類性能和成本需求提供可獲取的 AI 技術。Cortex-A725 是實現高能效 AI 吞吐量的主要處理器,在對成本更敏感的大眾消費電子技術市場領域,它是 AI 處理的主力和主要開發(fā)者目標。例如,我們曾在一個虛擬助手演示中,展示了在搭載三核 Cortex-A700 系列 CPU 核心的現有安卓智能手機上,運行 Llama2-7B 和 Phi-3-mini (Phi-3 3.8B) LLM 的性能。與此同時,面積經優(yōu)化的 Cortex-A725 可在廣泛的消費電子技術領域中,以高面積效率實現生成式 AI 工作負載的部署。

          消費電子技術的AI根基

          Arm終端CSS是為各類消費電子設備打造新一代 AI 體驗的專用平臺。終端 CSS 是 Arm 針對安卓系統(tǒng)速度最快的計算平臺,這將使得用戶能夠在其移動設備上獲得前所未有的安卓體驗。該平臺的 PPA 優(yōu)勢通過物理實現得以達成,助力我們的芯片合作伙伴縮短產品上市時間并順暢部署。終端 CSS 的可擴展性能有助于在各種類型、不同外觀設計的設備的所有成本點上釋放 AI 性能,使得人人都能享有 AI。

          1718272035715535.png

          Arm 終端 CSS 使得我們的生態(tài)系統(tǒng)能夠實現更多突破,無論是釋放更多性能、實現更多 AI 功能和應用體驗,還是打造更先進的芯片,Arm 平臺是這一切的基礎。憑借終端 CSS,Arm 為當前和未來的 AI 體驗構建消費電子計算的未來。



          評論


          相關推薦

          技術專區(qū)

          關閉
          看屁屁www成人影院,亚洲人妻成人图片,亚洲精品成人午夜在线,日韩在线 欧美成人 (function(){ var bp = document.createElement('script'); var curProtocol = window.location.protocol.split(':')[0]; if (curProtocol === 'https') { bp.src = 'https://zz.bdstatic.com/linksubmit/push.js'; } else { bp.src = 'http://push.zhanzhang.baidu.com/push.js'; } var s = document.getElementsByTagName("script")[0]; s.parentNode.insertBefore(bp, s); })();