Arm帶來AI基礎設施關鍵技術,新一代Neoverse CSS N3和CSS V3
近年來,隨著第四次科技革命浪潮的驅動,基礎設施領域不再局限于芯片、服務器或機架,而是牽系著整個數據中心,它正在轉向更復雜的倉庫級計算。如今全球正邁入一個新的階段,即生成式人工智能(GenAI)時代,Arm認為2024年及未來,預計將出現大規模的創新應用。作為基礎設施領域技術變革的基石,Arm再次帶來創新。
本文引用地址:http://www.ex-cimer.com/article/202402/455772.htm2024年2月22日,Arm召開技術媒體溝通會,宣布推出兩款基于全新第三代Neoverse IP構建的新的Arm? Neoverse?計算子系統 (CSS),主要包括Arm Neoverse CSS V3以及Arm Neoverse CSS N3。
打造協同設計新模式,滿足計算基礎設施需求
Arm基礎設施事業部產品解決方案副總裁Dermot O’Driscoll表示,從兩個將推動未來基礎設施發展的重要顛覆性趨勢來看,人們希望對支持云計算關鍵工作負載的計算進行優化,以及頭部企業正在打造定制芯片,并需要一種行之有效的方式來實現這一目標。而軟件和硬件在過去分別由不同的公司負責開發,這樣老舊的模式已經無法滿足現在客戶對性能的需求,也無法適配軟件或硬件的復雜性??蛻粝M洳渴鸬挠布?,甚至是微架構層面,都能被優化,以便順利運行其軟件工作負載。此類聯合優化很難實現,需要軟硬件雙方做出巨大的投入才能夠完成。
在這樣的背景下,Arm的合作式IP業務模式和計算子系統在其中可以發揮關鍵作用。據Dermot O’Driscoll表示,“通過與Arm的協作模式,合作伙伴可以在我們IP的開發過程中,在對應IP的典型系統上運行其工作負載。這種協作模式直接影響Arm架構的發展方向,以及我們在IP產品中實現微架構的方式。在交付IP之后,我們也將為合作伙伴提供貫穿整個芯片開發周期的支持。通過模擬和仿真,我們幫助他們評估由Arm提供的設計選擇,并在開發與配置的全流程中提供支持,從而縮短產品上市進程?!?/p>
Dermot O’Driscoll認為,“我們與合作伙伴通力協作為定制計算開辟了一條獨特路徑,以滿足當今計算基礎設施的需求,這種協同設計并不局限于 CPU。為了深入優化TCO,就必須著眼于整個平臺。而只有Arm能夠在平臺級別上調優內存和I/O,并添加自定義工作負載加速器?!?/p>
Arm于去年推出了Neoverse CSS,有助于更快地開發芯片或小芯片。在Neoverse CSS中,Arm負責配置、優化和驗證一套完整的計算子系統,并針對基礎設施市場的各種關鍵用例進行配置,使其合作伙伴能夠專注于針對特定系統級工作負載塑造差異化競爭優勢,比如軟件調優、定制加速等。此外,客戶還能從CSS中額外獲得選購優勢,他們能夠加速產品上市時間、降低工程成本,同時還能夠善用前沿的處理器技術。
值得一提的是,以Neoverse CSS為基礎的Arm全面設計(Arm Total Design)生態項目也在去年下半年推出。Arm 基礎設施事業部營銷副總裁 Eddie Ramirez表示,Arm全面設計(Arm Total Design)生態項目在推出后四個月內,已經有20多家成員加入。其中包括新的EDA和配套IP提供商,以及來自包括韓國、中國臺灣、中國大陸和印度等戰略市場的芯片設計合作伙伴,這些市場存在巨大的發展潛力。Arm正在與三家主要代工廠合作,以確保其CSS產品能在其先進工藝節點上進行優化。
CSS定制芯片強力輔助,新一代Arm Neoverse技術功能深度優化
Arm發布的新一代Neoverse技術包括通過性能效率更優異的 N 系列新 IP 擴展Arm Neoverse CSS產品路線圖,即Neoverse CSS N3;以及首次將計算子系統引入性能優先的V系列產品線,即新的Neoverse CSS V3。
01.Arm Neoverse CSS N3每瓦性能提高20%
本次Arm推出了N系列新的CSS產品——Neoverse CSS N3,新產品在N2的基礎之上更新了許多功能。據Arm介紹,CSS N3是基于新的Neoverse N3 IP平臺打造,為新的N系列產品引入了Armv9.2功能,能為每個核心提供2MB的專用L2緩存,并支持最新的PCIe和CXLI/O標準以及UCIe芯粒標準。
性能方面,與CSS N2相比,CSS N3每核心的每瓦性能可提高20%,單芯片可支持8到32核。此外,CSS N3的首個實例可提供 32 核,熱設計功耗(TDP)低至40W,可擴展性非常強,可覆蓋電信、網絡和DPU等一系列應用。在AI 數據分析工作負載方面,通過有效的微架構調整,N3的性能提升高達 196%。
合作方面,Arm透露,智原科技正在構建基于芯粒的服務器芯片,該芯片將搭載64顆N系列核心,并基于英特爾代工服務的18A工藝節點進行生產制造。同時,ADTechnology將提供高性價比的16核CSS N系列邊緣服務器平臺,他們將與三星代工廠合作,為邊緣計算釋放更強大的算力。
02. Arm Neoverse CSS V3單芯片性能提高了 50%
Arm Neoverse CSS V3是Arm首次針對Neoverse V系列CPU內核提供該IP的現成CSS版本。
Arm Neoverse CSS V3是基于新的Neoverse V3核心打造,是Arm目前單線程性能最高的Neoverse核心,并為Arm機密計算架構(CCA)提供硬件支持。與N3核心一樣,V3也可提供業界領先的專用L2緩存大小,顯著改善性能表現。
從性能上看,與CSS N2產品相比,Arm Neoverse CSS V3單芯片性能可提高50%,在單芯片上最多可擴展至128核,同時還支持最新的高速內存和I/O標準。在AI 數據分析工作負載方面,相較于V2,V3的性能提升了84%。不過至于功耗方面,Arm并未提及更多內容。
從內部結構看,Arm Neoverse CSS V3每個集群擁有64個核心,每個插槽最多有128個核心,支持PCIe Gen5、CXL 3.0甚至HBM3等現代功能。此外,據Arm透露,Socionext正在設計一款32核Neoverse CSS V3小芯片,將在臺積電(TSMC)生產。
Dermot O’Driscoll表示,新產品全方位地實現了非常良好的提升,從視頻處理到 SQL 數據庫的性能均有所躍進。N系列在壓縮方面取得了性能優勢,可降低云服務運營商的成本,并最終降低云服務客戶的成本,同樣地V系列顯著提高了協議緩沖區的性能,這是在數據中心內傳輸數據的一項關鍵功能。以下是基于Neoverse N系列和V系列打造的芯片在一些關鍵工作負載下的性能數據。
Arm指出,憑借兩款全新的Neoverse CSS產品CSS N3和CSS V3,Arm專注于釋放芯粒等新技術的潛力,并更大限度地優化實際工作負載的TCO,這對于整個生態系統至關重要,其中包括AI、數據庫、網絡等。
這次的發布會中,Arm還向業界披露了其下一代CSS V系列(代號:CSS Vega)和N系列(代號:CSS Ranger)平臺的代號,其中,Dionysus將是下一個N系列核心,Adonis將是下一個V系列核心。而Lycius將是下一個Neoverse E系列核心。但Arm只是公布了下一代產品代號,并未介紹更多技術細節。
“隨著越來越多的AI工作負載被采用,并貫穿于整個計算流程,涵蓋從大型數據中心到網絡、服務器以及計算基礎設施的方方面面。Arm Neoverse V3和N3提供了支撐這一轉型所需的計算性能和效率,而在Arm全面設計生態項目的支持下,我們的計算子系統能夠加速產品上市時間,并加大對創新的投資力度?!盇rm高級副總裁兼基礎設施事業部總經理Mohamed Awad在會上表示。
此外,基于 Arm 全面設計生態伙伴的反饋意見,Arm 近期發布芯粒系統架構 (Chiplet System Architecture,CSA)。CSA 旨在定義一個功能強大、支持通用的芯粒生態系統,以提高多個供應商之間的組件(包括物理設計 IP、軟 IP 等)復用率。
評論