<meter id="pryje"><nav id="pryje"><delect id="pryje"></delect></nav></meter>
          <label id="pryje"></label>

          新聞中心

          EEPW首頁 > 智能計算 > 新品快遞 > NVIDIA推出Blackwell架構DGX SuperPOD,適用于萬億參數級的生成式AI超級計算

          NVIDIA推出Blackwell架構DGX SuperPOD,適用于萬億參數級的生成式AI超級計算

          —— 基于先進的NVIDIA網絡、NVIDIA全棧AI軟件和存儲技術,可將集群中Grace Blackwell超級芯片的數量擴展至數萬個,通過NVIDIA NVLink可將多達576塊Blackwell GPU連成一個整體,由NVIDIA系統專家加速即時AI基礎設施的部署
          作者:時間:2024-03-19來源:EEPW收藏


          本文引用地址:http://www.ex-cimer.com/article/202403/456544.htm

          1710843202501249.png

          于近日發布新一代AI機 —— 搭載 GB200 Grace 超級芯片的 ?。這臺AI機可以用于處理萬億參數模型,能夠保證超大規模生成式 AI 訓練和推理工作負載的持續運行。

          全新  采用新型高效液冷機架級擴展架構,基于NVIDIA DGX? GB200系統構建而成,在FP4精度下可提供 11.5 exaflops 的 AI 性能和 240 TB 的快速顯存,且可通過增加機架來擴展性能。

          每個DGX GB200系統搭載36個NVIDIA GB200超級芯片,共包含36個NVIDIA Grace CPU和72個NVIDIA GPU。這些超級芯片通過第五代NVIDIA NVLink?連接成一臺超級計算機。與NVIDIA H100 Tensor Core GPU相比,GB200 超級芯片在大語言模型推理工作負載方面的性能提升了高達 30 倍。

          NVIDIA創始人兼首席執行官黃仁勛表示: “NVIDIA DGX AI超級計算機是推進 AI 產業變革的工廠。新一代DGX SuperPO 集NVIDIA加速計算、網絡和軟件方面的最新進展于一體,能夠幫助每一個企業、行業和國家完善并生成自己的AI?!?/p>

          Grace  架構的  由 8 個或以上的 DGX GB200 系統構建而成,這些系統通過 NVIDIA Quantum InfiniBand 網絡連接,可擴展到數萬個 GB200 超級芯片。用戶可通過 NVLink 連接 8 個 DGX GB200 系統中的 576 塊 Blackwell GPU,從而獲得海量共享顯存空間,來賦能下一代 AI 模型。

          面向時代的全新機架級擴展的DGX SuperPOD架構

          采用DGX GB200系統構建而成的全新DGX SuperPOD采用了統一的計算網絡。除第五代NVIDIA NVLink網絡外,還包括NVIDIA BlueField?-3 DPU,并將支持同為近日發布的NVIDIA Quantum-X800 InfiniBand網絡。這個架構可為計算平臺中的每塊GPU提供高達每秒1800 GB的帶寬。

          另外,第四代NVIDIA可擴展分層聚合和規約協議(SHARP)?技術可提供14.4 teraflops的網絡計算能力,與上一代產品相比,新一代DGX SuperPOD架構的網絡計算能力提高了 4 倍。

          統包式架構搭配先進的軟件,實現前所未有的正常運行時間

          全新DGX SuperPOD是一臺完整的數據中心級AI超級計算機,在與NVIDIA認證合作伙伴提供的高性能存儲集成后,能夠滿足工作負載的需求。每臺超級計算機都在出廠前完成了搭建、布線和測試,從而大大加快了在用戶數據中心的部署速度。

          Grace Blackwell架構的DGX SuperPOD具有智能預測管理功能,能夠持續監控軟硬件中的數千個數據點,通過預測并攔截導致停機和低效的根源以節省時間、能耗和計算成本。

          即使沒有系統管理員在場,該軟件也能識別需要重點關注的領域并制定維護計劃,靈活調整計算資源,通過自動保存和恢復作業來防止停機。

          如果軟件檢測到需要更換組件,該集群將激活備用容量以確保工作能夠及時完成。為任何必要的硬件更換做好安排,以免出現計劃之外的停機。

          NVIDIA DGX B200系統推動各行各業AI超級計算發展

          NVIDIA還發布了一款統一用于AI模型訓練、微調和推理的通用AI超級計算平臺NVIDIA DGX B200系統。

          采用風冷傳統機架式設計的DGX已被全球各行各業數千家企業廣泛采用,DGX B200 DGX系列的第六代產品。采用Blackwell架構的全新DGX B200系統包含8個NVIDIA B200 Tensor Core GPU和2個第五代英特爾?至強?處理器。用戶還可以使用 DGX B200 系統構建 DGX SuperPOD,打造能夠幫助大型開發團隊運行多種不同作業的 AI 卓越中心。

          DGX B200 系統憑借全新 Blackwell 架構中的 FP4 精度特性,可提供高達 144 petaflops 的 AI 性能、1.4TB 海量的 GPU 顯存和 64TB/s 的顯存帶寬,從而使得該系統的萬億參數模型實時推理速度比上一代產品提升了 15 倍

          DGX B200系統包含帶有8個NVIDIA ConnectX?-7網卡和2個BlueField-3 DPU的高性能網絡,每個連接的帶寬高達400 Gb/s,可通過NVIDIA Quantum-2 InfiniBand 和 NVIDIA Spectrum?-X以太網網絡平臺支持更高的AI性能。

          軟件和專家為擴大生產級AI的規模提供支持

          所有 NVIDIA DGX 平臺均包含用于企業級開發和部署的NVIDIA AI Enterprise軟件。DGX用戶可以通過使用該軟件平臺中的預訓練的 NVIDIA 基礎模型、框架、工具套件和全新NVIDIA NIM微服務來加速他們的工作。

          NVIDIA DGX專家與部分獲得NVIDIA DGX平臺支持認證的合作伙伴將在每個部署環節為用戶提供幫助,以便其迅速實現AI投產。在系統投入運行后,DGX專家還將繼續協助用戶優化其AI管線和基礎設施。

          供應情況

          NVIDIA全球合作伙伴預計將在今年晚些時候提供基于DGX GB200和DGX B200系統構建而成的NVIDIA DGX SuperPOD。更多信息,請觀看GTC主題演講回放或在3月21日前參加由NVIDIA和行業領導者帶來的會議。



          評論


          相關推薦

          技術專區

          關閉
          看屁屁www成人影院,亚洲人妻成人图片,亚洲精品成人午夜在线,日韩在线 欧美成人 (function(){ var bp = document.createElement('script'); var curProtocol = window.location.protocol.split(':')[0]; if (curProtocol === 'https') { bp.src = 'https://zz.bdstatic.com/linksubmit/push.js'; } else { bp.src = 'http://push.zhanzhang.baidu.com/push.js'; } var s = document.getElementsByTagName("script")[0]; s.parentNode.insertBefore(bp, s); })();