AMD 百萬兆次級 APU MI300A 量產:OpenFOAM 測試是英偉達 H100 的 4 倍
IT之家 12 月 7 日消息,AMD 在推出旗艦 MI300X 加速卡之外,還宣布 Instinct MI300A APU 已進入量產階段,預估明年開始交付,上市后有望成為世界上最快的 HPC 解決方案。
本文引用地址:http://www.ex-cimer.com/article/202312/453629.htmAMD Instinct MI300A 加速器以創新的 AMD CDNA 架構為基礎,經優化可實現百萬兆次級性能和節能,是創新的針對 HPC 和 AI 的加速處理器 (APU),提供 24 個“Zen 4”CPU 核心和 128 GB 的 CPU 與 GPU 共享的 HBM3 內存,帶來非凡的性能。
AMD Instinct MI300A APU 結合了 Zen 4、CDNA 3 和第 4 代 Infinity 架構和互聯技術,其部分性能如下:
FP64 精度下,最高算力 61 TFLOPS
FP32 精度下,最高算力 122 TFLOPS
最高 128 GB HBM3 內存
1460 億個晶體管
MI300A 的封裝和 MI300X 非常相似,不過前者使用了 TCO 優化的內存容量和 Zen 4 內核。
每個活動 die 有 2 個 CDNA 3 GCD,提供單獨的緩存和核心 IP 池。每個 CCD 有 8 個內核和 16 個線程,因此活動芯片上總共有 24 個內核和 48 個線程。還有 24 MB 的 L2 緩存(每個內核 1 MB)和一個單獨的緩存池(每個 CCD 32 MB)。
在 GPU 方面,AMD 基于 CDNA 3 架構共支持了 228 個計算單元,相當于 14592 個內核。也就是說,每個 GPU 小芯片有 38 個計算單元。
IT之家簡要總結下 AMD Instinct MI300 加速器的突出功能
首款集成 CPU+GPU 封裝
瞄準百萬兆次級超級計算機市場
1460 億個晶體管
最多 24 個 Zen 4 核心
CDNA 3 GPU 架構
228 個計算單元(14,592 個內核)
最高 128 GB HBM3 內存
最多 8 個 Chiplets + 8 個存儲器堆棧(5nm + 6nm 工藝)
性能
AMD 再次將 MI300A 與 H100 進行了比較,得益于統一的內存布局、GPU 性能以及整體內存容量和帶寬,在 OpenFOAM 測試中,性能是 H100 的 4 倍。
AMD 還證實,Instinct MI300A APU 現已出貨,還將用于為下一代 El-Capitan 超級計算機提供動力,該超級計算機預計將提供高達 2 Exaflops 的計算能力。
評論