谷歌下月上線 A3 實例:搭載英偉達 H100,可提供 26 exaFlops AI 性能
IT之家 8 月 31 日消息,Google Cloud 在今天召開的云 Next 大會上,宣布下月上線 A3 虛擬機實例。谷歌云在今年 5 月召開的 I / O 開發(fā)者大會上宣布 A3 實例,最大的亮點在于配備英偉達 H100 Tensor Core GPU,滿足生成式 AI 和大語言模型的需求。
本文引用地址:http://www.ex-cimer.com/article/202308/450105.htmIT之家此前報道,A3 實例采用了第 4 代英特爾至強可擴展處理器、2TB DDR5-4800 內(nèi)存,以及 8 張英偉達 H100“Hopper”GPU,通過 NVLink 4.0 和 NVSwitch 實現(xiàn)了 3.6 TBps 的對分帶寬。
新的 A3 超級計算機“專門用于訓練和服務要求最苛刻的人工智能模型,這些模型為當今的生成人工智能和大型語言模型創(chuàng)新提供動力”。據(jù)介紹,這款超級計算機可以提供 26 exaFlops 的人工智能性能。
谷歌云在今天的發(fā)布會上還介紹了全新的 TPU v5e,是迄今為止最具成本效益和可訪問的云 TPU。這些 TPU 或定制 ASIC 旨在加速 AI 和 ML 工作負載。
SDxCentral 報道稱,TPU v5e 相比較前代,每美元的訓練性能提高了一倍,每美元的推理性能提高了 2.5 倍。
評論