英特爾(INTC.US)推出新一代AI芯片Gaudi 3 采用臺積電5nm工藝
周二,英特爾(INTC.US)在其Intel Vision 2024產業創新大會上,面向客戶和合作伙伴作出了一系列重磅宣布。這些宣布包括推出全新的Gaudi 3人工智能加速器、全新的至強6品牌,以及包括開放、可擴展系統和下一代產品在內的全棧解決方案,還有多項戰略合作。
本文引用地址:http://www.ex-cimer.com/article/202404/457362.htm據數據預測,到2030年,全球半導體市場規模將達到1萬億美元,人工智能將是主要的推動力。然而,截至2023年,僅有10%的企業成功將其AI生成內容(AIGC)項目商業化。英特爾的最新解決方案旨在幫助企業克服推廣AI項目時遇到的挑戰,加快AIGC的商業應用。
英特爾現有的Gaudi 2在2022年5月推出,并于2023年7月正式進入中國市場。它以高性能、高效率和高性價比而著稱。該產品采用臺積電7nm工藝,具備24個可編程的Tenor張量核心、48MB的SRAM緩存、21個10萬兆內部互連以太網接口、96GB的HBM2E高帶寬內存等,能夠滿足大規模語言模型和生成式AI模型的計算需求。
新一代Gaudi 3專為AI訓練和推理設計,采用了臺積電(TSM.US)5nm工藝,帶來了兩倍的FP8 AI算力和四倍的BF16 AI算力,以及更高的網絡和內存帶寬。與NVIDIA H100相比,Gaudi 3在流行的大型語言模型(LLM)上具有更高的推理性能和更快的訓練速度。
預計Gaudi 3將顯著縮短不同規模的Llama2模型和GPT-3模型的訓練時間,并在Llama和Falcon等大型語言模型上提供出色的推理吞吐量和能效。Gaudi 3支持多種形式因素,包括與OAM兼容的夾層卡、通用基板和PCIe擴展卡,滿足各種應用需求。
Gaudi 3還提供開放的、基于社區的軟件支持,并通過標準以太網網絡實現從單節點到超級集群的靈活擴展,以支持大規模的推理、微調和訓練需求。
Gaudi 3的優勢在于其高性能、經濟實用、節能和快速部署能力,能夠有效滿足AI應用在復雜性、成本效益、數據可靠性和合規性等方面的需求。該加速器預計將在2024年第二季度開始向OEM廠商出貨,包括戴爾、慧與、聯想和超威等品牌。
目前,英特爾Gaudi加速器已與NAVER、博世、IBM等眾多行業客戶和合作伙伴建立了合作關系。
此外,英特爾還宣布與Anyscale、DataStax等多家合作伙伴共同創建開放平臺,推動AI創新。該平臺旨在開發開放的、多供應商支持的AIGC系統,提供先進的部署便利性、性能和價值。
英特爾計劃利用至強處理器和Gaudi加速器,推出AIGC流水線的參考實現,發布技術概念框架,并進一步加強Intel Tiber開發者云平臺基礎設施的功能,以助力企業在AI創新領域取得突破。
截至周二收盤,英特爾收漲0.92%,報38.33美元。
評論