Habana Gaudi處理器為亞馬遜 EC2客戶帶來低成本的人工智能訓練體驗
在近日舉行的re:Invent 2020 CEO主題大會上,AWS 宣布 了采用多達8個Habana? Gaudi?加速器的EC2實例,比目前GPU的EC2實例在機器學習性價比上提升了40%1,基于Gaudi?的EC2實例計劃于2021年上半年提供使用。
本文引用地址:http://www.ex-cimer.com/article/202012/421026.htm在主題大會上,AWS首席執(zhí)行官Andy Jassy強調了各行業(yè)對高性能、更實惠的人工智能工作的巨大需求。隨著公司計劃引入以Gaudi為特色的新EC2實例進行深度學習訓練,AWS將進一步降低AI數據集的訓練成本,并降低希望利用AI提供業(yè)務分析、改善效率和增強用戶體驗的客戶的運營總成本。
8卡的Gaudi 解決方案可以在TensorFlow上每秒處理12000張圖像訓練ResNet-50模型。每個Gaudi處理器集成了32GB的HBM2內存,并集成了用于服務器內部處理器互聯的RoCE功能。憑借AWS彈性架構適配器(EFA)的技術可以跨服務器擴展,從而允許AWS及其客戶無縫地擴展使用多個基于Gaudi的系統以實現高效和可擴展的分布式訓練。
Habana的SynapseAI軟件套件專為在Habana Gaudi處理器上提供高性能的深度學習訓練,SynapseAI與TensorFlow和Pythorch等流行的深度學習框架集成,對Gaudi進行了優(yōu)化。開發(fā)人員將可以獲取開放的Gaudi軟件、參考模型和文檔。參考模型將在Habana的GitHub知識庫中公開發(fā)布,并將包括各種流行的模型,如圖像分類、對象檢測、自然語言處理和推薦系統。SynapseAI軟件套件包括Habana的圖形編譯器和實時Tensor Processor Core (TPC)內核庫、固件和驅動程序,以及用于定制內核開發(fā)的TPC SDK和SynapseAI Profiler等開發(fā)工具。
Habana將在目前Gaudi效能基礎上,推出下一代TSMC 7nm 的Gaudi2?,讓AI訓練應用和服務廣大客戶、數據科學家和研究人員。
1該 性價比 由AWS根據AWS內部測試給出。 Habana? Labs不控制或審核第三方數據;您的成本和結果可能會有所不同。
Gaudi?性能基于8個Gaudi?處理器的服務器,HLS—1和0.11版本的SynapseAI軟件套件。
評論