世界第一!華為推出全球最快AI訓練集群Atlas 900:算力相當于50萬臺PC
近日,在華為全聯(lián)接2019(HUAWEI CONNECT)大會上,華為副董事長胡厚崑發(fā)布了Atlas 900 AI訓練集群。
本文引用地址:http://www.ex-cimer.com/article/201909/405036.htm華為副董事長胡厚崑表示,這款產(chǎn)品匯聚了華為幾十年的技術沉淀,是當前全球最快的AI訓練集群,由數(shù)千顆昇騰處理器組成。
在衡量AI計算能力的金標準ResNet-50模型訓練中,Atlas 900只用了59.8秒就完成了訓練,這比原來的世界記錄還快了10秒。這是什么概念?相當于短跑冠軍跑完終點,喝完一瓶水才等到第二名。
胡厚崑稱,我們相信Atlas 900的強大算力,可廣泛應用于科學研究和商業(yè)創(chuàng)新。比如天文探索、石油勘探等領域,都需要進行龐大的數(shù)據(jù)計算和處理,原來可能花費好幾個月的工作,現(xiàn)在交給Atlas 900,就是幾秒鐘的事情。
在大型數(shù)據(jù)集上進行訓練的神經(jīng)網(wǎng)絡架構涵蓋從圖像識別、自然語言處理、視頻實時分析和智能推薦系統(tǒng)等各個方面,訓練這些神經(jīng)網(wǎng)絡模型需要大量浮點計算能力。
近年來單個AI處理器算力和訓練方法上均取得了重大進步,但是在單一機器上,AI訓練所需要的時間仍然長得不切實際,因此需要借助大規(guī)模分布式AI集群環(huán)境來提升神經(jīng)網(wǎng)絡訓練系統(tǒng)的浮點計算能力。
此次發(fā)布的Atlas 900 AI訓練集群由數(shù)千顆昇騰910 AI處理器互聯(lián)構成,是當前全球最快的AI訓練集群,代表了當今全球的算力巔峰。其總算力達到256P~1024P FLOPS @FP16,相當于50萬臺PC的計算能力。
據(jù)了解,Atlas 900 AI訓練集群采用業(yè)界單芯片算力最強的昇騰910 AI處理器,每顆昇騰910 AI處理器內(nèi)置32個達芬奇AI Core,單芯片提供比業(yè)界高一倍的算力(256TFLOPS@FP16)。
華為已在華為云上部署了一個Atlas 900 AI訓練集群,集群規(guī)模為1024顆昇騰910 AI處理器。基于當前最典型的ResNet-50 v1.5模型”和“ ImageNet-1k數(shù)據(jù)集”,Atlas 900AI訓練集群只需59.8秒就可完成訓練,排名全球第一。
“ ImageNet-1k數(shù)據(jù)集”包含128萬張圖片,精度為75.9%,在同等精度下,其他兩家業(yè)界主流廠家測試成績分別是70.2s和76.8s,Atlas 900 AI訓練集群比第2名快15%。
據(jù)了解,Atlas 900 AI集群主要為大型數(shù)據(jù)集神經(jīng)網(wǎng)絡訓練提供超強算力,可廣泛應用于科學研究與商業(yè)創(chuàng)新,讓研究人員更快地進行圖像、視頻和語音等AI模型訓練,讓人類更高效地探索宇宙奧秘、預測天氣、勘探石油和加速自動駕駛的商用進程。
Atlas 900 AI集群也可以提供云服務,以云的方式提供充裕的、經(jīng)濟的算力資源,簡單易用、高效率、全流程的AI平臺,為客戶帶來極致體驗的“易獲取、用得起、方便用”的普惠AI算力。
評論