NVIDIA黃仁勛:GPU加速運算成為延展摩爾定律主要模式
在此次GTC Taiwan中,NVIDIA執(zhí)行長黃仁勛期未來10年內(nèi),每年對于運算需求的規(guī)模將成長100倍,同時預(yù)期在摩爾定律逐漸衰減之下,全球前50大超級電腦的GPU運算量將在未來5年內(nèi)成長15倍率,同時以GPU加速運算的方式將成為延展摩爾定律的主要模式。
本文引用地址:http://www.ex-cimer.com/article/201805/380824.htm黃仁勛在GTC Taiwan再次強調(diào)過去NVIDIA創(chuàng)造CUDA運算模式所帶動加速效益,同時說明未來借由GPU加速運算的模式將會持續(xù)擴大,預(yù)期在2028年全球運算需求將等同1000萬組Volta架構(gòu)GPU所推動效能,若以傳統(tǒng)通過多組CPU堆疊構(gòu)成超級電腦等級運算能力,將會占據(jù)大規(guī)??臻g及高額電力花費,若以GPU替換的話,則可節(jié)省更多空間與電力損耗,同時帶來更高加速效果。
就目前超級電腦底經(jīng)成為現(xiàn)代科學(xué)發(fā)展重要工具,分別在分子建構(gòu)、量子化學(xué)、量子力學(xué)、天氣預(yù)報、氣象研究、能源探索、物理模擬、數(shù)據(jù)分析與人工智能技術(shù)發(fā)展扮演重要角色,并且提供百萬億次或百億等級運算效能。而就OpenAI統(tǒng)計顯示,未來5年內(nèi)的人工智能運算模型將成長30萬倍,相比摩爾定律預(yù)期成長速度快3萬倍,借由GPU加速能力將可讓數(shù)據(jù)、演算程式復(fù)雜度大幅提升,借此解決過往人力無法解決運算需求。
去年宣布推出整合Tensor Core設(shè)計,并且整合32GB HBM2內(nèi)存的Volta架構(gòu)GPU,借此對應(yīng)125 Tensor TFLOPS運算效能,分別對應(yīng)7.5 FP64 TFLOPS或15 FP32 TFLOPS預(yù)算效能,相比過往采用GPU加速運算模式可提升10倍效率,同時進一步讓占用空間與電力損耗大幅降低。
而為了突破硬體架構(gòu)限制,NVIDIA在今年的GTC 2018更進一步宣布推出NVSwitch,讓16組Volta GPU能共用高達512GB HBM2內(nèi)存 (32GB x 16),總計可對應(yīng)81920組CUDA核心、2000 Tensor Core TFLOPS運算效能,構(gòu)成全球最高效能的GPU,并且不受傳統(tǒng)CPU架構(gòu)限制GPU存取內(nèi)存容量影響。借由NVSwitch的設(shè)計,NVIDIA更宣布推出全球最大 (并且可游玩游戲)的DGX-2 GPU,對應(yīng)借由高達2PFLOPS運算效能,并且特殊多孔纖維設(shè)計讓運作功率高達10000W的機盒維持低溫運作,相比半年前正式推出的DGX-1運算效能提升10倍。
相比過往必須借由300組雙核心CPU構(gòu)成、必須消耗180000W功率能耗運作的服務(wù)器,通過單組DGX-2 GPU即可對應(yīng)相同運算效能,但整替價格僅需1/8與1/18功率能耗,同時相比過往Alex 練Alex Krizhevsky通過兩張NVIDIA GTX 580 GPU,花費6天時間完成訓(xùn)練AlexNet,借由DGX-2 GPU僅需18分鐘即可完成。同時DGX-2 GPU也分別打破每秒分析1075個影像,成為最快單晶片運算速度,以及每秒可在每個節(jié)點處理15500個影像,并且可在14分鐘內(nèi)完成擴充,推論延遲時間僅在1.1毫秒,每秒更可推論演算6250個影像。
通過DGX-2的運算能力與NVSwitch串接技術(shù),NVIDIA也宣布推出以DGX-2建構(gòu)的服務(wù)器平臺設(shè)計HGX-2,并且與廣達、云達、富士康、英業(yè)達、緯創(chuàng)、緯穎、華碩、技嘉、華擎、泰安、宏碁等臺灣在地廠商合作,同時強調(diào)全球約有90%服務(wù)器源自臺灣,而NVIDIA也與更多臺灣在地廠商持續(xù)合作。
借由GPU運算能力,配合與Adobe等軟體廠商合作的影像處理技術(shù),將可實現(xiàn)即時修改影像中不必要物件,或是重建影像中缺乏內(nèi)容,甚至能進一步呈現(xiàn)“美顏”效果。同時通過與Google提出的kubernetes容器集群管理系統(tǒng)合作,將可讓更多人工智能系統(tǒng)能因應(yīng)不同運算需求動態(tài)調(diào)整運算效能,借此讓GPU架速運算效能有更彈性配置效益,將與阿里巴巴、百度、eBay、HIKVISION、IBM、小米等廠商合作。
在與臺灣合作部分,NVIDIA表示目前富士康將借由人工智能技術(shù)檢測制作生產(chǎn)效率,中國醫(yī)藥大學(xué)附設(shè)醫(yī)院通過人工智能技術(shù)協(xié)助醫(yī)師分析預(yù)測癌癥腫瘤轉(zhuǎn)移情況,臺灣大學(xué)則通過人工智能區(qū)分鼻咽癌危及器官,而臺灣人工智能實驗室也通過人工智能技術(shù)協(xié)助臺南市政府監(jiān)測橋梁結(jié)構(gòu)預(yù)防臺風(fēng)損害,桃園市政府則計劃在2020年前讓30%固定行駛路線的公車能配置Level 3自動駕駛功能。
如同先前在GTC 2018期間以“PLASTER”作為主題演講結(jié)尾,黃仁勛也強調(diào)分別借由可編程 (Programmability)、低延遲 (Latency)、高精準度 (Accuracy)、規(guī)模化 (Size)、數(shù)據(jù)吞吐量 (Throughput)、能耗效率 (Energy Efficiency),進而推動學(xué)習(xí)訓(xùn)練效率 (Rate of Learning),讓人工智能能以更快速度成長。
評論