英偉達發布Blackwell芯片,再次證明統治力
隨著人工智能革命席卷而來,抓住生成式AI機會的英偉達全面出擊,為大小挑戰者設下新標桿。3月19日,英偉達在2024年GTC大會上發布Hopper架構芯片的繼任者 —— 全新Blackwell架構芯片平臺,包括AWS、微軟和谷歌在內的公司計劃將其用于生成人工智能和其他現代計算任務。
本文引用地址:http://www.ex-cimer.com/article/202403/456644.htmGPU的形態已徹底改變
新GPU架構“Blackwell”得名于美國數學家David Harold Blackwell,與英偉達Grace CPU、新一代網絡芯片等產品一起,面向生成式AI共同組成完整解決方案。黃仁勛稱Blackwell不只是芯片,而是一個全新的平臺。這意味著英偉達從芯片走向平臺的轉變。
基于該架構的GPU芯片B200采用臺積電4NP制造工藝,密度方面應該不會有明顯的提升,而之前的H100基本上已經是一個完整的掩模版,芯片尺寸為814mm2,而理論最大值為858mm2。為此B200使用了兩個全尺寸掩模版制造的芯片,每個對應四個HBM3E堆棧,每個堆棧的接口容量為24GB、帶寬為1TB/s。相比之下,每個H100芯片對應六個HBM3接口,意味著B200每個芯片可以減少內存控制器所需要的芯片面積,從而將更多的晶體管用于計算單元。
B200并不是傳統意義上的單一GPU,相反它由兩個緊密耦合的芯片組成,通過10TB/s NV-HBI(高帶寬接口)進行連接,以確保它們能夠作為單個完全一致的芯片正常運行。B200總晶體管數量達到2080億個、內存帶寬達到8TB/s、擁有20 petaflops的AI性能,英偉達稱其可實現在十萬億級參數模型上的AI訓練和實時LLM(大語言模型)推理。
GPU的形態已徹底改變。需要更大的GPU,如果不能更大,就把更多GPU組合在一起,變成更大的虛擬GPU。Blackwell新架構硬件產品線都圍繞這一句話展開,通過芯片與芯片間的連接技術,一步步構建出大型AI超算集群。
兩個B200 GPU與Grace CPU結合就成為GB200超級芯片,通過900GB/s的超低功耗NVLink芯片間互連技術連接在一起,將能夠使大模型推理工作負載的性能提升30倍,同時提高效率。相比于H100,它可以將成本和能源消耗降至1/25,而在參數為1750億的GPT-3 LLM基準測試中,GB200的性能達到了H100的7倍,而訓練速度則達到了H100的4倍。GB200將于今年晚些時候在NVIDIA DGX Cloud上以及通過AWS、谷歌云和Oracle云基礎設施實例提供。
在多卡互聯方面,英偉達的NVLink和NVSwitch技術是其護城河。NVLINK是一種點對點的高速互連技術,可以將多個GPU直接連接起來,第五代NVLink在多達576個GPU之間可提供1.8TB/s的每GPU雙向通信吞吐量;同時NVLink引入了統一內存的概念,支持連接的GPU之間的內存池,這對于需要大型數據集的任務來說是一個至關重要的功能。而NVSwitch是一種高速交換機技術,可以將多個GPU和CPU直接連接起來,形成一個高性能計算系統。
“新一代計算單元”GB200 NVL72由此誕生,GB200 NVL72是一個全機架解決方案,有18個1U服務器,每臺服務器里帶有兩個GB200,合計共有36個Grace CPU和72個B200,并且全部采用液冷MGX封裝。黃仁勛在介紹此臺機器時說道:“此時此刻,地球上也許只有三臺百億億次浮點運算(exaflop)機器。而這是一個單一機架中的1個百億億次浮點運算AI系統?!?/p>
值得注意的是,為了獲得最高的AI性能,基于GB200的系統可以與同期發布的Quantum-X800 InfiniBand和Spectrum-X800以太網平臺連接,可提供速度高達800Gb/s的高級網絡,配合散熱系統組成新一代DGX SuperPod集群。DGX GB200 SuperPod采用新型高效液冷機架規模架構,標準配置可在FP4精度下提供11.5 exaflops算力和240TB高速內存,并可通過額外的機架進行擴展。
此外,Blackwell支持的GPU包含RAS專用引擎,實現可靠性、可用性和服務性;還增加了芯片級功能,利用基于AI的預防性維護進行診斷和預測可靠性問題。這可以最大限度地延長系統正常運行時間,并提高大部署規模AI的彈性,使其能連續運行數周甚至數月,并降低運營成本。
“這樣我們可以大量地節省能源、網絡帶寬量和時間?!秉S仁勛表示,“未來將是可生成的,這就是為什么這是一個全新的行業。我們的計算方式有本質差異,所以英偉達為生成式AI時代打造了一款全新處理器?!?/strong>
進軍機器人領域
在GTC上,黃仁勛展示了多個由GR00T驅動的人形機器人如何完成各種任務,包括來自Agility Robotics、Apptronik、傅利葉智能(Fourier Intelligence)和宇樹科技(Unitree Robotics)的機器人產品。GR00T驅動的機器人將能夠理解自然語言,并通過觀察人類行為來模仿動作。
英偉達過去針對機器人市場的Isaac機器人平臺也得到重大更新,發布了一款基于Thor芯片的新型人形機器人計算機Jetson Thor。據介紹,Jetson Thor是一個全新的計算平臺,能夠執行復雜的任務并安全、自然地與人和機器交互,具有針對性能、功耗和尺寸優化的模塊化架構。
該SoC包括一個帶有transformer engine的下一代GPU,其采用英偉達Blackwell架構,可提供每秒800萬億次8位浮點運算AI性能,以運行GR00T等多模態生成式AI模型。憑借集成的功能安全處理器、高性能CPU集群和100GB以太網帶寬,大大簡化了設計和集成工作。
為了幫助機器人更好地感知所處環境,還發布了Isaac Perceptor軟件開發工具包,該工具包具有最先進的多攝像頭視覺里程計、3D重建和占用地圖,以及深度感知功能;以及為了使機械臂更具適應性,宣布推出Isaac Manipulator,一個先進的機械臂感知、路徑規劃和運動學控制庫。
自動駕駛未來可期
根據Frost&Sullivan統計數據顯示,2022年英偉達出貨量占到全球高算力自動駕駛芯片市場份額為82.5%。按照黃仁勛的規劃,未來汽車業務將與數據中心、游戲并列成為英偉達的三大支柱業務。
最新發布的集中式車載計算平臺DRIVE Thor也將搭載全新Blackwell架構。多家頭部電動汽車制造商在GTC上展示了其搭載DRIVE Thor的下一代AI車型,既包括比亞迪、廣汽埃安、小鵬、理想汽車和極氪等眾多中國車企,也包括了文遠知行等自動駕駛平臺公司。
推理微服務成為AI入口
隨著人工智能技術加速在各領域的滲透和變革,除了硬件產品,英偉達還與大量與企業合作,推進AI落地。為此,英偉達推出了推理微服務,即NVIDIA NIM,能夠將開發者與數億個GPU連接起來,以部署各種定制AI。這是一種全新的軟件打包和交付方式,該服務有望支撐英偉達未來在AI服務上的營收增長。
其具體模式為:英偉達提供預訓練好的AI模型并開放API(應用程序接口),再由行業客戶開發應用,以簡化企業自己開發生成式AI應用的成本。
這些微服務支持行業標準API、易于連接,可在英偉達龐大的CUDA安裝基礎上工作,針對新GPU進行重新優化,并不斷掃描安全漏洞和威脅。黃仁勛也在現場示范了英偉達內部藉NIM所打造的“芯片設計聊天機器人”,經過數據訓練和模型微調后,聊天機器人即可給出符合芯片設計領域的答案,甚至能同步生成所需的程序代碼。
企業IT行業正坐在一座「金礦」上,擁有多年來創建的所有這些令人驚嘆的工具和數據,如果能把它們變成AI助手,就能提供更多可能。
· 在量子計算領域,英偉達宣布推出云量子計算機模擬微服務,幫助研究人員和開發人員在化學、生物學、材料科學等科學領域的量子計算研究,該服務基于開源CUDA-Q量子計算平臺,支持用戶在云端構建并測試新的量子算法和應用,包括支持量子-經典混合算法編程的模擬器和工具等。與其他云服務不同,英偉達目前還沒有量子計算機,但未來它將提供第三方量子計算機的訪問。
· 在醫藥領域,英偉達宣布旗下包括Parabricks、MONAI、NeMo?、Riva、Metropolis,現已通CUDA-X微服務提供訪問,以加速藥物研發、醫學影像、基因組學分析等醫療工作流程。
游戲領域大顯身手
游戲起家的英偉達,自然也沒有忘記人工智能技術在游戲領域大顯身手,這次GTC上重點展示的是它的數字人技術。英偉達數字人平臺包括三項主要技術:NVIDIA ACE、NVIDIA NeMo和RTX光線追蹤技術,分別通過AI驅動游戲角色語言、語音、動畫和圖形。
其中,NVIDIA ACE可幫助開發者通過Audio2Face驅動的面部動畫以及由Riva自動語音識別(ASR)和文本轉語音(TTS)驅動的語音交流,允許模型在云端和PC上運行,以確保用戶獲得最佳體驗。全球游戲發行商正評估NVIDIA ACE如何改善游戲體驗。
NVIDIA NeMo則可幫助開發者提供企業級生成式AI模型,包括精確數據管理、模型個性化定制、檢索增強生成和加速性能等。最后,包含RTX全局光照(RTXGI)和DLSS 3.5等渲染技術的集合,可在游戲和應用中實現實時光線路徑追蹤。
總結
自從2022年底OpenAI宣布AI聊天機器人ChatGPT以來,全球掀起了一輪巨大的AI熱潮,推動了GPU芯片大廠英偉達數個財務季度的收入爆發式增長。更加確切地說是,英偉達在最近幾個財季的收入暴增,其實主要依賴數據中心業務作為增長引擎。與此同時,英偉達在資本市場上還受到投資者們狂熱地追捧,它的股價持續攀升。目前,英偉達已經擁有2.26萬億美元的市值,是全球市值排名第三的上市企業,僅次于微軟的3.16萬億美元和蘋果的2.76萬億美元。
預計每年全球對數據中心設備投入的費用將共計2500億美元,英偉達產品在其中占據的份額將超過其他芯片生產商。英偉達正致力提供AI模型和其他軟件,然后根據客戶的算力和運行的芯片數量向客戶收費,軟件業務未來有望帶來數十億美元營收,成為高利潤率業務。
Blackwell產品線就由Nvidia AI Enterprise支持。英偉達的軟件和生態系統有助于加速AI的應用,同時進一步構建“護城河”,構建了難以跨越的競爭壁壘。憑借領先GPU/DPU/CPU、硬件/軟件平臺和強大的生態系統,英偉達有望繼續從人工智能、高性能計算、游戲和自動駕駛汽車的重大長期趨勢中受益。
評論