黃仁勛業(yè)績(jī)會(huì)萬字實(shí)錄:那么多客戶需求GPU,我們的壓力太大了
5月23日消息,美國(guó)當(dāng)?shù)貢r(shí)間周三,英偉達(dá)公布了該公司截至2024年4月28日的2025財(cái)年第一財(cái)季財(cái)報(bào)。報(bào)告顯示,英偉達(dá)第一財(cái)季營(yíng)收260億美元,同比增長(zhǎng)262%,超過分析師平均預(yù)期的246.5億美元;凈利潤(rùn)148.1億美元,同比上升628%;每股收益為5.98美元,超過分析師平均預(yù)期的5.59美元。由于營(yíng)收和利潤(rùn)均超出市場(chǎng)預(yù)期,英偉達(dá)股價(jià)財(cái)報(bào)后大漲,股價(jià)首次超過1000美元大關(guān)。
本文引用地址:http://www.ex-cimer.com/article/202405/459139.htm財(cái)報(bào)發(fā)布后,英偉達(dá)總裁兼首席執(zhí)行官黃仁勛(Jensen Huang)和執(zhí)行副總裁兼首席財(cái)務(wù)官科莉特·克雷斯(Colette Kress)等高管出席隨后召開的財(cái)報(bào)電話會(huì)議,解讀財(cái)報(bào)要點(diǎn)并回答分析師提問。
黃仁勛財(cái)報(bào)解讀
目前整個(gè)行業(yè)正經(jīng)歷著重大變革。在開始問答環(huán)節(jié)之前,我想談?wù)勥@場(chǎng)變革的重要性。新的工業(yè)革命已經(jīng)開啟。
許多公司和國(guó)家正與英偉達(dá)合作,將價(jià)值數(shù)萬億美元的傳統(tǒng)數(shù)據(jù)中心轉(zhuǎn)型為加速計(jì)算,并致力于建設(shè)新型的數(shù)據(jù)中心,即人工智能工廠(AI Factories),以生產(chǎn)史無前例的商品——人工智能。
人工智能將為幾乎所有行業(yè)帶來翻天覆地的效率提升,幫助企業(yè)在擴(kuò)大收入的同時(shí),提高成本效益和能源效率。云服務(wù)提供商是生成式人工智能的先行者。借助英偉達(dá)的先進(jìn)技術(shù),這些云服務(wù)商加速了工作負(fù)載處理,節(jié)省資金并減少電力消耗。而英偉達(dá)Hopper平臺(tái)所產(chǎn)生的Token,為他們的AI服務(wù)帶來了收入,而英偉達(dá)云實(shí)例則吸引了我們龐大開發(fā)者生態(tài)系統(tǒng)中的租戶。
由于生成式人工智能在Hopper平臺(tái)上的訓(xùn)練和推理需求迅速增長(zhǎng),我們的數(shù)據(jù)中心業(yè)務(wù)也在強(qiáng)勁增長(zhǎng)。訓(xùn)練的規(guī)模持續(xù)擴(kuò)大,因模型學(xué)習(xí)如何處理多模態(tài)內(nèi)容,如文本、語音、圖像、視頻和3D,并學(xué)習(xí)如何進(jìn)行推理和規(guī)劃。
我們的推理工作量正在顯著增加。隨著生成式人工智能的發(fā)展,推理現(xiàn)在涉及在巨大規(guī)模上快速生成Token,這變得極其復(fù)雜。生成式人工智能正在驅(qū)動(dòng)從基礎(chǔ)到全棧的計(jì)算平臺(tái)轉(zhuǎn)型,將徹底改變我們與計(jì)算機(jī)的每一次交互體驗(yàn)。我們正在從今天的信息檢索模型轉(zhuǎn)向一個(gè)生成答案和技能的計(jì)算模型。人工智能將逐漸理解上下文和我們的真實(shí)意圖,并具備更為強(qiáng)大的知識(shí)、推理、規(guī)劃以及執(zhí)行任務(wù)的能力。
我們正在從根本上改革計(jì)算機(jī)的工作方式和功能,從通用CPU轉(zhuǎn)向GPU加速計(jì)算,從指令驅(qū)動(dòng)軟件到理解意圖的模型,從簡(jiǎn)單的信息檢索到執(zhí)行復(fù)雜技能。而在工業(yè)層面上,我們從傳統(tǒng)的軟件生產(chǎn)轉(zhuǎn)變?yōu)門oken生成,即數(shù)字智能的制造。
Token生成將持續(xù)推動(dòng)人工智能工廠的長(zhǎng)期建設(shè)。除了云服務(wù)提供商之外,生成式人工智能還擴(kuò)展到了消費(fèi)者互聯(lián)網(wǎng)公司、各類企業(yè)、主權(quán)人工智能(Sovereign AI)、汽車及醫(yī)療保健領(lǐng)域,從而孕育了多個(gè)價(jià)值數(shù)十億美元的垂直市場(chǎng)。
Blackwell平臺(tái)已全面啟用,為處理萬億參數(shù)級(jí)別的生成式人工智能奠定了堅(jiān)實(shí)基礎(chǔ)。Grace CPU、Blackwell GPU、NVLink、Quantum 和 Spectrum 以及高速互聯(lián)技術(shù)的結(jié)合,并輔以我們豐富的軟件和合作伙伴生態(tài)系統(tǒng),使我們能為客戶提供前所未有的更全面、更完善的人工智能工廠解決方案。
Spectrum-X為我們開辟了一個(gè)全新的市場(chǎng),使我們能將大規(guī)模人工智能引入僅限以太網(wǎng)的數(shù)據(jù)中心。NVIDIA NIM,作為我們的新軟件產(chǎn)品,在我們廣泛的生態(tài)系統(tǒng)合作伙伴網(wǎng)絡(luò)的支持下,可在從云到現(xiàn)場(chǎng)數(shù)據(jù)中心,再到RTX AI個(gè)人電腦的各種環(huán)境中運(yùn)行企業(yè)級(jí)優(yōu)化的生成式人工智能。從Blackwell到Spectrum-X再到NIM,我們已為未來增長(zhǎng)的新浪潮做好了準(zhǔn)備。
以下為分析師問答環(huán)節(jié):
伯恩斯坦分析師斯泰西·拉斯岡(Stacy Rasgon):我想深入了解Blackwell的情況,它目前已經(jīng)全面投產(chǎn),這是否意味著產(chǎn)品已經(jīng)過了樣品階段?如果是這樣,這將如何影響發(fā)貨和交付時(shí)間?當(dāng)Blackwell真正到達(dá)客戶手中時(shí),對(duì)他們來說又意味著什么?
黃仁勛:我們將會(huì)開始發(fā)貨。實(shí)際上,我們已經(jīng)開始了一段時(shí)間的生產(chǎn)。但我們的生產(chǎn)發(fā)貨將從第二季度開始,并在第三季度加速,客戶應(yīng)該可以在第四季度建立起數(shù)據(jù)中心。
拉斯岡:Blackwell今年是否能夠帶來收入?
黃仁勛:是的,今年我們將看到Blackwell帶來大量收入。
瑞銀分析師蒂莫西·阿庫(kù)里(Timothy Arcuri):我想對(duì)比下Blackwell與Hopper在部署方面的差異,特別是考慮到系統(tǒng)特性和對(duì)GB的巨大需求。這次部署與Hopper有何不同?我這樣問是因?yàn)椋覀冎皬奈床捎眠^大規(guī)模的液體冷卻技術(shù),并且在節(jié)點(diǎn)層面及數(shù)據(jù)中心內(nèi)存在一些工程挑戰(zhàn)。這些復(fù)雜性是否會(huì)延長(zhǎng)過渡期?您如何看待這一過程的進(jìn)行?
黃仁勛:是的,Blackwell有多種配置。Blackwell是一個(gè)平臺(tái),不僅僅是一個(gè)GPU。這個(gè)平臺(tái)支持風(fēng)冷、液冷、x86和Grace、InfiniBand、現(xiàn)在還有Spectrum-X和我在GTC上展示的非常大的NVLink領(lǐng)域。因此,對(duì)于一些客戶來說,他們將在已經(jīng)安裝了Hopper的現(xiàn)有數(shù)據(jù)中心基礎(chǔ)上逐步過渡。他們可以輕松地從H100轉(zhuǎn)換到H200再到B100。因此,Blackwell系統(tǒng)在設(shè)計(jì)時(shí)就考慮到了向后兼容性,在電力和機(jī)械方面都進(jìn)行了充分的考慮。
當(dāng)然,運(yùn)行在Hopper上的軟件堆棧在Blackwell上也將表現(xiàn)出色。我們也一直在為整個(gè)生態(tài)系統(tǒng)“注入活水”,讓他們?yōu)橐豪渥龊脺?zhǔn)備。我們已經(jīng)與Blackwell的生態(tài)系統(tǒng)中的公司進(jìn)行了長(zhǎng)時(shí)間的深入討論,包括云服務(wù)提供商、數(shù)據(jù)中心、ODM、系統(tǒng)制造商、我們的供應(yīng)鏈以及冷卻技術(shù)供應(yīng)鏈和數(shù)據(jù)中心供應(yīng)鏈。他們不會(huì)對(duì)Blackwell的到來以及我們希望通過Grace和Blackwell 200提供的能力感到驚訝。
美國(guó)銀行證券分析師維維克·阿雅(Vivek Arya):感謝你回答我的問題,仁勛。我想了解一下,你是如何確保你的產(chǎn)品保持高利用率,并且防止因供應(yīng)緊張、競(jìng)爭(zhēng)或其他因素導(dǎo)致的提前采購(gòu)或囤積行為?您們系統(tǒng)中有哪些機(jī)制可以讓我們放心,保證收益與非常強(qiáng)勁的出貨量增長(zhǎng)保持同步?
黃仁勛:這是一個(gè)非常重要的觀點(diǎn),我會(huì)直接回答你的問題。目前,全球數(shù)據(jù)中心對(duì)GPU的需求達(dá)到了驚人的水平。我們每天都在為趕上這種需求而努力奮斗。原因在于,像ChatGPT和GPT-4這類應(yīng)用正在邁向多模態(tài)處理,Gemini、Anthropic以及所有云服務(wù)提供商(CSP)正在進(jìn)行的工作都在消耗掉市場(chǎng)上所有可用的GPU資源。此外,還有大約15000至20000家涉及多媒體、數(shù)字角色以及各類設(shè)計(jì)工具和生產(chǎn)力應(yīng)用的生成式人工智能初創(chuàng)公司,包括數(shù)字生物學(xué)和自動(dòng)駕駛視頻訓(xùn)練領(lǐng)域的公司,它們都在積極擴(kuò)張,對(duì)GPU資源的需求日益增加。我們實(shí)際上正在與時(shí)間賽跑??蛻魧?duì)我們的壓力巨大,迫切希望我們盡快交付并部署系統(tǒng)。
此外,我們還面臨著來自主權(quán)人工智能的挑戰(zhàn),它們旨在利用國(guó)家的自然資源數(shù)據(jù)訓(xùn)練地區(qū)模型。這些系統(tǒng)的部署同樣承受著巨大的壓力。因此,目前的需求非常高,遠(yuǎn)遠(yuǎn)超過了我們的供應(yīng)能力。
從長(zhǎng)遠(yuǎn)來看,我們正在徹底改革計(jì)算機(jī)的運(yùn)作方式。這是一場(chǎng)重大的平臺(tái)轉(zhuǎn)換,雖然它被比作歷史上的其他平臺(tái)變革,但時(shí)間將證明,這次轉(zhuǎn)變將比以往任何一次都更為深刻。因?yàn)楝F(xiàn)代計(jì)算機(jī)不再僅僅由指令驅(qū)動(dòng),而是轉(zhuǎn)向了理解用戶的意圖。它不僅能理解我們與之交互的方式,還能把握我們的需求和意圖,并具備迭代推理的能力,能夠制定并執(zhí)行解決方案。因此,計(jì)算機(jī)的每一個(gè)方面都在發(fā)生變化,從簡(jiǎn)單的信息檢索轉(zhuǎn)變?yōu)樯膳c上下文相關(guān)的智能答案。這將徹底改變?nèi)虻挠?jì)算架構(gòu),甚至連PC計(jì)算平臺(tái)也將經(jīng)歷一場(chǎng)革命。這一切只是開始,未來我們將在實(shí)驗(yàn)室中繼續(xù)探索,并與全球的初創(chuàng)公司、大型企業(yè)和開發(fā)者合作,共同推動(dòng)這場(chǎng)變革,其影響將是非凡的。
摩根士丹利分析師約瑟夫·摩爾(Joseph Moore):我理解你剛才所說的需求有多么強(qiáng)勁。你們的H200和Blackwell都有著巨大的需求。那么,在遷移到Hopper和H100產(chǎn)品時(shí),你預(yù)計(jì)會(huì)有怎樣的市場(chǎng)反應(yīng)?人們是否會(huì)等待這些新產(chǎn)品上市,期待它們的出色表現(xiàn)?或者你認(rèn)為H100本身的需求就足夠維持增長(zhǎng)?
黃仁勛:我們注意到這個(gè)季度對(duì)Hopper的需求正在持續(xù)增長(zhǎng)。我們預(yù)計(jì),隨著我們現(xiàn)在過渡到H200和Blackwell,供不應(yīng)求的情況可能會(huì)持續(xù)一段時(shí)間。每個(gè)人都渴望盡快上線他們的基礎(chǔ)設(shè)施。因?yàn)檫@樣他們可以盡快節(jié)省金錢并賺錢。
高盛分析師托西亞·哈里(Toshiya Hari):我想問一下競(jìng)爭(zhēng)。我知道你們的許多云客戶已經(jīng)宣布新的或更新現(xiàn)有的內(nèi)部程序,與你們的合作同步進(jìn)行。在中長(zhǎng)期,你們?cè)诙啻蟪潭壬蠈⑺麄円暈楦?jìng)爭(zhēng)對(duì)手?在你看來,他們主要是解決內(nèi)部工作量,還是他們的作用可能更廣泛?
黃仁勛:我們與眾不同的幾個(gè)方面體現(xiàn)在以下幾點(diǎn)。首先,英偉達(dá)的加速計(jì)算架構(gòu)使客戶能夠處理其流程中的每一個(gè)環(huán)節(jié),從未結(jié)構(gòu)化數(shù)據(jù)的處理準(zhǔn)備培訓(xùn),到結(jié)構(gòu)化數(shù)據(jù)處理、類似SQL的數(shù)據(jù)框處理,再到培訓(xùn)和推理。正如我之前提到的,推理已經(jīng)發(fā)生了根本性的變革,現(xiàn)在它轉(zhuǎn)變?yōu)樯赡J?。它不僅僅是簡(jiǎn)單地識(shí)別出貓——這本身就相當(dāng)困難——而是需要生成貓的每一個(gè)像素。因此,生成過程是一種全新的處理架構(gòu)。這也是TensorRT LLM非常受歡迎的原因之一。我們利用同樣的芯片,通過我們的架構(gòu)使性能提高了三倍。這充分展示了我們架構(gòu)和軟件的深度和強(qiáng)大。因此,從計(jì)算機(jī)視覺到圖像處理,從計(jì)算機(jī)圖形到各種計(jì)算形式,你都可以使用英偉達(dá)的技術(shù)。
正如世界正面臨的計(jì)算成本和能源通脹,通用計(jì)算已經(jīng)達(dá)到了瓶頸,而加速計(jì)算確實(shí)是向前發(fā)展的可持續(xù)方式。加速計(jì)算是如何節(jié)省計(jì)算成本,如何節(jié)約能源的關(guān)鍵。因此,我們平臺(tái)的多功能性為客戶的數(shù)據(jù)中心帶來了最低的總體擁有成本(TCO)。
其次,我們遍布每一個(gè)云平臺(tái)。因此,對(duì)于尋找開發(fā)平臺(tái)的開發(fā)者來說,選擇英偉達(dá)始終是一個(gè)絕佳的選擇。我們?cè)诒镜?、在云端,無論是任何大小和形狀的計(jì)算機(jī),我們幾乎無處不在。這是我們的第二個(gè)優(yōu)勢(shì)。
第三個(gè)優(yōu)勢(shì)與我們構(gòu)建AI工廠的事實(shí)密切相關(guān)。人們?cè)絹碓秸J(rèn)識(shí)到,AI問題不僅僅是關(guān)于芯片的。當(dāng)然,一切都始于優(yōu)秀的芯片,我們?yōu)槲覀兊腁I工廠制造了大量的芯片,但AI更是一個(gè)系統(tǒng)問題。事實(shí)上,AI現(xiàn)在已經(jīng)是一個(gè)系統(tǒng)問題,不僅僅是一個(gè)大型語言模型,而是多個(gè)大型語言模型組成的復(fù)雜系統(tǒng)共同工作。因此,英偉達(dá)構(gòu)建這種系統(tǒng),使我們能夠優(yōu)化我們所有的芯片以協(xié)同作為一個(gè)系統(tǒng)運(yùn)行,擁有能夠作為一個(gè)系統(tǒng)操作的軟件,并能夠在整個(gè)系統(tǒng)中進(jìn)行優(yōu)化。
從一個(gè)簡(jiǎn)單的數(shù)值角度來看,如果你有一個(gè)價(jià)值50億美元的基礎(chǔ)設(shè)施,當(dāng)你將基礎(chǔ)設(shè)施的性能提高了兩倍(這是我們經(jīng)常做的),它的價(jià)值也增加到了100億美元。所有這些芯片的成本并不足以支付它們。因此,它的價(jià)值是非常巨大的。這就是為什么今天性能至關(guān)重要的原因。在這樣一個(gè)最高性能也意味著最低成本的時(shí)代,因?yàn)榫S持所有這些芯片的基礎(chǔ)設(shè)施成本非常高昂。需要大量資金來建設(shè)和運(yùn)營(yíng)數(shù)據(jù)中心,這還包括了人力、電力、房產(chǎn)等所有相關(guān)成本。因此,最高的性能也確保了最低的總體擁有成本(TCO)。
TD Cowen分析師馬特·拉姆齊(Matt Ramsay):我的整個(gè)職業(yè)生涯都在數(shù)據(jù)中心行業(yè)度過,但我從未見過像英偉達(dá)推出新平臺(tái)的速度這樣快,而且你們的產(chǎn)品在性能上的飛躍尤為顯著:訓(xùn)練性能提升了5倍,推理性能更是提高了30倍,這無疑是令人矚目的成就,但同時(shí)也帶來了一個(gè)有趣的挑戰(zhàn):你們的客戶所花費(fèi)數(shù)十億美元購(gòu)買的前一代產(chǎn)品,與你們的新產(chǎn)品相比,可能在競(jìng)爭(zhēng)力上顯得遜色,且其折舊周期遠(yuǎn)遠(yuǎn)短于預(yù)期。面對(duì)這種情況,談?wù)勀闶侨绾慰吹???dāng)你們遷移到Blackwell等新一代產(chǎn)品時(shí),你們將有龐大的安裝基礎(chǔ),顯然在軟件兼容性上沒有問題,但大量已安裝產(chǎn)品的性能將遠(yuǎn)遠(yuǎn)不及新一代產(chǎn)品。我對(duì)此非常好奇,也期待聽聽你在這個(gè)過程中觀察到的變化。
黃仁勛:非常感謝你的提問,我很高興能夠分享我的觀點(diǎn)。我想強(qiáng)調(diào)三點(diǎn)。
首先,無論是在基礎(chǔ)設(shè)施建設(shè)初期(5%)還是接近完成(95%),你的感受都會(huì)大相徑庭。因?yàn)槟壳爸煌瓿闪?%,你需要盡快建設(shè)。當(dāng)Blackwell產(chǎn)品推出時(shí),將是一個(gè)巨大的飛躍。之后,隨著我們持續(xù)推出新的Blackwell產(chǎn)品,我們正處于每年更新一次的節(jié)奏。我們希望客戶能清楚地看到我們的發(fā)展藍(lán)圖,盡管他們的項(xiàng)目才剛開始,但他們必須持續(xù)推進(jìn)。因此,將會(huì)有大量新的芯片推出,他們需要不斷地構(gòu)建,并通過提升性能來逐步達(dá)到標(biāo)準(zhǔn)。這是明智之舉。他們需要立即盈利并節(jié)約成本,時(shí)間對(duì)他們來說至關(guān)重要。
讓我舉一個(gè)例子來說明時(shí)間的重要性:為什么快速部署數(shù)據(jù)中心和縮短培訓(xùn)時(shí)間如此關(guān)鍵。因?yàn)橄乱患疫_(dá)到技術(shù)新高度的公司將會(huì)宣布一項(xiàng)突破性的人工智能技術(shù),而其后的公司可能只能宣布略有改進(jìn)的產(chǎn)品,提升幅度可能僅為0.3%。因此,問題是,你想成為一個(gè)屢創(chuàng)突破的公司,還是僅稍微領(lǐng)先一點(diǎn)的公司?這就是為什么在所有技術(shù)競(jìng)賽中,競(jìng)爭(zhēng)如此關(guān)鍵。你可以看到多家公司在此領(lǐng)域競(jìng)爭(zhēng),擁有技術(shù)領(lǐng)先地位至關(guān)重要,企業(yè)需要相信這一點(diǎn)并愿意在你的平臺(tái)上進(jìn)行長(zhǎng)期建設(shè),因?yàn)樗麄冎肋@個(gè)平臺(tái)將變得越來越好。因此,領(lǐng)導(dǎo)地位非常重要,培訓(xùn)時(shí)間也極為關(guān)鍵。能夠提前三個(gè)月完成培訓(xùn),就意味著可以提前三個(gè)月開始項(xiàng)目,這一切都至關(guān)重要。
這就是為什么我們現(xiàn)在如此積極地部署Hopper系統(tǒng),因?yàn)橄乱粋€(gè)技術(shù)平臺(tái)即將到來。你提到的第一點(diǎn)評(píng)論非常棒,這正是我們?nèi)绾文軌蚩焖龠M(jìn)步和快速發(fā)展的原因。我們擁有所有必要的技術(shù)堆棧。我們實(shí)際上構(gòu)建了整個(gè)數(shù)據(jù)中心,能夠監(jiān)控、測(cè)量并優(yōu)化一切。我們知道瓶頸在哪里,我們不是在做無的放矢的猜測(cè),我們不僅僅是展示漂亮的幻燈片。我們也確實(shí)希望我們的幻燈片看起來不錯(cuò),但我們提供的是能夠大規(guī)模運(yùn)行的系統(tǒng)。我們知道它們能在大規(guī)模中如何表現(xiàn),因?yàn)槲覀兪窃谶@里構(gòu)建它們的。我們所做的一件近乎奇跡的事情是,我們?cè)谶@里構(gòu)建了整個(gè)AI基礎(chǔ)設(shè)施,然后我們將其解構(gòu)并整合到客戶的數(shù)據(jù)中心,無論他們選擇哪種方式。但我們知道它將如何運(yùn)行,我們知道瓶頸在哪里,我們知道我們需要在哪些地方與他們合作優(yōu)化,我們知道我們需要在哪些方面幫助他們改善基礎(chǔ)設(shè)施以實(shí)現(xiàn)最佳性能。這種對(duì)整個(gè)數(shù)據(jù)中心規(guī)模的深入了解,是我們今天能夠區(qū)別于其他競(jìng)爭(zhēng)對(duì)手的根本原因。我們從零開始構(gòu)建每一個(gè)芯片,我們確切地知道整個(gè)系統(tǒng)是如何處理的。因此,我們非常清楚它將如何表現(xiàn),以及如何在每一代產(chǎn)品中充分發(fā)揮其潛力。
所以我很感激。這就是我想分享的三點(diǎn)。
Evercore ISI分析師馬克·利帕西斯(Mark Lipacis):你曾經(jīng)提過,通用計(jì)算生態(tài)系統(tǒng)往往在每個(gè)計(jì)算時(shí)代占據(jù)主導(dǎo)地位,因?yàn)橥ㄟ^適應(yīng)不同的工作負(fù)載,這些系統(tǒng)能夠在計(jì)算需求下降時(shí)實(shí)現(xiàn)更高的利用率。這似乎是你推動(dòng)建立基于CUDA的通用GPU生態(tài)系統(tǒng),用于加速計(jì)算發(fā)展的動(dòng)機(jī)所在?,F(xiàn)在,考慮到當(dāng)前推動(dòng)解決方案需求的主要工作負(fù)載正由神經(jīng)網(wǎng)絡(luò)訓(xùn)練和推理所驅(qū)動(dòng),從表面上看,這似乎是有限數(shù)量的工作負(fù)載。因此,一些人可能會(huì)認(rèn)為這更適合采用定制化的解決方案。然而,問題的關(guān)鍵在于:通用計(jì)算框架是否正面臨更大的挑戰(zhàn),或者它們是否具備足夠的靈活性和發(fā)展速度,以在這些特定的工作負(fù)載上繼續(xù)發(fā)揮通用框架的歷史優(yōu)勢(shì)?
黃仁勛:英偉達(dá)的加速計(jì)算雖具多功能性,但并不可視為通用計(jì)算平臺(tái)。例如,我們并不擅長(zhǎng)執(zhí)行如電子表格這類典型的通用計(jì)算任務(wù)。操作系統(tǒng)代碼的控制循環(huán)對(duì)于通用計(jì)算而言可能尚可,但對(duì)于加速計(jì)算則可能不盡人意。因此,雖然我稱我們的平臺(tái)為多功能,但這并不意味著它適用于所有場(chǎng)景。我們能夠加速眾多領(lǐng)域的應(yīng)用,這些應(yīng)用雖有深層差異,但更多地體現(xiàn)出共通性:它們均可并行處理,且高度線程化。例如,有5%的代碼可能占據(jù)了運(yùn)行時(shí)間的99%,這正是加速計(jì)算的特性所在。我們平臺(tái)的多功能性及我們的系統(tǒng)整體設(shè)計(jì),使得在過去十年中,無數(shù)初創(chuàng)公司依靠我們的技術(shù)快速成長(zhǎng)。這些公司的架構(gòu)雖脆弱,但在面對(duì)生成式人工智能或融合模型等新興技術(shù)時(shí),我們的系統(tǒng)能夠提供穩(wěn)定支持。尤其是當(dāng)出現(xiàn)需要進(jìn)行持續(xù)對(duì)話和理解上下文的大型語言模型時(shí),Grace的內(nèi)存功能顯得尤為關(guān)鍵。因此,在人工智能的各項(xiàng)進(jìn)展中,我們強(qiáng)調(diào)不僅需要為單一模型設(shè)計(jì)解決方案,更應(yīng)提供能廣泛服務(wù)于整個(gè)領(lǐng)域的系統(tǒng)。我們遵循軟件的基本原則,認(rèn)為軟件將持續(xù)演進(jìn),變得更加完善和強(qiáng)大。我們堅(jiān)信未來幾年內(nèi),這些模型的規(guī)模將擴(kuò)大百萬倍。我們的平臺(tái)多功能性在此過程中發(fā)揮了關(guān)鍵作用,如果過于專一,我們可能只是在制作FPGA或ASIC,但這遠(yuǎn)非完整的計(jì)算解決方案。
Jefferies分析師布萊恩·柯蒂斯(Blayne Curtis):我對(duì)你們?yōu)橹袊?guó)市場(chǎng)特別推出的H20產(chǎn)品很感興趣。鑒于當(dāng)前的供應(yīng)限制,我很好奇你們?nèi)绾纹胶膺@款產(chǎn)品的需求與Hopper其他產(chǎn)品的供應(yīng)。能否詳細(xì)闡述對(duì)下半年的展望,包括對(duì)銷售和毛利率的可能影響?
黃仁勛:關(guān)于你提到的H20以及不同Hopper產(chǎn)品之間的供應(yīng)分配,我可能沒完全聽清你的問題。但我想說,我們尊重每一位客戶,并盡力為他們提供最好的服務(wù)。確實(shí),我們?cè)谥袊?guó)的業(yè)務(wù)相較于過去有所下降,這主要是由于技術(shù)出口限制以及中國(guó)市場(chǎng)競(jìng)爭(zhēng)的加劇所致。但請(qǐng)放心,我們?nèi)詴?huì)盡最大努力為中國(guó)市場(chǎng)的客戶提供最好的服務(wù)。關(guān)于你提到的供應(yīng)問題,我們的評(píng)論也適用于整個(gè)市場(chǎng),特別是H200和Blackwell在年底時(shí)的供應(yīng)情況。確實(shí),這兩款產(chǎn)品的需求非常強(qiáng)勁。
Raymond James分析師斯里尼·帕杰里(Srini Pajjuri): 我想更多了解下你剛才提到的GB 200系統(tǒng)。目前看來,市場(chǎng)對(duì)這些系統(tǒng)有很大的需求。從歷史上看,英偉達(dá)已經(jīng)賣出了大量的HGX和GPU,而系統(tǒng)業(yè)務(wù)則相對(duì)較小。所以我很好奇,為什么現(xiàn)在你預(yù)見對(duì)系統(tǒng)的需求如此強(qiáng)勁?這是否僅是因?yàn)榭傮w擁有成本(TCO)的考量,還是有其他因素,比如架構(gòu)優(yōu)勢(shì)?
黃仁勛:事實(shí)上,我們銷售GB 200的方式與我們解構(gòu)產(chǎn)品的方式相同。我們將所有合理的組件分解并將它們集成到計(jì)算機(jī)制造商中。今年,我們將有100種不同的Blackwell計(jì)算機(jī)系統(tǒng)配置推向市場(chǎng),這是前所未有的。Hopper在其高峰時(shí)期也只有一半的配置選項(xiàng),最初的配置比這少得多。而Blackwell則提供了更多樣化的選擇。因此,您將看到液冷版、風(fēng)冷版、x86版、Grace版等等。我們的伙伴也在提供這些多樣化的系統(tǒng)。沒有什么真正改變的。當(dāng)然,Blackwell平臺(tái)極大地?cái)U(kuò)展了我們的產(chǎn)品陣容。CPU的集成和更緊湊的計(jì)算密度,液冷將為數(shù)據(jù)中心在供電方面節(jié)省大量成本,并提高能源效率。因此,這是一個(gè)更好的解決方案。它更具擴(kuò)展性,這意味著我們?yōu)閿?shù)據(jù)中心提供了更多的組件。在這個(gè)過程中,每個(gè)人都是贏家。數(shù)據(jù)中心將獲得更高性能的網(wǎng)絡(luò),從網(wǎng)絡(luò)交換機(jī)到網(wǎng)絡(luò)。當(dāng)然,我們現(xiàn)在有網(wǎng)卡,我們有以太網(wǎng),這樣我們就可以將NVIDIA AI帶給只知道如何操作以太網(wǎng)的大規(guī)??蛻?,因?yàn)樗麄儞碛羞@樣的生態(tài)系統(tǒng)。因此,Blackwell更具擴(kuò)展性,我們?yōu)榭蛻籼峁┝烁嗟臇|西。這一代的產(chǎn)品更為豐富。
Truist Securities分析師威廉·斯特恩(William Stein):盡管市場(chǎng)上已有性能良好的CPU可供數(shù)據(jù)中心使用,但你們基于Arm架構(gòu)的Grace CPU提供了一些真正的優(yōu)勢(shì),使得這項(xiàng)技術(shù)值得交付給客戶,這些優(yōu)勢(shì)可能與成本效益、功耗有關(guān)?抑或是Grace與Hopper、Grace與Blackwell之間的技術(shù)協(xié)同效應(yīng)有關(guān)?你能否解釋一下,在客戶端是否也可能出現(xiàn)類似的動(dòng)態(tài)?盡管市場(chǎng)上已經(jīng)有很好的解決方案,比如英特爾和AMD都提供了卓越的X86產(chǎn)品,但在新興的人工智能工作負(fù)載方面,英偉達(dá)可能有某些獨(dú)特的優(yōu)勢(shì),這些優(yōu)勢(shì)可能是其他公司難以匹敵的?
黃仁勛:你提到了一些非常好的理由。的確,對(duì)于許多應(yīng)用來說,我們與x86合作伙伴的合作關(guān)系非常出色,我們一起構(gòu)建了很多優(yōu)秀的系統(tǒng)。但是,Grace允許我們做一些當(dāng)前系統(tǒng)配置無法做到的事情。Grace和Hopper之間的內(nèi)存系統(tǒng)是相干的,緊密連接的。把它們看作兩個(gè)獨(dú)立的芯片似乎不太恰當(dāng),因?yàn)樗鼈兏袷且粋€(gè)超級(jí)芯片。兩者之間的連接接口的帶寬是每秒數(shù)TB,這是非常驚人的。Grace使用的是LPDDR內(nèi)存,這是第一個(gè)數(shù)據(jù)中心級(jí)的低功耗內(nèi)存。因此,我們?cè)诿總€(gè)節(jié)點(diǎn)上都節(jié)省了大量電力。此外,由于我們現(xiàn)在可以創(chuàng)建整個(gè)系統(tǒng)的架構(gòu),我們可以創(chuàng)建一個(gè)具有非常龐大NV連接域的系統(tǒng),這對(duì)下一代大語言模型的推理至關(guān)重要。
因此,你看到GB200有一個(gè)72節(jié)點(diǎn)的NVLink域,這就像是將72個(gè)Blackwell連接成一個(gè)巨大的GPU。因此,我們需要Grace和Blackwells緊密結(jié)合來實(shí)現(xiàn)。因此,有架構(gòu)上的原因,有軟件編程的原因,還有系統(tǒng)層面的原因,這些都是我們構(gòu)建它們的必要條件。因此,如果我們看到類似的機(jī)會(huì),我們會(huì)探索它們。正如你在昨天的微軟發(fā)布會(huì)上看到的那樣,微軟首席執(zhí)行官薩提亞·納德拉(Satya Nadella)宣布了下一代PC——Copilot+ PC,它在我們的RTX GPU上運(yùn)行得非常好,這些GPU正在筆記本電腦上出貨。但它也很好地支持了ARM。因此,這為系統(tǒng)創(chuàng)新甚至為PC打開了大門。
Cantor Fitzgerald分析師C.J·繆斯(C.J. Muse):我想這是個(gè)比較長(zhǎng)遠(yuǎn)的問題。我知道Blackwell甚至還沒有推出產(chǎn)品,但很明顯,投資者總是有遠(yuǎn)見的。在GPU和定制ASIC日益激烈的競(jìng)爭(zhēng)中,你如何看待英偉達(dá)在未來十年中的創(chuàng)新步伐?過去十年,英偉達(dá)在CUDA、Varsity、Precision、Grace以及Connectivity等技術(shù)的推出令人印象深刻。未來10年,英偉達(dá)需要解決哪些挑戰(zhàn)?也許更重要的是,你今天愿意與我們分享什么?
黃仁勛:對(duì)于未來,我可以自豪地告訴你們,在Blackwell之后,我們還將推出一款全新的芯片。我們處于每年更新一次的節(jié)奏,因此您可以期待我們將以極快的速度推出新的網(wǎng)絡(luò)技術(shù)。我們最近推出了面向以太網(wǎng)的Spectrum-X,但我們對(duì)以太網(wǎng)的規(guī)劃遠(yuǎn)不止于此,它充滿了充滿激情的潛力。我們有一個(gè)強(qiáng)大的合作伙伴生態(tài)系統(tǒng),例如,戴爾宣布將Spectrum-X推向市場(chǎng)。我們的客戶和合作伙伴將不斷推出基于英偉達(dá)AI工廠架構(gòu)的新產(chǎn)品。對(duì)于那些追求極致性能的公司,我們提供了InfiniBand計(jì)算結(jié)構(gòu),它是一個(gè)經(jīng)過多年發(fā)展變得越來越優(yōu)秀的網(wǎng)絡(luò)解決方案。而作為基礎(chǔ)網(wǎng)絡(luò)的以太網(wǎng),通過Spectrum-X,我們將使其具備更強(qiáng)的計(jì)算能力。
我們?nèi)ν度胗谶@三條路徑的發(fā)展:NVLink計(jì)算結(jié)構(gòu)用于單一計(jì)算域,InfiniBand計(jì)算結(jié)構(gòu),以及以太網(wǎng)網(wǎng)絡(luò)計(jì)算結(jié)構(gòu)。我們將以驚人的速度推進(jìn)這三個(gè)方向的發(fā)展。您很快就會(huì)看到新的交換機(jī)、新的網(wǎng)卡、新功能以及在這些設(shè)備上運(yùn)行的新軟件棧涌現(xiàn)出來。新的CPU、GPU、網(wǎng)絡(luò)網(wǎng)卡、交換機(jī)等一系列芯片即將推出。
而最令人振奮的是,所有這些產(chǎn)品都將支持CUDA,并且都將兼容我們的整個(gè)軟件堆棧。這意味著,如果您今天投資于我們的軟件堆棧,您永遠(yuǎn)不需要擔(dān)心它會(huì)過時(shí)或落后,因?yàn)樗鼘⒉粩噙M(jìn)化,變得更快、更強(qiáng)大。如果您今天選擇采用我們的架構(gòu),那么隨著它逐步進(jìn)入更多的云和數(shù)據(jù)中心,您將能夠無縫地繼續(xù)運(yùn)行您的業(yè)務(wù)。
我認(rèn)為,英偉達(dá)帶來的創(chuàng)新將不斷提升我們的能力,并降低總體擁有成本(TCO)。我們有信心,通過英偉達(dá)的架構(gòu),我們將能夠引領(lǐng)這個(gè)新的計(jì)算時(shí)代,開啟這場(chǎng)新的工業(yè)革命。我們不再只是生產(chǎn)軟件,我們正在大規(guī)模制造人工智能Token。
評(píng)論