AI時(shí)代打造“萬(wàn)億俱樂部”新成員 —— 英偉達(dá),能否笑到最后?
5月30日,英偉達(dá)總市值突破萬(wàn)億美元,成為全球首家市值超過萬(wàn)億美元的芯片公司,也是繼蘋果、微軟、谷歌、亞馬遜之后,第五家邁入“萬(wàn)億俱樂部”的美國(guó)科技巨頭。
本文引用地址:http://www.ex-cimer.com/article/202306/447632.htm除了英偉達(dá)外,還有兩家市值超Meta Platforms和Tesla也曾經(jīng)短暫地突破了萬(wàn)億美元的大關(guān),但后來(lái)它們的市值又回落到了千億美元級(jí)別。目前已經(jīng)達(dá)到萬(wàn)億美元市值的公司:
蘋果公司:2.79 萬(wàn)億美元
微軟公司:2.47 萬(wàn)億美元
谷歌母公司Alphabet:1.58 萬(wàn)億美元
亞馬遜公司:1.25 萬(wàn)億美元
英偉達(dá)公司:1 萬(wàn)億美元
人工智能技術(shù)的蓬勃發(fā)展推動(dòng)英偉達(dá)的股價(jià)在不到八個(gè)月的時(shí)間內(nèi)翻了三倍,使得該公司在1999年上市后約24年后達(dá)到了萬(wàn)億美元的市值,而蘋果公司則花了38年才達(dá)到這一里程碑。
“通用芯片”之夢(mèng)
AI時(shí)代誕生新的「摩爾定律」:AI所需算力每100天將翻一倍。算力就像曾經(jīng)的石油,成為新時(shí)代進(jìn)程最稀缺的資源。
英偉達(dá)已成為全球最大的新一代AI產(chǎn)品專用芯片制造商,因?yàn)镃hatGPT的快速爆紅讓全球幾乎每家公司都在把AI融入其運(yùn)營(yíng)。而英偉達(dá)之所以能獨(dú)領(lǐng)風(fēng)騷,一個(gè)關(guān)鍵原因在于其廣受人工智能領(lǐng)域追捧的芯片產(chǎn)品 —— 即A100芯片及更高一代的H100芯片,目前這些高端芯片及相應(yīng)的顯卡已是一卡難求。
有業(yè)內(nèi)人士稱,確有英偉達(dá)急件訂單大量涌入臺(tái)積電,包括英偉達(dá)AI芯片H100、A100、H800、A800,將臺(tái)積電5nm工藝平臺(tái)的產(chǎn)能利用率推高至接近滿負(fù)荷。臺(tái)積電以「超級(jí)急件」生產(chǎn)英偉達(dá),訂單已至年底。
為何只有英偉達(dá)的芯片成為人工智能領(lǐng)域獨(dú)一無(wú)二的玩家?向來(lái)在顯卡稱霸的公司為何能在深度學(xué)習(xí)和人工智能領(lǐng)域脫穎而出?
1999年,初露頭角的英偉達(dá)首次推出了GPU這一概念。在此之前,包括英特爾在內(nèi)的CPU廠商都認(rèn)為將圖形工作獨(dú)立到另一附屬處理器上的想法十分雞肋,GPU并沒有得到多少市場(chǎng)空間。
而微軟開發(fā)出了Direct X這一標(biāo)準(zhǔn)化的API圖形接口,大量的圖形功能從CPU里面移植出來(lái),轉(zhuǎn)到GPU之上。此后,微軟又引入統(tǒng)一渲染技術(shù),即讓GPU將圖形繪制的頂點(diǎn)計(jì)算和之后的渲染兩個(gè)步驟進(jìn)行合并。
在微軟統(tǒng)一渲染架構(gòu)之后,英偉達(dá)果斷的把自己從前的GPU架構(gòu)推倒重來(lái):其GPU流處理器被進(jìn)行了細(xì)致的分組,變成一個(gè)個(gè)小型流處理器且能單獨(dú)運(yùn)行,解決了流處理器此前被綁定無(wú)法獨(dú)立運(yùn)行而被迫閑置的問題。
這奠定了英偉達(dá)后來(lái)革命性CUDA架構(gòu)(Compute Unified Device Architecture,通用并行計(jì)算架構(gòu))的出世。由于英偉達(dá)的流處理器是很獨(dú)立且標(biāo)準(zhǔn)的單元,極易控制和調(diào)度,這讓原本只能串行處理的任務(wù)可以被并行處理,這讓編程難度大大降低。
英偉達(dá)又在2017年引入了Tensor Core計(jì)算單元概念,其專門為深度學(xué)習(xí)而設(shè)計(jì),支持更低精度的運(yùn)算從而大幅節(jié)省了模型算力。這一專用的加速單元很大程度上排擠了CUDA處理深度學(xué)習(xí)的空間,但也同時(shí)打了英偉達(dá)競(jìng)爭(zhēng)對(duì)手一個(gè)措手不及,讓AI專用芯片也不再吸引人。
真正讓英偉達(dá)脫穎而出的,還是其將GPU用在了通用計(jì)算上 —— 通過CUDA編程,能夠讓多個(gè)GPU并行運(yùn)算,從而大幅提升計(jì)算性能。讓GPU脫離了圖像處理的單一用途,開始真正具備通用計(jì)算的能力,并逐步被用到了AI的深度學(xué)習(xí)之中。
事實(shí)上,當(dāng)AI一瞬間爆發(fā),行業(yè)內(nèi)的企業(yè)無(wú)奈發(fā)現(xiàn),GPU是簡(jiǎn)單高效運(yùn)行生成式AI模型的最好選擇。一個(gè)本用來(lái)玩游戲的GPU不太可能切換去跑AI程序,目前只有英偉達(dá)的GPU能夠做到運(yùn)行AI模型。
財(cái)報(bào)證實(shí),GPU巨頭英偉達(dá)已占據(jù)AI芯片供應(yīng)商中的領(lǐng)先地位,在其財(cái)報(bào)電話會(huì)上稱,眾多云公司競(jìng)相部署AI芯片,令其業(yè)績(jī)的“大幅增長(zhǎng)”來(lái)自于數(shù)據(jù)中心業(yè)務(wù),個(gè)人電腦GPU需求穩(wěn)固。
除了強(qiáng)勁的財(cái)務(wù)表現(xiàn)外,英偉達(dá)還在不斷拓展其在AI領(lǐng)域的影響力和合作關(guān)系,面對(duì)外界龐大的AI芯片需求,英偉達(dá)已經(jīng)不滿足于芯片設(shè)計(jì)者的角色,而是將觸角伸向基礎(chǔ)服務(wù)設(shè)施領(lǐng)域。
在GTC大會(huì)上,英偉達(dá)又推出了一項(xiàng)新的AI超級(jí)計(jì)算服務(wù) —— DGX Cloud 云服務(wù),可以讓企業(yè)快速訪問為生成式人工智能和其他開創(chuàng)性應(yīng)用訓(xùn)練高級(jí)模型所需的基礎(chǔ)設(shè)施和軟件。簡(jiǎn)單理解,就是通過這個(gè)云平臺(tái),用戶可以直接調(diào)用英偉達(dá)的超級(jí)計(jì)算機(jī)DGX的AI算力,而不是去“堆”A100、H100。
目前,英偉達(dá)與微軟 Azure、谷歌 OCP、Oracle OCI等其他云廠商一起托管DGX Cloud基礎(chǔ)設(shè)施。黃仁勛還表示,未來(lái)中國(guó)也可以采用這項(xiàng)服務(wù),中國(guó)創(chuàng)業(yè)公司可以期待阿里、百度、騰訊提供的底層算力服務(wù)。
同時(shí),英偉達(dá)還發(fā)布了“NVIDIA AI Foundations”,為需要定制大型語(yǔ)言模型和生成AI的客戶提供幫助。這些客戶可以通過英偉達(dá)的DGX Cloud AI超級(jí)計(jì)算機(jī)云服務(wù)直接訓(xùn)練和訪問大型模型產(chǎn)品,無(wú)需自己配置超級(jí)計(jì)算機(jī)服務(wù)。
除了計(jì)算中心,英偉達(dá)也將觸角伸到了芯片代工制造領(lǐng)域:與臺(tái)積電、ASML和新思科技等芯片代工制造企業(yè)合作,推出一款新的計(jì)算光刻應(yīng)用,可大幅降低芯片代工企業(yè)在光刻工藝上的芯片消耗時(shí)間和能力,為生產(chǎn)2nm芯片和未來(lái)更先進(jìn)的芯片做好技術(shù)儲(chǔ)備。
以臺(tái)積電為例,使用500臺(tái)裝有H100芯片的DGX即可替代需要4萬(wàn)個(gè)用驅(qū)動(dòng)計(jì)算光刻的CPU服務(wù)器,可以將工廠的性能從35兆瓦直接降至5兆瓦,預(yù)計(jì)臺(tái)積電將于6月開始準(zhǔn)備生產(chǎn)這種技術(shù)。
誰(shuí)能打敗英偉達(dá)?
AMD最新AI芯片Instinct MI3000預(yù)計(jì)將于今年推出;最近市場(chǎng)還傳出微軟與AMD合作開發(fā)新款A(yù)I芯片,加快推出相關(guān)產(chǎn)品,為自身及市場(chǎng)提供英偉達(dá)GPU之外的另一種底層硬件選擇。
英特爾披露了旨在為AI技術(shù)提供動(dòng)力的產(chǎn)品路線圖細(xì)節(jié),下一代GPU“Falcon Shores”芯片預(yù)計(jì)2025年推出;Meta公司也披露其正在構(gòu)建首款專門用于運(yùn)行AI模型的定制芯片MTIA(Meta Training and Inference Accelerator)芯片,使用名為RISC-V的開源芯片架構(gòu),預(yù)計(jì)于2025年問世。
但與英偉達(dá)相比,AMD和英特爾的競(jìng)爭(zhēng)實(shí)力要弱得多。例如,英偉達(dá)的數(shù)據(jù)中心業(yè)務(wù)在第一季度增長(zhǎng)了14%,AMD數(shù)據(jù)中心業(yè)務(wù)增長(zhǎng)持平,英特爾的AI與數(shù)據(jù)中心業(yè)務(wù)卻下降了39%。
據(jù)The Information報(bào)道,微軟正在秘密研發(fā)自己的AI芯片,代號(hào)雅典娜(Athena)。據(jù)悉,這些芯片是為訓(xùn)練大語(yǔ)言模型等軟件而設(shè)計(jì),首個(gè)目標(biāo)是為OpenAI提供算力引擎。微軟希望這款芯片的性能比其斥資數(shù)億美元從其他供應(yīng)商側(cè)購(gòu)置的芯片性能更優(yōu),這樣就可以為價(jià)值高昂的人工智能工作節(jié)省成本。至于推出時(shí)間,尚未有明確說(shuō)法。
更別提AI芯片領(lǐng)域的競(jìng)爭(zhēng)本就愈發(fā)激烈,不少初創(chuàng)公司正在專門為AI開發(fā)新型芯片,高通和蘋果等專注于移動(dòng)設(shè)備的公司也在不斷推動(dòng)這項(xiàng)技術(shù),谷歌和亞馬遜都在設(shè)計(jì)自己的人工智能芯片。
制造一個(gè)好的AI芯片,至少需要數(shù)年的時(shí)間,而英偉達(dá)目前已經(jīng)取得了巨大的領(lǐng)先優(yōu)勢(shì)。但是值得注意的是,前文已經(jīng)說(shuō)了,AI所需算力每100天將翻一倍。如果不在當(dāng)前的軟硬件基礎(chǔ)上做出更多創(chuàng)新,人類目前的算力發(fā)展不可能達(dá)到如此恐怖的需求增長(zhǎng)。顯然,英偉達(dá)雖然強(qiáng)大,但并沒有能力覆蓋整個(gè)市場(chǎng)。
據(jù)報(bào)道,微軟等客戶對(duì)英偉達(dá)A100/H100芯片訂單需求追到了2024年,微軟為了給必應(yīng)聊天機(jī)器人與Office365留下足夠資源,內(nèi)部已陷入AI服務(wù)器短缺,甚至必須對(duì)GPU采取“配額供給”機(jī)制。
這很像2021-2022年席卷全球的缺芯潮:成千上萬(wàn)的AI初創(chuàng)公司、甚至是大型云服務(wù)商,將如當(dāng)年因缺少關(guān)鍵芯片而停產(chǎn)的車企,或因缺少GPU面臨相似困境。
此外,英偉達(dá)還要應(yīng)對(duì)全球芯片供應(yīng)短缺、地緣政治風(fēng)險(xiǎn)、監(jiān)管審查等問題。例如,英偉達(dá)去年宣布以400億美元收購(gòu)ARM,但該交易遭到了多國(guó)反壟斷機(jī)構(gòu)和ARM客戶的質(zhì)疑和反對(duì)。
在資源緊缺的極度焦慮之下,必將開始尋求其他品牌的替代品。疊加全球供應(yīng)鏈安全的考量,AI芯片市場(chǎng)從過去的英偉達(dá)一家獨(dú)大,或慢慢轉(zhuǎn)變?yōu)槿盒鄹顡?jù)。
總體看來(lái),在這場(chǎng)競(jìng)賽中亞馬遜似乎占據(jù)了先機(jī),已擁有兩款A(yù)I專用芯片 —— 訓(xùn)練芯片Trainium和推理芯片Inferentia;谷歌則擁有第四代TPU(張量處理單元)。相比之下,微軟等還在很大程度上依賴于英偉達(dá)、AMD和英特爾等芯片制造商的現(xiàn)成或定制硬件。
結(jié)語(yǔ)
從長(zhǎng)遠(yuǎn)來(lái)看,未來(lái)大模型的研發(fā)和部署是必然趨勢(shì),每個(gè)大模型訓(xùn)練和部署的背后,都需要成千上萬(wàn)個(gè)GPU芯片支持。隨著谷歌、微軟、亞馬遜等科技巨頭開始設(shè)計(jì)自己的定制芯片,競(jìng)爭(zhēng)也在加劇,并有望像GPU打敗CPU一樣,改寫黃仁勛在AI芯片領(lǐng)域的絕對(duì)主導(dǎo)地位。
算力是運(yùn)行模型的基礎(chǔ),場(chǎng)景是運(yùn)用模型的環(huán)境。To C的大模型是大廠的主戰(zhàn)場(chǎng),但它們?cè)赥o B上卻無(wú)法做到贏家通吃。要將“ChatGPT”送入千行百業(yè),在通用大模型之外,低算力消耗的專用“小”模型也將誕生更多機(jī)會(huì)。
目前,AI場(chǎng)景并未固定,而是不斷擴(kuò)展和演進(jìn)。未來(lái),隨著新的應(yīng)用場(chǎng)景涌現(xiàn),也許會(huì)催生新的細(xì)分需求,從而影響芯片產(chǎn)品的形態(tài)。因此,對(duì)于國(guó)內(nèi)創(chuàng)業(yè)公司而言,通過觸達(dá)更多的實(shí)際使用場(chǎng)景來(lái)夯實(shí)自己在芯片領(lǐng)域的算力優(yōu)勢(shì),打造其他競(jìng)爭(zhēng)對(duì)手難以逾越的技術(shù)障礙,將是新的成長(zhǎng)機(jī)會(huì)。
評(píng)論