GPU芯片,巨變前夜
曾經(jīng),GPU 在 AI 領(lǐng)域炙手可熱,但步入 2025 年,它迅速遭遇了多重嚴(yán)峻考驗(yàn)。
本文引用地址:http://www.ex-cimer.com/article/202501/466469.htm在過去半個(gè)月的時(shí)間里,GPU 領(lǐng)域遭遇了兩大主要挑戰(zhàn)。首先,美國政府出臺了新的禁令措施,對 GPU 的發(fā)展構(gòu)成了直接限制。其次,ASIC 等定制芯片的迅速崛起,給 GPU 市場帶來了顯著的沖擊與競爭壓力。
接下來,半導(dǎo)體產(chǎn)業(yè)縱橫將深入探討這兩大因素如何具體影響著 GPU 市場。
挑戰(zhàn)一:美國進(jìn)一步收緊 AI 芯片出口
首先來看 GPU 面臨的第一個(gè)挑戰(zhàn)。
1 月 13 日晚,拜登政府正式宣布加碼對 AI 芯片及相關(guān)關(guān)鍵技術(shù)的出口管制,限制中國等競爭對手獲取先進(jìn) GPU 的能力。
根據(jù)已公布的信息,新規(guī)按照受管制程度高低,將世界各國和地區(qū)劃分為三大類別。日本、英國、韓國和荷蘭、加拿大等 18 個(gè)美國親密盟友和合作伙伴得到豁免,可以自由采購先進(jìn) AI 芯片;新加坡、以色列、沙特阿拉伯、印度、巴西和波蘭等 120 多個(gè)國家和地區(qū),將被施加 AI 芯片出口的配額限制;中國、俄羅斯、伊朗和朝鮮等,則被完全禁止獲取高端 AI 芯片和先進(jìn)的封閉權(quán)重模型(Closed-weight models)。
管制新規(guī)進(jìn)一步明確,小批量訂單不受配額影響:如果芯片訂單的總算力未超過大約 1700 個(gè)先進(jìn) GPU,那么就不需要獲取美國的許可,并且不會計(jì)入特定國家或地區(qū)進(jìn)口芯片的限額,以使得來自大學(xué)、醫(yī)療機(jī)構(gòu)和研究組織的 AI 芯片訂單可以繼續(xù)進(jìn)行。
另據(jù)美國商務(wù)部工業(yè)與安全局 (BIS) 官網(wǎng)披露,美國企業(yè)的海外數(shù)據(jù)中心建設(shè)亦將受到限制。新規(guī)要求像亞馬遜、微軟、谷歌這樣的云服務(wù)提供商,必須在美國境內(nèi)部署一半的受管制 AI 芯片;部署在美國親密盟友和合作伙伴之外的受管制芯片規(guī)模,則不得超過 25%;而且,在美國親密盟友和合作伙伴以外的任何單一國家和地區(qū)部署的受管制芯片規(guī)模,不得超過 7%。
美國商務(wù)部長雷蒙多稱:「美國當(dāng)前在 AI 開發(fā)和 AI 芯片設(shè)計(jì)領(lǐng)域處于世界領(lǐng)先地位,維持這種局面至關(guān)重要?!顾€稱,管制新規(guī)無意切斷世界與 AI 創(chuàng)新的聯(lián)系,而是專門限制海外最先進(jìn) AI 技術(shù)的發(fā)展。
這份 AI 出口管制新規(guī)設(shè)置了 120 天的意見征詢期,并且內(nèi)容可以修改,意味著后續(xù)將由特朗普政府最終決定先進(jìn) AI 芯片的出口規(guī)則。
眾所周知,美國已多輪出擊,對中國大陸獲取 GPU 芯片實(shí)施管制。這一做法,一方面拖累了中國大陸 AI 能力的發(fā)展進(jìn)程,另一方面,也悄然改寫著 GPU 的市場格局。
受此影響,GPU 市場呈現(xiàn)兩大變化。
GPU 市場的兩大變化
第一點(diǎn),中國大陸本土 GPU 制造能力增強(qiáng)。
近年來,中國國內(nèi)的許多 GPU 企業(yè)開始嶄露頭角。通過持續(xù)的投入和努力,國產(chǎn) GPU 在性能、功能和應(yīng)用領(lǐng)域等方面都有了提升,逐漸贏得了市場的認(rèn)可和用戶的信任。國產(chǎn) GPU 不僅在傳統(tǒng)圖形處理領(lǐng)域取得了進(jìn)展,也能夠在人工智能、高性能計(jì)算等新興領(lǐng)域展現(xiàn)出一定的競爭力。
主要廠商包括景嘉微、寒武紀(jì)、海光信息、天數(shù)智芯等。
雖然國產(chǎn) GPU 芯片在技術(shù)上取得了顯著進(jìn)步,但與國際巨頭如英偉達(dá)相比,仍存在性能差距。
未來隨著計(jì)算需求的不斷增長和算法的不斷優(yōu)化,國產(chǎn) GPU 芯片需要不斷提升其性能以滿足更廣泛的應(yīng)用場景。通過加大研發(fā)投入,引入更先進(jìn)的制造工藝和設(shè)計(jì)理念,國產(chǎn) GPU 芯片有望在未來實(shí)現(xiàn)技術(shù)突破。
第二點(diǎn),英偉達(dá)等 GPU 行業(yè)龍頭的出貨能力受到拖累。
早在 2022 年 10 月、2023 年 10 月,美國商務(wù)部工業(yè)和安全局(BIS)兩次更新對中國的先進(jìn)半導(dǎo)體和計(jì)算設(shè)備的出口管制,英偉達(dá)中國特供版 GPU 產(chǎn)品 A800、H800 芯片均已受到管制。與此同時(shí),AMD 發(fā)布的性能最強(qiáng)的 MI300X、MI300A、MI250X、MI250 等多款 AI 芯片也不再能出口到中國了。
美國的出口管制政策使得英偉達(dá)無法向中國市場提供最先進(jìn)、性能最強(qiáng)的 GPU 產(chǎn)品,這限制了其在華業(yè)務(wù)的拓展,特別是在人工智能、云計(jì)算等對高性能 GPU 需求旺盛的領(lǐng)域。中國作為全球最大的半導(dǎo)體市場之一,失去了這部分市場份額,對英偉達(dá)的營收增長帶來了一定壓力。
盡管英偉達(dá)之后試圖通過推出一些替代產(chǎn)品來維持在中國市場的份額,如 HGX H20 GPU,但整體出貨能力仍受到較大影響。
同時(shí),這也可能引發(fā)全球 GPU 市場格局的調(diào)整,其他國際競爭對手可能會趁機(jī)搶占英偉達(dá)和 AMD 在中國市場留下的空白,進(jìn)一步加劇全球 GPU 市場的競爭態(tài)勢。
AI 芯片出口管制新規(guī)的發(fā)布也引發(fā)了英偉達(dá)的批評。
英偉達(dá)政府事務(wù)副總裁 Ned Finkle 在 1 月 13 日一篇博文中指出,基于美國的技術(shù),AI 得以在世界各地廣泛應(yīng)用,推動了國內(nèi)外各行各業(yè)的進(jìn)步與發(fā)展。但拜登政府試圖推行的「人工智能擴(kuò)散」(AI Diffusion)規(guī)則,是前所未有和具有誤導(dǎo)性的,這可能會破壞全球創(chuàng)新和經(jīng)濟(jì)增長。
Ned Finkle 批評稱,管制新規(guī)不會緩解任何威脅,只會削弱美國的全球競爭力,動搖那種使美國保持領(lǐng)先的創(chuàng)新能力。
挑戰(zhàn)二:定制芯片 ASIC 的興起,沖擊 GPU
年初,一股 ASIC 熱席卷全球。
ASIC 熱潮興起的原因主要有三點(diǎn):
其一,GPU 已成為 AI 芯片領(lǐng)域競爭的核心焦點(diǎn)。目前,英偉達(dá)所產(chǎn)出的 GPU 主要被各大科技巨頭所壟斷。
第二點(diǎn),GPU 價(jià)格的飆升使得這些科技巨頭在采購芯片時(shí)需要支付更高的成本。
第三點(diǎn),從另一角度來看,即便科技巨頭暫且將成本因素置于次要地位,英偉達(dá)本身的供應(yīng)不足狀況仍使這些科技巨頭憂心不已。
彼時(shí)尋找價(jià)格更為親民、供應(yīng)更具穩(wěn)定性且能滿足自身 AI 運(yùn)算需求的芯片,成為了眾多科技巨頭的當(dāng)務(wù)之急,而 ASIC 芯片的出現(xiàn),恰到好處地契合了這些需求。
ASIC 熱潮突如其來,追根溯源,去年 12 月是關(guān)鍵轉(zhuǎn)折點(diǎn)。彼時(shí),作為 ASIC 領(lǐng)域極為重要的概念股,博通的股價(jià)強(qiáng)勢上揚(yáng),從 180 美元一路飆升至 250 美元,市值一舉突破萬億美元大關(guān)。與之形成鮮明對比的是,英偉達(dá)風(fēng)光不再,股價(jià)一路下行,甚至跌破 130 美元。
Google 公司大名鼎鼎的 TPU(Tensor Processing Unit,張量處理單元),還有前幾年很火的比特幣礦機(jī),英特爾的 Gaudi 2 ASIC 芯片,IBM 的 AIU,AWS 的 Trainium,都屬于 ASIC 芯片。此外,這幾年非?;鸬?nbsp;DPU(Data Processing Unit,數(shù)據(jù)處理單元)和 NPU(Neural Processing Unit,神經(jīng)網(wǎng)絡(luò)處理單元),也是 ASIC 芯片。
倘若一定要知道兩者各自有哪些優(yōu)勢,本文將在這里將 ASIC 與 GPU 做一個(gè)詳細(xì)對比。
ASIC 專為特定 AI 算法定制,在執(zhí)行特定任務(wù)時(shí)性能卓越,像 Google 的 TPU 針對深度學(xué)習(xí)矩陣運(yùn)算優(yōu)化,計(jì)算效率極高。它能效比出色,能降低能耗成本,且大規(guī)模處理數(shù)據(jù)時(shí)吞吐量高、延遲低。大規(guī)模使用時(shí),其單位算力成本遠(yuǎn)低于 GPU,如谷歌的 TPUv5、亞馬遜的 Trainium2 單位算力成本僅為英偉達(dá) H100 的 70% 和 60%。不過,ASIC 靈活性差,功能固定,算法改變就需重新設(shè)計(jì),開發(fā)難度大,軟件生態(tài)單一。
GPU 通用性強(qiáng),能應(yīng)對多種計(jì)算任務(wù),在科學(xué)計(jì)算、游戲渲染等領(lǐng)域廣泛應(yīng)用。其并行計(jì)算能力強(qiáng)大,適合處理復(fù)雜神經(jīng)網(wǎng)絡(luò)模型。而且,它擁有成熟豐富的軟件生態(tài),借助 CUDA 等,開發(fā)者易于上手。然而,GPU 在特定任務(wù)上效率遜于 ASIC,功耗較高,會增加能耗成本。高端 GPU 價(jià)格高昂,如英偉達(dá) H100 售價(jià) 2.5 萬至 3 萬美元,獲取難度大,且存在時(shí)延較高的問題。
GPU,會迎來淘汰嗎?
那么有了 ASIC,會很快就淘汰 GPU 嗎?
筆者認(rèn)為,非也。
綜合多家第三方機(jī)構(gòu)的統(tǒng)計(jì)可見,在 GPU 市場,英偉達(dá)目前占據(jù)了大約 90% 份額,AMD 雖然也在積極發(fā)布 GPU 產(chǎn)品,但因?yàn)樵谲浖鷳B(tài)建設(shè)方面不夠完善,到目前為止僅個(gè)位數(shù)百分比市場份額。
憑借性能、生態(tài)、集成能力等方面的優(yōu)勢,英偉達(dá)的 GPU 仍然會是中短期內(nèi)的 AI 芯片首選。英偉達(dá)的軟硬件網(wǎng)絡(luò)整套方案都很成熟,技術(shù)和資金實(shí)力太強(qiáng),GPU 的存量和出貨量依然很大,市場地位難以撼動。
ASIC 的崛起速度雖然很快,但仍需要一定的時(shí)間走向成熟。AI ASIC 芯片的研發(fā),也具有很高的風(fēng)險(xiǎn)。即使研發(fā)成功,也需要時(shí)間被用戶所接受。
這就意味著,在很長的一段時(shí)間內(nèi),GPU 和 ASIC 都將處于共存狀態(tài)?;诓煌膱鼍?,用戶會選擇最適合自己的芯片。發(fā)展自研 ASIC,更多是有利于廠商們和英偉達(dá)進(jìn)行談判砍價(jià)。
AMD 首席執(zhí)行官蘇姿豐也曾對這一問題發(fā)表過觀點(diǎn),蘇姿豐表示:「目前,GPU 是大語言模型的首選架構(gòu),因?yàn)?GPU 在并行處理方面非常高效,但在可編程性方面有所欠缺。五年多后它還會是首選架構(gòu)嗎? 我認(rèn)為情況會發(fā)生變化?!?/p>
蘇姿豐預(yù)計(jì),五年或七年時(shí)間內(nèi) GPU 還不會失勢,但會出現(xiàn) GPU 以外的新勢力。
如此來看 ASIC 或許會是最優(yōu)選之一。在未來一段時(shí)間內(nèi),ASIC 芯片將處于快速發(fā)展階段,摩根士丹利預(yù)計(jì),AI ASIC 市場規(guī)模將從 2024 年的 120 億美元增長至 2027 年的 300 億美元,年復(fù)合增長率達(dá)到 34%。
當(dāng)然,除了 ASIC 之外,像 FPGA 等其他類型的 AI 芯片也可能嶄露頭角,共同改變未來 AI 芯片的市場格局。GPU 雖然當(dāng)前在 AI 領(lǐng)域占據(jù)重要地位,但隨著技術(shù)的不斷革新,其面臨的挑戰(zhàn)日益嚴(yán)峻,未來的 AI 芯片架構(gòu)領(lǐng)域?qū)⒊錆M更多變數(shù)與可能性。
評論