?GPU市場開始分化,中國迎來更多商機(jī)
最近,關(guān)于 GPU,或與 GPU 相關(guān)的消息不斷,例如,OpenAI 正探索自研 AI 芯片,微軟將在今年 11 月推出自研的 AI 芯片,三星推出 Exynos 2400 處理器,自研的 GPU 再次升級,等等。這些都是市場和廠商尋求更多變化的體現(xiàn)。
本文引用地址:http://www.ex-cimer.com/article/202310/451436.htm在全球半導(dǎo)體行業(yè)整體不景氣的 2023 年,只有 AI 服務(wù)器系統(tǒng)和相關(guān)芯片一枝獨(dú)秀,而 AI 服務(wù)器使用的處理器多數(shù)是 GPU,不幸的是(對于多數(shù) GPU 廠商而言),在這一僅有的優(yōu)秀市場,多數(shù)廠商都只能喝湯,有的甚至連湯都喝不上,唯一大口吃肉的是英偉達(dá)。據(jù) visualcapitalist 統(tǒng)計(jì),在全球現(xiàn)有 1500 億美元的 AI 市場中,英偉達(dá)已經(jīng)占有 80% 以上,AMD 和英特爾遠(yuǎn)遠(yuǎn)落后。更重要的是,這一市場規(guī)模每天都在增長,無論是 GPU 芯片廠商,還是系統(tǒng)和互聯(lián)網(wǎng)大廠,都不想看到英偉達(dá)繼續(xù)擴(kuò)大市場占有率。
除了 AI 應(yīng)用,GPU 在傳統(tǒng)的圖形處理應(yīng)用方面依然發(fā)揮著關(guān)鍵作用,無論是 PC,還是手機(jī),該市場空間依然巨大。在手機(jī)應(yīng)用市場,IP 大廠 Arm 和 Imagination Technologies 占主導(dǎo)地位,高通雖然不是 IP 廠商,但憑借其手機(jī) SoC 的市場霸主地位,使得諸多手機(jī)廠商不僅要購買 Arm 或 Imagination 的 GPU 核,還要被高通卡一刀,在這種情況下,也紛紛另謀 GPU 出路。
綜上,越來越多的 GPU 應(yīng)用大廠(手機(jī)和互聯(lián)網(wǎng)廠商),以及新創(chuàng)芯片設(shè)計(jì)公司都開始自研 GPU,或推出與英偉達(dá) GPU 分庭抗禮的新型 AI 處理器,希望在大規(guī)模應(yīng)用市場獲得更多商業(yè)利益。
AI 服務(wù)器需求可能改變產(chǎn)業(yè)鏈
以 ChatGPT 為代表的 AIGC 火遍全球,使得英偉達(dá) GPU 供不應(yīng)求,與此同時(shí),其它芯片供應(yīng)商的類似產(chǎn)品在軟硬件生態(tài)方面無法在短期內(nèi)滿足 AIGC 系統(tǒng)廠商需求,這使得英偉達(dá)處理器的單價(jià)水漲船高。然而,水滿則溢,過猶不及,各大系統(tǒng)和互聯(lián)網(wǎng)廠商不能長期接受這種狀況,紛紛開啟自研 AI 芯片之旅。
最近,就連 ChatGPT 的創(chuàng)造者 OpenAI 也加入了自研芯片的行列。有消息人士透露,OpenAI 正在探索自研 AI 芯片,并已開始評估一個潛在的收購目標(biāo),該公司首席執(zhí)行官 Sam Altman 表示,收購一家芯片公司可以加快 OpenAI 開發(fā)自己芯片的進(jìn)程。一位熟悉 OpenAI 計(jì)劃的人士透露,該公司已經(jīng)對潛在的收購目標(biāo)進(jìn)行了盡職調(diào)查,不過,目前還不知道究竟是哪家公司。
據(jù)悉,至少從 2022 年開始,OpenAI 就討論了各種新方案,以擺脫對英偉達(dá) GPU 的過度依賴。運(yùn)行 ChatGPT 系統(tǒng)是非常昂貴的,伯恩斯坦公司 (Bernstein) 分析師 Stacy Rasgon 的分析顯示,每次查詢大約花費(fèi) 4 美分,如果 ChatGPT 的搜索量增長到谷歌(Google)搜索量的十分之一,它將需要大約價(jià)值 481 億美元的 GPU,每年需要 160 億美元的芯片來維持系統(tǒng)運(yùn)行。
英偉達(dá)預(yù)計(jì)今年每美元收入可賺取 56.51 美分的利潤,使其成為全球最賺錢的科技公司之一。正如亞馬遜創(chuàng)始人杰夫·貝佐斯曾經(jīng)說過的那樣,云提供商不必將這些利潤交給芯片廠商,而是可以通過花費(fèi)時(shí)間和金錢來控制其成本結(jié)構(gòu)中日益重要的部分而受益。自研芯片就是主要途徑。
與此同時(shí),OpenAI 的大股東微軟也有望于 11 月推出自研的 AI 芯片 Athena,以減少對英偉達(dá) GPU 的依賴,近期,有消息稱,微軟開始下修英偉達(dá) H100 芯片訂單,并放緩拉貨。微軟自研的芯片與英偉達(dá) GPU 類似,專為訓(xùn)練和運(yùn)行大型語言模型的數(shù)據(jù)中心服務(wù)器而設(shè)計(jì)。
據(jù)悉,微軟從 2019 年就開啟了自研 AI 芯片項(xiàng)目,代號就是 Athena。不過,微軟并非要完全取代英偉達(dá)芯片,而是要降低成本,并在多項(xiàng)服務(wù)中加入 AI 功能。
在微軟之前,亞馬遜和 Google 都已經(jīng)推出了自研 AI 芯片。目前,在英偉達(dá)的大客戶當(dāng)中,已經(jīng)有 6 家開始自研芯片,大家都不想過度依賴一家供應(yīng)商,那樣太被動了。
手機(jī)大廠自研 GPU
不止 AI 服務(wù)器應(yīng)用廠商,手機(jī)大廠也想擺脫對 GPU 芯片和 IP 廠商的過度依賴,典型代表就是三星和蘋果。
最近,三星推出了 Exynos 2400 手機(jī)處理器,其中的 Xclipse 940 GPU 采用了 AMD 最新的 RDNA 3 架構(gòu),特色是提升了硬件光線追蹤能力,這種技術(shù)在當(dāng)下的手機(jī)游戲當(dāng)中發(fā)揮著越來越重要的作用,是高性能產(chǎn)品的標(biāo)配。
為了自研 GPU,三星在 2019 年就與 AMD 展開合作,當(dāng)時(shí),雙方簽署了首個協(xié)議,AMD 將其基于 RDNA 架構(gòu)的定制 GPU IP 授權(quán)給三星使用,用于智能手機(jī)和其它移動設(shè)備。從那時(shí)起,三星一直在其 Exynos 系列處理器中使用 AMD Radeon 圖形解決方案。
三星自研手機(jī) GPU,是為了減少對 Arm Mali GPU IP 的依賴。在 Exynos 2100 發(fā)布之前的很多年,三星一直依賴 Mali GPU IP,2022 年初,三星宣布推出全新移動處理器 Exynos 2200,內(nèi)置了基于 AMD RDNA 2 架構(gòu)的 Xclipse 圖形處理單元。不過,這款處理器在推出后的表現(xiàn)并不好,僅搭載于部分 Galaxy S22 系列手機(jī)中,還在性能測試中輸給了高通驍龍 8 Gen1。 之所以如此,主要原因是 Xclipse 的設(shè)計(jì)存在缺陷,且優(yōu)化不足。
在 Exynos 2200 之后,三星還有 Exynos 2300,但因?yàn)橐廊淮嬖谠O(shè)計(jì)缺陷,沒有進(jìn)入量產(chǎn)階段。
今年 4 月,三星和 AMD 簽署了一項(xiàng)長期協(xié)議,以加強(qiáng)雙方的戰(zhàn)略合作關(guān)系,雖然前兩款處理器較為失敗,但并沒有打消三星自研手機(jī) GPU 的決心。正是在這樣的背景下,三星于近期推出了 Exynos 2400 手機(jī)處理器。
不過,自研手機(jī) GPU 并不容易,雖然三星沒有畏懼失敗,但前路可能比過去更艱難,特別是與 AMD 合作,難度不小,原因在于,AMD 的 RDNA 架構(gòu)主要針對 PC 端,現(xiàn)在要用于移動端,功耗問題很難解決,對設(shè)計(jì)、架構(gòu)、優(yōu)化等工作提出了更高要求,需要雙方深度合作,進(jìn)行優(yōu)化。而這樣的工作似乎沒有成功的先例,當(dāng)年英特爾做手機(jī)芯片,遇到的問題與此非常類似。
為了加快優(yōu)化進(jìn)程,三星電子不斷加大投入力度。2022 年 4 月,三星電子副總裁金泰賢奔赴美國的三星奧斯汀研究中心高階運(yùn)算實(shí)驗(yàn)室,擔(dān)任 GPU 開發(fā)團(tuán)隊(duì)負(fù)責(zé)人。2022 年底,三星電子系統(tǒng) LSI 部門與 MX 部門一起成立了 AP 解決方案開發(fā)團(tuán)隊(duì),以優(yōu)化 AP 并進(jìn)行下一代 AP 研究。此外,三星還通過從 AMD 和 Arm 招募關(guān)鍵崗位開發(fā)人員,建立了一個內(nèi)部 AP 優(yōu)化團(tuán)隊(duì),并不斷增加研發(fā)人員。進(jìn)入 2023 年以來,三星美國子公司持續(xù)招募 GPU 開發(fā)人員,一定要與 AMD 合作,攻下手機(jī) GPU 這道難關(guān)。
與三星相比,蘋果在自研手機(jī) GPU 方面投入得更早,也是一波三折。
早些年,蘋果一直購買 Imagination 的 PowerVR GPU IP,后來,蘋果打算停止采購該公司的 IP,想自研 GPU,其目的是進(jìn)一步控制產(chǎn)品核心技術(shù),降低成本,以確保智能手機(jī)的高額利潤,同時(shí),為未來創(chuàng)新做準(zhǔn)備,特別是在 VR、AR 應(yīng)用領(lǐng)域占據(jù)有利位置。
為了自研 GPU,蘋果從 Imagination 公司招募了很多工程師,不過,在經(jīng)過兩年左右的研發(fā)努力后,宣告失敗,蘋果不得不繼續(xù)與 Imagination 合作,通過購買其 IP,來設(shè)計(jì)自家的 A 系列手機(jī)處理器 GPU 模塊。
本文所說的自研 GPU,有兩個層面的意思:一是完全自研,就像蘋果當(dāng)年打算停止與 Imagination 合作,從最底層、最基礎(chǔ)的 IP 開始研發(fā),這是最徹底的,也是最難的;二是目前蘋果和三星采用的自研方式,也就是從合作伙伴那里購買 GPU IP,將其內(nèi)置于自研的手機(jī) SoC 當(dāng)中,這種相對容易,效率也高,但自研的含金量與高通這樣的公司相比,就低了一頭。
以蘋果最新推出的手機(jī)處理器 A17 Pro 為例,GPU 是其一大特色,核心數(shù)量從 A16 的 5 個增加到 6 個,還進(jìn)行了全新的架構(gòu)設(shè)計(jì),峰值性能提升了 20%,引入網(wǎng)格著色 (Mesh Shading),首次支持實(shí)時(shí)硬件級光線追蹤,這就追上了高通、聯(lián)發(fā)科的腳步。
通過 3DMarkWildlife 跑分來比較 A17 Pro 和高通的驍龍 8Gen2 的 GPU 性能,結(jié)果顯示,A17 Pro 的跑分為 11860,驍龍 8Gen2 為 13500,兩者的跑分差距約為 15% 左右,A17Pro 在 GPU 性能上稍遜一籌。原因在于,高通自研的 Adreno GPU 經(jīng)過多年的技術(shù)積累和應(yīng)用打磨,已經(jīng)非常完善和成熟了,三星和蘋果要想在 GPU 方面與高通競爭,還需要時(shí)間和積累。
總體來看,自研 GPU 的手機(jī)廠商還不能擺脫對傳統(tǒng)供應(yīng)鏈的依賴,完全自主還需要時(shí)間。
創(chuàng)業(yè)公司挑戰(zhàn) GPU
以上分別介紹了 AI 服務(wù)器 GPU 和手機(jī) GPU 相關(guān)廠商的自研情況,所涉及的公司都是傳統(tǒng)大廠,具有很強(qiáng)的市場影響力,這為它們開創(chuàng) GPU 新路提供了基礎(chǔ)保障,即使不成功,也不會傷筋動骨。然而,對于近些年為搶奪 AI 服務(wù)器 GPU 市場蛋糕而開發(fā)新型處理器的創(chuàng)業(yè)公司來說,情況就不太樂觀了,很多公司已經(jīng)難以為繼,主要原因就是研發(fā)的處理器產(chǎn)品難以滿足客戶的生態(tài)系統(tǒng)要求,很難賣出去。
最近,以英偉達(dá)為主要競爭對手的英國 IC 設(shè)計(jì)公司 Graphcore 給英國公司注冊處提交了一份聲明,內(nèi)容顯示,該公司正在與潛在投資者談判,但尚未達(dá)成協(xié)議。聲明還表示,該公司去年稅前虧損同比增加 11%,達(dá)到 2.046 億美元。該公司還表示,2022 年已經(jīng)關(guān)閉了其在挪威、日本、韓國的辦公室,員工數(shù)量從 2021 年的 631 人降至去年的 494 人,同時(shí),該公司 2022 年?duì)I收減少了 46%。
Graphcore 成立于 2016 年,曾經(jīng)是最被看好的英國初創(chuàng)公司之一。該公司的 IPU 產(chǎn)品(對標(biāo)英偉達(dá)的 GPU)曾被用于微軟 Azure 平臺。
中國 GPU 有更多機(jī)會
近幾年,出于本土產(chǎn)業(yè)鏈安全,以及商業(yè)利益考慮,中國本土 GPU 廠商也在發(fā)力,且涌現(xiàn)出了幾家比較有特色的廠商。
由于以英偉達(dá)為代表的國際 GPU 龍頭企業(yè)已經(jīng)牢牢掌控了市場,中國本土廠商在產(chǎn)品開發(fā)過程中,要應(yīng)對各種困難和挑戰(zhàn),如專利和生態(tài)系統(tǒng)適配。不過,就像龍芯經(jīng)過多年潛心研究,將 MIPS 吃透,進(jìn)而開發(fā)出屬于自己的指令集和芯片一樣,只要具備坐十年冷板凳的決心和毅力,開發(fā)出自主可控的 GPU,是值得期待的。
不久前,龍芯中科在調(diào)研中表示,自研的 GPU IP 核在公司量產(chǎn)橋片以及新款芯片中已經(jīng)進(jìn)行驗(yàn)證,集成龍芯自研 GPGPU 的第一款 SoC 預(yù)計(jì) 2024 上半年流片,支持圖形加速、科學(xué)計(jì)算和 AI 計(jì)算。在此基礎(chǔ)上,2024 下半年將完成兼顧顯卡和算力加速功能的專用芯片流片。
景嘉微是中國老牌 GPU 企業(yè),率先研制出了自主 GPU 并已實(shí)現(xiàn)大規(guī)模工程應(yīng)用,以 JM5、JM7、JM9 系列等 GPU 為代表,正在從商用向民用市場拓展。除了景嘉微,海光的 DCU 系列以 GPGPU 架構(gòu)為基礎(chǔ),兼容 ROCm 和 CUDA 生態(tài)系統(tǒng),可應(yīng)用于大數(shù)據(jù)處理和 AI 等領(lǐng)域。
新生力量方面,壁仞科技、天數(shù)智芯、芯動科技、摩爾線程、沐曦集成電路等受到越來越多的關(guān)注。
在云端 GPGPU 方面,天數(shù)智芯是在最近幾年異軍突起的本土企業(yè),2021 年,該公司推出了 7nm 制程全自研云端訓(xùn)練 GPGPU「天垓 100」,并于 2022 年發(fā)布了 7nm 云端推理 GPGPU「智鎧 100」,能夠?yàn)樵贫?AI 訓(xùn)練和 HPC 通用計(jì)算提供高算力和高能效比。
其它幾家企業(yè)也在近兩三年內(nèi)推出了用于數(shù)據(jù)中心和 AI 的 GPU,如沐曦集成電路的 MXC 系列,壁仞科技的 BR100,摩爾線程的 MTT S2000。
與國際 AI 服務(wù)器芯片廠商相比,中國本土 GPU 廠商具有更好的成長和發(fā)展空間,首先,中國市場空間巨大,有廣闊的施展空間;其次,原本需要面對的來自英偉達(dá)、AMD 等國際大廠的競爭,被美國政府政策屏蔽掉了很大一部分;再有,中國本土系統(tǒng)和互聯(lián)網(wǎng)大廠沒有微軟、亞馬遜和谷歌那樣迫切的自研 GPU 需求。在經(jīng)過資本熱潮消退,市場優(yōu)勝劣汰之后,能推出有「干貨」的產(chǎn)品、保持健康現(xiàn)金流的企業(yè),會有不錯的發(fā)展空間。
評論