英偉達(dá):GPU供應(yīng)問題涉及封裝而非芯片晶圓
Nvidia 副總裁兼 HPC 驅(qū)動(dòng) DGX 系統(tǒng)總經(jīng)理出面澄清了該公司 GPU 容量問題的具體所在。博伊爾表示,問題并非來(lái)自英偉達(dá)錯(cuò)誤計(jì)算需求或其制造合作伙伴臺(tái)積電的晶圓產(chǎn)量問題。
本文引用地址:http://www.ex-cimer.com/article/202308/449363.htm相反,制造足夠的 GPU 來(lái)滿足消費(fèi)者和專業(yè)工作負(fù)載(由于人工智能的蓬勃發(fā)展)需求的瓶頸在于隨后的芯片封裝步驟。英偉達(dá)的 H 級(jí) GPU 采用臺(tái)積電的 2.5D 晶圓基片芯片 (CoWoS) 封裝技術(shù),這是一種多步驟、高精度的工程步驟,其復(fù)雜性降低了可在一個(gè)芯片中組裝的 GPU 數(shù)量。給定的時(shí)間范圍。這可能會(huì)對(duì)供應(yīng)產(chǎn)生不成比例的影響;所需 GPU 數(shù)量與可用 GPU 數(shù)量之間的差異甚至導(dǎo)致埃隆·馬斯克 (Elon Musk) 表示,事實(shí)證明,它們「比藥品更難獲得」。
Charlie Boyle,英偉達(dá) DGX 副總裁兼總經(jīng)理說(shuō)道:因此,當(dāng)人們使用 GPU 短缺這個(gè)詞時(shí),他們實(shí)際上是在談?wù)撝靼迳夏承┙M件的短缺或積壓,而不是 GPU 本身。這些東西的全球制造有限……但我們預(yù)測(cè)了人們想要什么,以及世界可以建造什么。
在芯片成為可用的 GPU 之前,需要經(jīng)過(guò)從芯片設(shè)計(jì)到制造的多個(gè)步驟。其一,芯片設(shè)計(jì)階段的問題可能會(huì)因設(shè)計(jì)疏忽而造成制造瓶頸,從而降低設(shè)計(jì)的良率(良率是指完全蝕刻的晶圓中可用芯片的百分比)。稀土金屬或其他材料(例如最近受到限制的鎵)的缺乏將影響長(zhǎng)物流鏈中的其他步驟;材料污染、能源中斷和許多其他因素也會(huì)如此,正如我們多年來(lái)已經(jīng)看到的那樣。
但 CoWoS 的瓶頸問題可能比預(yù)想的更嚴(yán)重。臺(tái)積電本身也表示,預(yù)計(jì)需要 1.5 年(以及完成額外晶圓廠和擴(kuò)建現(xiàn)有設(shè)施)才能使封裝工藝積壓恢復(fù)正常。這可能意味著英偉達(dá)將不得不決定什么產(chǎn)品用什么樣的封裝技術(shù)——因?yàn)闆]有足夠的時(shí)間和能力來(lái)封裝所有產(chǎn)品。
供應(yīng)問題可能來(lái)自臺(tái)積電的封裝,但最終,英偉達(dá)通過(guò)其(根據(jù)帕特·基辛格的說(shuō)法)「令人難以置信的執(zhí)行力」在人工智能領(lǐng)域占據(jù)主導(dǎo)地位。就臺(tái)積電而言,它是少數(shù)擁有功能性高性能封裝技術(shù)的廠商之一,而這種技術(shù)是性能擴(kuò)展的絕對(duì)要求。AI 領(lǐng)域肯定需要更多的競(jìng)爭(zhēng),比如 RX 7900 XTX 等 AMD 游戲 GPU 也被認(rèn)為正走向 AI 數(shù)據(jù)中心。
AMD 于 6 月 13 日發(fā)布可用于 ChatGPT 等 AI 模型的 MI300x 芯片,挑戰(zhàn)目前占有 AI 芯片市場(chǎng)超八成份額的英偉達(dá)。
用于生成式 AI 的大型語(yǔ)言模型需要大量的運(yùn)算,因此需要很大的內(nèi)存支持。AMD 于 6 月曾演示了 MI300x 運(yùn)行 400 億參數(shù)的 Falcon 模型,而 OpenAI 的 GPT-3 模型有 1750 億個(gè)參數(shù)。
AMD 公司的這款 MI300x 芯片及其 CDNA 架構(gòu)專為大型語(yǔ)言模型和其他先進(jìn)的 AI 模型而設(shè),可用于 192GB 內(nèi)存,也就是說(shuō)能用于更大規(guī)模的人工智能模型,相比之下,英偉達(dá)的 H100 芯片只能支持 120GB 內(nèi)存。
除此以外,蘇姿豐還介紹了使用配置 MI300x 芯片的 AMD Infinity 架構(gòu)平臺(tái),用于生成式 AI 的推理和訓(xùn)練,可在一個(gè)系統(tǒng)中集合八個(gè) MI300x 加速器。而英偉達(dá)和谷歌(http://GOOG.US)也開發(fā)出類似的系統(tǒng),可在一個(gè)盒中集合八個(gè)或以上的 GPU 用于 AI 應(yīng)用。
目前眾多大型科技公司都在布局 AI 和大模型,對(duì)這類芯片的需求殷切,AMD 積極加入這個(gè)市場(chǎng)顯然并非僅僅為了一兩個(gè)季度業(yè)績(jī)好看,而是為了更長(zhǎng)遠(yuǎn)的發(fā)展。
需要注意的是,對(duì)比于其較為成熟的產(chǎn)品,當(dāng)前 AI 應(yīng)用產(chǎn)品的貢獻(xiàn)雖增長(zhǎng)強(qiáng)勁,卻占比較小,尚不足以帶來(lái)壓倒性的推動(dòng),在可預(yù)見的將來(lái)難以帶來(lái)肉眼可見的提升作用,可能要到明年或以后。
而且制造方面也需要競(jìng)爭(zhēng)。英特爾的代工服務(wù) (IFS) 有望為高性能 GPU 游戲帶來(lái)另一位玩家;與此同時(shí),人們還希望三星至少能夠縮小其相對(duì)于臺(tái)積電的制造技術(shù)差距,從而使其芯片具有足夠的吸引力,吸引另一家制造商參與競(jìng)爭(zhēng)。三星在封裝方面的投資數(shù)額巨大,但業(yè)界一致認(rèn)為三星在封裝技術(shù)方面落后于臺(tái)積電。三星電子需要一記 "重拳",才能在封裝領(lǐng)域趕超臺(tái)積電。
臺(tái)積電于 2012 年首次引入 CoWoS 技術(shù),此后不斷升級(jí)其封裝能力。如今,英偉達(dá)、蘋果和 AMD 的旗艦產(chǎn)品都離不開臺(tái)積電及其先進(jìn)封裝技術(shù)的支持。這也解釋了為什么三星電子在 2022 年領(lǐng)先臺(tái)積電一步完成了 3nm 量產(chǎn),但英偉達(dá)和蘋果等巨頭仍然希望使用臺(tái)積電的生產(chǎn)線。
為了超越臺(tái)積電的 CoWoS,三星正在開發(fā)更先進(jìn)的 I-cube 和 X-cube 封裝技術(shù)。此外有消息稱,三星將研究重點(diǎn)放在了 3D 封裝上,將多個(gè)芯片垂直堆疊以提高性能。一位半導(dǎo)體業(yè)內(nèi)人士表示:「很快三星和臺(tái)積電在封裝上就會(huì)發(fā)生正面沖突。」
評(píng)論