<meter id="pryje"><nav id="pryje"><delect id="pryje"></delect></nav></meter>

<label id="pryje"></label>

新聞中心

EEPW首頁(yè) > 編輯觀點(diǎn) > 英偉達(dá)最強(qiáng)AI芯片H200性能翻倍 AMD出師未捷身先死？

英偉達(dá)最強(qiáng)AI芯片H200性能翻倍 AMD出師未捷身先死？

作者：陳玲麗時(shí)間：2023-11-28 來(lái)源：電子產(chǎn)品世界

加入技術(shù)交流群
- 掃碼加入
  和技術(shù)大咖面對(duì)面交流
  海量資料庫(kù)查詢

收藏

11月13日，英偉達(dá)推出新一代AI旗艦芯片 H200，是在目前市場(chǎng)上最強(qiáng)AI 芯片H100的基礎(chǔ)上進(jìn)行了大升級(jí)。H200擁有141GB的內(nèi)存幾乎是H100最高80GB內(nèi)存的2倍，4.8TB/s的帶寬也顯著高于H100的3.35TB/s。

本文引用地址：http://www.ex-cimer.com/article/202311/453385.htm

在推理速度上H200幾乎達(dá)到了H100的兩倍，英偉達(dá)表示根據(jù)使用Meta的70B大模型Llama 2進(jìn)行測(cè)試，H200的輸出速度幾乎是H100的兩倍。根據(jù)官方發(fā)布的圖片，H200在大模型Llama 2、GPT-3.5的輸出速度上分別是H100的1.9倍和1.6倍，在高性能計(jì)算HPC方面的速度更是達(dá)到了雙核x86 CPU的110倍。

因?yàn)槭褂没谂cH100相同的Hopper架構(gòu)，H200將具有H100的一切功能，例如可以用來(lái)加速基于Transformer架構(gòu)搭建的深度學(xué)習(xí)模型的Transformer Engine功能。這意味著那些已經(jīng)在使用H100進(jìn)行訓(xùn)練的AI公司無(wú)需更改他們的服務(wù)器系統(tǒng)或軟件即可適應(yīng)H200。

卷內(nèi)存？H200最大升級(jí)HBM3

H200最大的變化就是內(nèi)存 —— 首次搭載“世界上最快的內(nèi)存”HBM3e，在性能上得到了直接提升，速度更快、容量更大，使其更適用于大型語(yǔ)言模型。

什么是HBM？

由于處理器與存儲(chǔ)器的工藝、封裝、需求的不同，過(guò)去20年中二者之間的性能差距越來(lái)越大，硬件的峰值計(jì)算能力增加了90000倍，但是內(nèi)存/硬件互連帶寬卻只是提高了30倍。當(dāng)存儲(chǔ)的性能跟不上處理器時(shí)，對(duì)指令和數(shù)據(jù)搬運(yùn)（寫(xiě)入和讀出）的時(shí)間是處理器運(yùn)算所消耗時(shí)間的幾十倍乃至幾百倍，內(nèi)存帶寬就是處理器可以從內(nèi)存讀取數(shù)據(jù)或?qū)?shù)據(jù)存儲(chǔ)到內(nèi)存的速率?？梢韵胂笠幌?，數(shù)據(jù)傳輸就像處在一個(gè)巨大的漏斗之中，不管處理器灌進(jìn)去多少，存儲(chǔ)器都只能“細(xì)水長(zhǎng)流”。

GDDR采用傳統(tǒng)方法是將標(biāo)準(zhǔn)PCB和測(cè)試的DRAMs與SoC連接在一起，以較窄的通道提供更高的數(shù)據(jù)速率，進(jìn)而實(shí)現(xiàn)必要的吞吐量，具有一定的帶寬和良好的能耗效率。而隨著AI等新需求的出現(xiàn)以及風(fēng)靡，為了讓數(shù)據(jù)傳輸更快，對(duì)帶寬的要求更高了，GDDR開(kāi)始不夠用了。按照GDDR現(xiàn)有的模式很難有突破性的帶寬進(jìn)展，于是，HBM出現(xiàn)了。

HBM其實(shí)就是將DDR芯片堆疊在一起后和GPU封裝在一起，實(shí)現(xiàn)大容量、高位寬的DDR組合陣列。超高的帶寬讓HBM成為了高性能GPU的核心組件，讓更大的模型、更多的參數(shù)留在離核心計(jì)算更近的地方，從而減少內(nèi)存和存儲(chǔ)解決方案帶來(lái)的延遲。自從去年ChatGPT出現(xiàn)以來(lái)，HBM作為AI服務(wù)器的“標(biāo)配”，更是開(kāi)始狠刷存在感。

3D堆疊技術(shù)的出現(xiàn)才讓HBM能夠?qū)崿F(xiàn)這樣的布局：將DRAM裸片像摩天大樓一樣垂直堆疊，并通過(guò)硅通孔（ThroughSiliconVia，簡(jiǎn)稱“TSV”）技術(shù)將“每層樓”連接在一起，貫通所有芯片層的柱狀通道傳輸信號(hào)、指令、電流，以增加吞吐量并克服單一封裝內(nèi)帶寬的限制。采用3D堆疊技術(shù)之后，其直接結(jié)果就是接口變得更寬，其下方互聯(lián)的觸點(diǎn)數(shù)量遠(yuǎn)遠(yuǎn)多于DDR內(nèi)存連接到CPU的線路數(shù)量。

不過(guò)，這也意味著更高的成本，在沒(méi)有考慮封測(cè)成本的情況下，HBM的成本是GDDR的三倍左右。HBM發(fā)展制約因素正是高成本，一些高級(jí)計(jì)算引擎上的HBM內(nèi)存成本往往比芯片本身還要高，因此自然面臨很大的阻力。

“半代”升級(jí)？算力提升并不明顯

在同架構(gòu)之下，H200的浮點(diǎn)運(yùn)算速率基本上和H100相同，核心GPU運(yùn)算數(shù)據(jù)與H100完全一致?？陀^來(lái)說(shuō)，H200相較H100在算力方面提升并不明顯，可能只算“半代”升級(jí)。然而，在大模型推理表現(xiàn)上，H200提升卻極其明顯。

英偉達(dá)H200、H100和A100的性能規(guī)格對(duì)比（來(lái)源：anandtech）

H200重點(diǎn)放在提升推理方面的能力，再次證明英偉達(dá)的刀法依舊精準(zhǔn)。隨著AI技術(shù)的不斷發(fā)展和應(yīng)用，AI芯片市場(chǎng)的競(jìng)爭(zhēng)越來(lái)越激烈，H200芯片的發(fā)布，進(jìn)一步鞏固了英偉達(dá)在AI芯片市場(chǎng)的領(lǐng)先地位。英偉達(dá)只有通過(guò)不斷推出更高性能的AI芯片，增強(qiáng)市場(chǎng)競(jìng)爭(zhēng)力，才能夠在市場(chǎng)競(jìng)爭(zhēng)中持續(xù)保持領(lǐng)先地位。那么，為什么英偉達(dá)突然選擇卷起內(nèi)存了呢？

AMD緊隨其后：搶先推出Instinct MI300X

隨著ChatGPT的橫空出世，全球掀起了AI大模型熱潮，以GPU為代表的算力芯片供不應(yīng)求。在全球GPU主要廠商中，英偉達(dá)市場(chǎng)占有率高達(dá)86%，而僅次于英偉達(dá)的就是AMD。AMD雖然在GPU市場(chǎng)名列第二，但其產(chǎn)品主要應(yīng)用于圖形處理、消費(fèi)級(jí)產(chǎn)品等傳統(tǒng)GPU應(yīng)用場(chǎng)景，在AI和高性能計(jì)算領(lǐng)域始終沒(méi)有什么存在感。

大模型時(shí)代，AMD等來(lái)了一個(gè)翻身機(jī)遇。在今年6月，AMD專門(mén)針對(duì)AI大模型訓(xùn)練需求，在英偉達(dá)之前搶先推出了大殺器 —— Instinct MI300。相比前代產(chǎn)品，MI300X擁有高達(dá)192GB的HBM3內(nèi)存以及5.2TB/s帶寬。MI300X提供的HBM密度是英偉達(dá)H100的2.4倍，HBM帶寬是H100的1.6倍，意味著在MI300X上可以訓(xùn)練比H100更大的模型，單張加速卡可運(yùn)行一個(gè)400億參數(shù)的模型。

其實(shí)早在2016年，AMD就推出Radeon Instinct系列產(chǎn)品線，旨在加速深度學(xué)習(xí)、神經(jīng)網(wǎng)絡(luò)和高性能計(jì)算等方面應(yīng)用。然而AMD顯然不夠“上心”，在之后的4年間時(shí)間里，Radeon Instinct系列雖然不斷更新，但卻始終與AMD的消費(fèi)級(jí)顯卡Radeon公用基礎(chǔ)架構(gòu)，在計(jì)算方面缺乏針對(duì)性和高效率，難以滿足AI訓(xùn)練的需求。

直到2020年，AMD將AI芯片產(chǎn)品線更名為“Instinct”，并首次拋棄了以往的消費(fèi)級(jí)顯卡架構(gòu)，采用了專門(mén)設(shè)計(jì)的CNDA計(jì)算架構(gòu)。在此之后，AMD連續(xù)更新了三代產(chǎn)品MI100、MI200以及最新發(fā)布的MI300。憑借全新的技術(shù)路線，以及高性價(jià)比的市場(chǎng)策略，AMD才開(kāi)始在AI訓(xùn)練市場(chǎng)中有人問(wèn)津。

目前AMD正在搶抓英偉達(dá)缺席后的空白，試圖憑借空前強(qiáng)大的芯片新品和難得的產(chǎn)業(yè)機(jī)遇，攻入英偉達(dá)的腹地。為了保證不被超越，這也許就是H200突然卷起內(nèi)存的原因吧。此前，AMD表示MI300正在今年第三季度向客戶提供樣品，產(chǎn)量將在第四季增加。如果AMD真的能夠在第四季度提高產(chǎn)量并成功推出MI300芯片，那么它有望迎來(lái)強(qiáng)勁的需求。因?yàn)橛ミ_(dá)H100芯片的供不應(yīng)求，大公司需要“第二供應(yīng)商”的戰(zhàn)略將為AMD提供機(jī)遇，AMD可以有效填補(bǔ)供需缺口，憑借可得性贏得業(yè)務(wù)。

甲骨文公司就計(jì)劃采用雙源采購(gòu)策略，即同時(shí)從英偉達(dá)和AMD兩家公司購(gòu)買(mǎi)AI芯片。在明年，甲骨文公司將優(yōu)先考慮購(gòu)買(mǎi)AMD的產(chǎn)品，這是因?yàn)橛ミ_(dá)因市場(chǎng)需求巨大而未能達(dá)到甲骨文公司預(yù)定的采購(gòu)目標(biāo)。在此前的發(fā)布會(huì)上蘇姿豐表現(xiàn)得十分有信心：“我們認(rèn)為，數(shù)據(jù)中心人工智能加速器將以超過(guò)50%的復(fù)合年增長(zhǎng)率，從今年的300億美元左右增長(zhǎng)到2027年的1500億美元以上?！盡I300被寄予厚望，將成為該公司“有史以來(lái)最快達(dá)成10億美元銷(xiāo)售額的產(chǎn)品”。

從MI300的性能指標(biāo)而言，AMD已經(jīng)幾乎具備了與英偉達(dá)叫板的能力，直到H200橫空出世。在未來(lái)，AMD想要在如火如荼的AI技術(shù)市場(chǎng)中搶得一席之地，面前的壓力仍毋庸多言。至今AMD尚未公布MI300的官方定價(jià)，市場(chǎng)預(yù)計(jì)為了增加與英偉達(dá)的競(jìng)爭(zhēng)籌碼，AMD MI300或許不得不延續(xù)其在傳統(tǒng)GPU市場(chǎng)的性價(jià)比路線。

潛在的壟斷消失？CUDA生態(tài)壁壘很難打破

最關(guān)鍵的問(wèn)題在于英偉達(dá)能否為市場(chǎng)提供足夠的H200，或者它們是否會(huì)像H100一樣在供應(yīng)量上受到限制，并沒(méi)有明確的答案。考慮到目前高性能GPU服務(wù)器仍然緊缺，在AMD發(fā)布更便宜且性能不差的競(jìng)品后，英偉達(dá)的壟斷還能維持多久？

英偉達(dá)在2006年推出的通用并行計(jì)算架構(gòu)CUDA，借助CUDA提供的編程接口和工具集等，開(kāi)發(fā)者可以基于GPU芯片編程、運(yùn)行復(fù)雜的AI算法等等。雖然H100的壟斷地位導(dǎo)致服務(wù)器間兼容性問(wèn)題，但英偉達(dá)在AI領(lǐng)域樹(shù)立的最大優(yōu)勢(shì)還是從語(yǔ)言設(shè)計(jì)到開(kāi)發(fā)者工具這些構(gòu)成的生態(tài)壁壘，周邊工具一旦被用戶所接受，客戶技術(shù)遷移的成本將會(huì)是難以想象的。

即使AMD MI300的官方性能指標(biāo)相比英偉達(dá)H100體現(xiàn)出優(yōu)勢(shì)，后者的生態(tài)壁壘仍舊難以逾越，更別提H200展現(xiàn)出了更強(qiáng)的性能指標(biāo)。這樣的背景下，AMD想要逆風(fēng)翻盤(pán)，還是要著力補(bǔ)上生態(tài)差距。2016年，AMD推出了對(duì)標(biāo)英偉達(dá)CUDA的ROCm架構(gòu)，但由于ROCm平臺(tái)起步晚，其對(duì)于GPU加速庫(kù)的支持沒(méi)有英偉達(dá)CUDA全面：CUDA的應(yīng)用場(chǎng)景基本能夠覆蓋全場(chǎng)景，ROCm更多用于高性能計(jì)算領(lǐng)域，對(duì)AI的覆蓋稍顯不足。

至今，AMD ROCm平臺(tái)的工具鏈已經(jīng)相對(duì)完善，并且能夠兼容英偉達(dá)的CUDA平臺(tái)。此外，為了進(jìn)一步優(yōu)化軟件生態(tài)，AMD還在2023年10月份官宣收購(gòu)了AI軟件企業(yè)Nod.ai。

AMD高性價(jià)比的市場(chǎng)策略將是其在AI領(lǐng)域的另一大優(yōu)勢(shì)。CNBC報(bào)告稱，上一代H100估計(jì)每顆售價(jià)在2.5萬(wàn)美元到4萬(wàn)美元之間，鑒于采用了HBM3e內(nèi)存，H200的售價(jià)可能會(huì)更貴。另一方面從亮相開(kāi)始，H100就迎頭趕上了“百模大戰(zhàn)”的風(fēng)口，成為了被各方力量爭(zhēng)奪的寶貴算力資源，大模型產(chǎn)業(yè)疾速發(fā)展帶來(lái)了巨大的算力缺口：根據(jù)OpenAI數(shù)據(jù)，模型計(jì)算量增長(zhǎng)速度遠(yuǎn)超人工智能硬件算力增長(zhǎng)速度，兩者之間存在萬(wàn)倍差距。對(duì)于長(zhǎng)期在AI領(lǐng)域缺乏存在感的AMD而言，它正迎來(lái)了最好時(shí)機(jī)。

據(jù)了解，英偉達(dá)H200將于2024年第二季度開(kāi)始向全球客戶和云服務(wù)廠商供貨。英偉達(dá)還透露，下一代新架構(gòu)Blackwell B100 GPU也將在2024年推出，性能已經(jīng)“望不到頭”。

英偉達(dá)官網(wǎng)顯示H200將為40多臺(tái)AI超級(jí)計(jì)算機(jī)提供支持。包括CoreWeave、亞馬遜AWS、谷歌云、微軟Azure、甲骨文云等公司將成為首批部署基于H200實(shí)例的云服務(wù)商；同時(shí)，華碩、戴爾科技、惠普、聯(lián)想、Supermicro、緯創(chuàng)資通等系統(tǒng)集成商也會(huì)使用H200更新其現(xiàn)有系統(tǒng)。此外，在新的H200加持之下，GH200超級(jí)芯片也將為全球各地的超級(jí)計(jì)算中心提供總計(jì)約200 Exaflops的AI算力：在SC23大會(huì)上，多家頂級(jí)超算中心紛紛宣布，即將使用GH200系統(tǒng)構(gòu)建自己的超級(jí)計(jì)算機(jī)；德國(guó)尤里希超級(jí)計(jì)算中心將在超算JUPITER中使用GH200超級(jí)芯片。

值得注意的是，如果沒(méi)有獲得出口許可證，H200將無(wú)法在中國(guó)市場(chǎng)銷(xiāo)售。原因是H200參數(shù)高于美國(guó)商務(wù)部10月17日公布的性能紅線：多個(gè)數(shù)字處理單元的集成電路（用于數(shù)據(jù)中心）總處理性能為2400-4800，“性能密度”大于1.6且小于5.92。

<a target='_blank'><img src='https://ad.eepw.com.cn/www/delivery/avw.php?zoneid=114&cb=INSERT_RANDOM_NUMBER_HERE&n=a7a83b30' border='0' alt='' /></a>
<a target='_blank'><img src='https://ad.eepw.com.cn/www/delivery/avw.php?zoneid=115&cb=INSERT_RANDOM_NUMBER_HERE&n=a3d98779' border='0' alt='' /></a>
<a target='_blank'><img src='https://ad.eepw.com.cn/www/delivery/avw.php?zoneid=116&cb=INSERT_RANDOM_NUMBER_HERE&n=abca108c' border='0' alt='' /></a>
<a target='_blank'><img src='https://ad.eepw.com.cn/www/delivery/avw.php?zoneid=117&cb=INSERT_RANDOM_NUMBER_HERE&n=a1775170' border='0' alt='' /></a>
<a target='_blank'><img src='https://ad.eepw.com.cn/www/delivery/avw.php?zoneid=118&cb=INSERT_RANDOM_NUMBER_HERE&n=a449048b' border='0' alt='' /></a>

關(guān)鍵詞： 英偉達(dá) AI 芯片 H200 AMD

評(píng)論

相關(guān)推薦

加大調(diào)整力度，教育部支持高校布局集成電路、AI 等專業(yè)

智能計(jì)算教育 AI 集成電路 | 2024-07-25

am29lv160db芯片燒寫(xiě)/擦除判斷位d7不夠可靠?!

seasoblue | 2002-05-24

蘋(píng)果表示其AI模型是在谷歌的定制芯片上訓(xùn)練的

智能計(jì)算 AI | 2024-07-30

高效、節(jié)能、高集成，新一代電源管理芯片產(chǎn)品的技術(shù)特征

視頻 EEPW 電源芯片 | 2014-06-12

AI驅(qū)動(dòng)的嵌入式聲音和振動(dòng)識(shí)別

視頻 ADI AI 嵌入式 OtoSense | 2018-10-23

Meta訓(xùn)練Llama 3遭遇頻繁故障

智能計(jì)算 Meta Llama 3 英偉達(dá) H100 顯卡 GPU | 2024-07-29

用MAX610系列AC／DC芯片構(gòu)成的小功率無(wú)變壓器穩(wěn)壓電源

設(shè)計(jì)方案 MAX610 系列芯片構(gòu)成功率變壓器穩(wěn)壓電源 | 2009-07-06

消息稱英偉達(dá) RTX 4070 及以上顯卡因 GDDR6X 顯存缺貨 8 月供應(yīng)緊張

消費(fèi)電子英偉達(dá) GPU | 2024-07-29

AM29LV160D

資源下載 AMD AM29LV160D | 2007-02-28

2021春晚黑科技，火爆全網(wǎng)的\"打工牛\"是什么來(lái)頭？

視頻 AI 機(jī)器人 | 2021-02-26

iPhone 16將不會(huì)預(yù)裝AI功能？計(jì)劃通過(guò)iOS 18.1發(fā)布

iPhone AI iOS | 2024-07-30

基于D類功放專用驅(qū)動(dòng)芯片驅(qū)動(dòng)的高保真純正弦波逆變器

設(shè)計(jì)方案基于功放專用驅(qū)動(dòng) 芯片高保真正弦波逆變器 | 2009-07-06

“破局AI開(kāi)發(fā)，釋放邊緣算力開(kāi)發(fā)者訪談”，干貨滿滿！

視頻 intel AI OpenVINO | 2021-06-10

預(yù)測(cè)：全球通信芯片市場(chǎng)2003年將反彈

hpnet | 2002-05-25

消息稱 OpenAI 公司 2024 年資金缺口達(dá)到 50 億美元

智能計(jì)算 OpenAI ChatGPT AI | 2024-07-25

可編程快速充電管理芯片MAX712/ MAX713電路

設(shè)計(jì)方案可編程快速充電管理芯片 MAX712 MAX713 | 2009-07-06

ep7312芯片原理及應(yīng)用

資源下載 Cirrus Logic 公司 ARM 芯片 EP7312 嵌入式內(nèi)存映射 | 2007-02-16

摩根士丹利：僅 GB200 AI 服務(wù)器業(yè)務(wù)，就為英偉達(dá)創(chuàng)造 2100 億美元年收入

智能計(jì)算 GB200 AI 英偉達(dá) GPU | 2024-07-26

保證航天飛機(jī)起飛 NASA到處尋找8086芯片

hpnet | 2002-05-17

經(jīng)驗(yàn)點(diǎn)滴之二：燒寫(xiě)器PICKIT

jackwang | 2002-06-19

[原創(chuàng)]集成光學(xué)/IC模塊 -- 將系統(tǒng)級(jí)芯片提高到新水平

Gao | 2002-07-01

國(guó)際奧委會(huì)：最大限度發(fā)揮 AI 工具影響力，體育人才選拔方式有望得到革新

智能計(jì)算 AI 奧運(yùn)會(huì) 體育 | 2024-07-26

基于D類功放專用驅(qū)動(dòng)芯片驅(qū)動(dòng)的高保真純正弦波逆變器1

設(shè)計(jì)方案基于功放專用驅(qū)動(dòng) 芯片高保真正弦波逆變器 | 2009-07-06

大嘴業(yè)話：俄烏戰(zhàn)爭(zhēng) 關(guān)“芯”幾何

視頻俄烏戰(zhàn)爭(zhēng) 芯片 | 2022-06-21

HBM4持續(xù)加速：AI時(shí)代競(jìng)爭(zhēng)新焦點(diǎn)

網(wǎng)絡(luò)與存儲(chǔ) HBM AI 內(nèi)存 | 2024-07-25

AM29LV160D datasheet

資源下載 AMD AM29LV160D datasheet | 2007-02-28

KS8999 以太網(wǎng)絡(luò)交換機(jī)芯片

資源下載 KS8999 以太網(wǎng)絡(luò)交換機(jī) 芯片 | 2007-02-28

蘋(píng)果承認(rèn)：AI模型使用谷歌定制芯片訓(xùn)練

智能計(jì)算蘋(píng)果 AI 谷歌定制芯片 | 2024-07-30

先進(jìn)的鋰電池線性充電管理芯片BQ2057充電電路

設(shè)計(jì)方案先進(jìn) 鋰電池線性充電管理芯片 BQ2057 電路 | 2009-07-06

Dallas實(shí)時(shí)時(shí)鐘（RTC)芯片DS1306硬件手冊(cè)

資源下載 MAXIM INTEGRATED PRODUCTS Dallas 實(shí)時(shí)時(shí)鐘（RTC)芯片 DS1306 | 2007-02-09

焦點(diǎn)

推薦視頻

技術(shù)專區(qū)

看屁屁www成人影院,亚洲人妻成人图片,亚洲精品成人午夜在线,日韩在线欧美成人 (function(){ var bp = document.createElement('script'); var curProtocol = window.location.protocol.split(':')[0]; if (curProtocol === 'https') { bp.src = 'https://zz.bdstatic.com/linksubmit/push.js'; } else { bp.src = 'http://push.zhanzhang.baidu.com/push.js'; } var s = document.getElementsByTagName("script")[0]; s.parentNode.insertBefore(bp, s); })();