英偉達(dá)Blackwell芯片存在“發(fā)熱問(wèn)題”,引發(fā)客戶擔(dān)憂
英偉達(dá)Blackwell芯片曝出發(fā)熱問(wèn)題,需要重新設(shè)計(jì)機(jī)架并可能導(dǎo)致客戶延誤。
本文引用地址:http://www.ex-cimer.com/article/202411/464710.htm據(jù)The Information周日?qǐng)?bào)道,英偉達(dá)下一代Blackwell處理器安裝在高容量服務(wù)器機(jī)架時(shí)面臨著過(guò)熱的挑戰(zhàn)。發(fā)熱問(wèn)題導(dǎo)致了設(shè)計(jì)變更和延遲,并引起了Google、Meta 和Microsoft等客戶的擔(dān)憂,他們擔(dān)心自己是否能按時(shí)部署Blackwell服務(wù)器。
此前,由于芯片出現(xiàn)設(shè)計(jì)缺陷,英偉達(dá)已不得不將Blackwell GPU的生產(chǎn)和交付推遲至少一個(gè)季度。這兩起事件凸顯了英偉達(dá)在滿足客戶對(duì)AI硬件的需求方面所面臨的困難。
新的服務(wù)器機(jī)架之所以意義重大,是因?yàn)槠浼闪?2個(gè)英偉達(dá) AI 芯片,預(yù)計(jì)每機(jī)架功耗高達(dá)120kW。由于過(guò)熱會(huì)限制GPU性能并有損壞組件的風(fēng)險(xiǎn),該問(wèn)題導(dǎo)致英偉達(dá)多次重新評(píng)估其服務(wù)器機(jī)架的設(shè)計(jì),
針對(duì)延遲和過(guò)熱問(wèn)題,英偉達(dá)已指示其供應(yīng)商對(duì)機(jī)架進(jìn)行幾項(xiàng)設(shè)計(jì)更改,以解決過(guò)熱問(wèn)題。該公司與供應(yīng)商和合作伙伴密切合作,開發(fā)工程修訂版以改善服務(wù)器冷卻。雖然這些調(diào)整對(duì)于如此大規(guī)模的技術(shù)發(fā)布來(lái)說(shuō)是標(biāo)準(zhǔn)做法,但它們?nèi)匀辉黾恿搜舆t,進(jìn)一步推遲了預(yù)期的發(fā)貨日期。
高管們表示,他們至少需要幾周的時(shí)間來(lái)測(cè)試系統(tǒng)并解決可能出現(xiàn)的問(wèn)題,尤其是考慮到其新穎的設(shè)計(jì)和前所未有的復(fù)雜性。據(jù)一位參與設(shè)計(jì)的人士稱,一些客戶(如微軟)計(jì)劃通過(guò)更換一些組件來(lái)定制Blackwell 機(jī)架,以適應(yīng)他們的數(shù)據(jù)中心。
與此同時(shí),客戶也在考慮其他選擇。一家訂購(gòu)了機(jī)架的云計(jì)算公司的高管表示,Blackwell的問(wèn)題導(dǎo)致該公司考慮購(gòu)買更多英偉達(dá)當(dāng)前一代 Hopper 芯片。
分析表示,客戶決定購(gòu)買更多Hopper芯片,可能會(huì)提高英偉達(dá)的短期收益,分析師和投資者估計(jì) Hopper 系列的利潤(rùn)率更高。但這對(duì)英偉達(dá)未來(lái)的收入增長(zhǎng)來(lái)說(shuō)可能不是一個(gè)好兆頭,已經(jīng)轉(zhuǎn)向 Hopper芯片的客戶可能不會(huì)訂購(gòu)那么多Blackwell芯片和NVLink服務(wù)器。
評(píng)論