英偉達(dá)H20現(xiàn)身基準(zhǔn)測試:內(nèi)核數(shù)量相比H100減少41%,性能降低28%
去年英偉達(dá)為了適應(yīng)美國政府對尖端人工智能(AI)芯片新的出口管制,推出中國特供版的H20計算卡,基于Hopper架構(gòu)打造,取代了以往銷售的A800和H800。雖然性能有不小的下降,但是可以滿足部分客戶的使用需求,而英偉達(dá)也獲得了更多的收益。至于H20和全球范圍內(nèi)熱賣的H100之間規(guī)格有多大差異,具體性能差多少,英偉達(dá)并沒有透露。
本文引用地址:http://www.ex-cimer.com/article/202407/460815.htm據(jù)Wccftech報道,H20現(xiàn)身Geekbench 6數(shù)據(jù)庫,顯示其配備了78組SM。搭載GH100芯片完整的配置為144組SM,不過實際的H100產(chǎn)品中沒有全部打開,其中SXM5版本中啟用了132組SM,而PCIe 5.0版本則啟用了114組SM。相比最高配置的H100,H20的內(nèi)核數(shù)量減少了41%。H20配備了96GB的HBM3,高于H100 80GB版本,不過低于后來推出的新版H100,擁有144GB HBM3E。同時H20的帶寬為4.0 TB/s,低于頂級解決方案的8.0 TB/s。
性能方面,INT8為296 TFLOPS,F(xiàn)P16為148 TFLOPS,TF32為74 TFLOPS,F(xiàn)P32為44 TFLOPS,而FP64只有1 TFLOPS。此外,H20配有60MB的L2緩存,支持多達(dá)7個多實例GPU,8路HGX配置,900 GB/s的NVLink帶寬,TDP為400W。
在OpenCL基準(zhǔn)測試中,H20的成績?yōu)?48,992分,H100 80GB版本在同一測試中的成績大概在280,000分,如果是擁有132組SM的H100可以提高至350,000分左右,至于配備144GB HBM3E的H100分?jǐn)?shù)就更高了。
最近有報道稱,H20計算卡仍然有著不錯的銷售前景,受到了客戶的歡迎,預(yù)計2024年英偉達(dá)將向中國出售超過100萬塊H20,每塊售價大概在1.2萬至1.3萬美元,意味著銷售額將達(dá)到120億美元以上,這將超過上一個財年英偉達(dá)在中國的總收入。
評論