全球最小AI「桌面超算」發(fā)布,英偉達(dá)B端C端兩手抓
每年在美國拉斯維加斯舉辦的國際消費(fèi)電子展(CES)是科技圈最重要的盛會(huì)。今年,英偉達(dá)創(chuàng)始人兼首席執(zhí)行官黃仁勛發(fā)表開幕主題演講,推出了多款新品 —— GeForce RTX 50系列GPU、支持機(jī)器人開發(fā)的世界模型Cosmos,以及一臺(tái)被他稱作“世界上最小的個(gè)人超級(jí)計(jì)算機(jī)”Project Digits。
本文引用地址:http://www.ex-cimer.com/article/202501/466169.htm1993年,英偉達(dá)創(chuàng)立后經(jīng)歷了多個(gè)重要時(shí)間節(jié)點(diǎn):1999年,發(fā)布世界首款GPU產(chǎn)品;2006年,推出GeForce 8800 Ultra顯卡,并提出CUDA(統(tǒng)一計(jì)算架構(gòu))這一概念,引領(lǐng)了后續(xù)的GPU算力發(fā)展。在AI領(lǐng)域,英偉達(dá)在十多年前就已經(jīng)洞察到AI的影響力,并一路伴隨著AI行業(yè)的發(fā)展。
亮相即“王炸”
GeForce RTX 50系列GPU中最受矚目的GeForce RTX 5090,是英偉達(dá)目前最強(qiáng)大的顯卡,其速度是其前身RTX 4090的兩倍。新一代基于Blackwell架構(gòu)的RTX 5090晶體管數(shù)量從上一代的763億(Ada Lovelace架構(gòu))提升至920億,可提供3400 TOPS算力,具備4000 AI TOPS(每秒萬億次操作)的性能。
此次英偉達(dá)公布了RTX 5090、RTX 5080、RTX 5070 Ti、RTX 5070四款桌面平臺(tái)GPU和對(duì)應(yīng)的四款移動(dòng)平臺(tái)GPU。RTX 5070、RTX 5070 Ti、RTX 5080和RTX 5090的售價(jià)分別為:549美元、749美元、999美元和1999美元;而搭載RTX 5090、RTX 5080、5070 Ti和5070的筆記本售價(jià)分別為2899、2199、1599和1299美元,預(yù)計(jì)將于三月份上市。
黃仁勛特別提到,售價(jià)僅549美元的RTX 5070顯卡的性能將足以媲美去年推出的RTX 4090 GPU,而后者的售價(jià)高達(dá)1600美元。黃仁勛直言:“沒有人工智能,這是不可能實(shí)現(xiàn)的”。到了AI時(shí)代,傳統(tǒng)基于CPU的說明式硬編碼開發(fā)模式,也應(yīng)該轉(zhuǎn)型為基于GPU、機(jī)器學(xué)習(xí)與神經(jīng)網(wǎng)絡(luò)的AI模式。而強(qiáng)大的GPU,正是這一轉(zhuǎn)變的起點(diǎn)。
值得注意的是,由于美國出口管制,英偉達(dá)無法在中國市場銷售RTX 5090,取而代之是RTX 5090D,定價(jià)16499元。和RTX 5090相比,RTX 5090D擁有2375AI TOPS算力,是RTX 5090的70%,是RTX 4090D的200%。
在RTX 50系顯卡上,英偉達(dá)同步推出了最新一代的DLSS 4。簡單來說,DLSS 4改用了由英偉達(dá)超級(jí)計(jì)算機(jī)訓(xùn)練的全新Transformer AI模型,提升了DLSS 4的渲染精度和穩(wěn)定性,從而為用戶提供更好的畫面和更高的分辨率。另外,基于第五代Tensor Core的能力,RTX 50系列的DLSS多幀生成技術(shù)取代了RTX 40系列的DLSS幀生成,可以為每一個(gè)實(shí)際渲染幀額外生成最多3幀畫面,這對(duì)游戲平均幀率有相當(dāng)顯著的提升。
全新物理AI模型Cosmos
此外,英偉達(dá)還宣布推出Cosmos平臺(tái),集成了先進(jìn)的生成式世界基礎(chǔ)模型(WFM)、高級(jí)分詞器、護(hù)欄系統(tǒng)和加速的視頻處理管道,這個(gè)平臺(tái)被稱為加速「物理AI」發(fā)展的關(guān)鍵一步,將極大地推動(dòng)自動(dòng)駕駛和機(jī)器人等對(duì)物理場景要求較高的領(lǐng)域邁向更高水平。
物理AI(也稱為生成式物理AI)是一種使自主機(jī)器能夠在真實(shí)物理世界中感知、理解和執(zhí)行復(fù)雜交互操作的技術(shù)。它擴(kuò)展了傳統(tǒng)的生成式AI,使其能夠理解3D世界的空間關(guān)系和物理行為,通俗地理解就是人工智能反饋的內(nèi)容要符合物理規(guī)律。例如,傳統(tǒng)的機(jī)器人只能按照預(yù)設(shè)程序執(zhí)行任務(wù),而搭載物理AI的機(jī)器人則能夠更好地識(shí)別物體、預(yù)測運(yùn)動(dòng)軌跡、并根據(jù)物理規(guī)律做出相應(yīng)的反應(yīng)。
“物理AI將徹底改變價(jià)值50萬億美元的制造業(yè)和物流業(yè),”黃仁勛在本次CES國際消費(fèi)電子展上表示,從汽車、卡車到工廠、倉庫,所有移動(dòng)的事物都將實(shí)現(xiàn)機(jī)器人化并由AI驅(qū)動(dòng),強(qiáng)調(diào)AI的新一波浪潮是物理AI。
物理AI的開發(fā)極為復(fù)雜,需要海量的真實(shí)世界數(shù)據(jù)和長時(shí)間的測試,開發(fā)成本高昂。而英偉達(dá)的Cosmos平臺(tái)使用了NeMo Curator框架以及CUDA加速數(shù)據(jù)處理流水線,在14天內(nèi)即可完成對(duì)2000萬小時(shí)視頻的處理工作,而這一任務(wù)在傳統(tǒng)CPU環(huán)境下需要3.4年。
英偉達(dá)構(gòu)建了一個(gè)完整的物理AI生態(tài)系統(tǒng),包含以O(shè)mniverse、Cosmos、Isaac Sim等關(guān)鍵組成部分。開發(fā)者可以利用Omniverse創(chuàng)建虛擬的三維場景,再由Cosmo生成如同高度擬真的訓(xùn)練場景,其中Cosmos WFMs能夠快速生成基于真實(shí)物理規(guī)律的高仿真數(shù)據(jù),降低依賴昂貴現(xiàn)實(shí)數(shù)據(jù)的需求。這些模型通過將文本、圖像、視頻以及機(jī)器人傳感器數(shù)據(jù)結(jié)合,生成多樣化的物理環(huán)境場景,比如雪地駕駛、擁擠倉庫等。
Cosmos模型將有三種尺寸:Nano、Super和Ultra。英偉達(dá)表示Cosmos模型會(huì)以開放模型許可的方式發(fā)布,開發(fā)者可以通過NVIDIA API目錄預(yù)覽首批模型,或從NVIDIA NG目錄或Hugging Face下載完整的模型家族和微調(diào)框架。目前,多家領(lǐng)先的機(jī)器人和汽車公司,包括1X、Agile Robots、以及汽車共享巨頭Uber,已成為首批采用Cosmos平臺(tái)的企業(yè),或許機(jī)器人也即將迎來“ChatGPT時(shí)刻”。
可以說Cosmos的發(fā)布,補(bǔ)全了英偉達(dá)物理AI體系中“理解世界”的重要一環(huán)。從此次發(fā)布的產(chǎn)品來看,英偉達(dá)在AI領(lǐng)域的進(jìn)度已經(jīng)甩掉同行一大截,而在CUDA、Tensor的“封鎖下”,英偉達(dá)還將繼續(xù)引領(lǐng)高算力AI平臺(tái),乃至整個(gè)AI行業(yè)的發(fā)展,成為AI產(chǎn)業(yè)名副其實(shí)的“柱石”。
全球最小的個(gè)人AI超算
2025年,AI已經(jīng)成為了科技發(fā)展的主戰(zhàn)場,昂貴、龐大的AI超算,從某種程度上其實(shí)也阻礙了AI的進(jìn)步。對(duì)此,黃仁勛帶來了英偉達(dá)的「One More Thing」 —— Project Digits桌面AI超級(jí)計(jì)算機(jī)。
核心方面,Project Digits搭載的GB10超級(jí)芯片由Blackwell CPU和Grace CPU組成,其中Grace CPU包含20個(gè)ARM核心。同時(shí),Project Digits也配備了128GB LPDDR5X內(nèi)存和4TB SSD。另外,Project Digits除了可以單獨(dú)使用,還可以兩個(gè)單元疊加使用,疊加狀態(tài)下甚至可以運(yùn)行超過4000億參的模型。
其實(shí),市場一直關(guān)注英偉達(dá)在PC領(lǐng)域的動(dòng)作。早在2023年年底,路透社就曝光過英偉達(dá)正在秘密研發(fā)一款基于ARM架構(gòu)的PC CPU,支持Windows操作系統(tǒng),進(jìn)軍個(gè)人電腦領(lǐng)域與英特爾、AMD的“x86聯(lián)盟”競爭;2024年10月,臺(tái)灣經(jīng)濟(jì)時(shí)報(bào)又爆出來自中國臺(tái)灣供應(yīng)鏈方面的消息,表示英偉達(dá)將與聯(lián)發(fā)科合作設(shè)計(jì)一款基于3nm的PC CPU,2025年進(jìn)軍PC CPU領(lǐng)域。
但是Project Digits與先前爆料的PC CPU并非同一款產(chǎn)品。無論是功能還是目標(biāo)用戶,Project Digits定位上更接近于蘋果Mac和微軟Surface旗下的工作站計(jì)算機(jī),而非一般意義上的個(gè)人電腦。黃仁勛表示:“我們將AI超級(jí)計(jì)算機(jī)放在每個(gè)數(shù)據(jù)科學(xué)家、AI研究人員和學(xué)生的辦公桌上,使他們能夠參與和塑造AI時(shí)代?!?/strong>
這個(gè)產(chǎn)品本身尺寸類似Mac Mini,可以放在桌子上并使用標(biāo)準(zhǔn)電源插座供電,既能夠用作小型工作站,也可以與現(xiàn)有PC配合使用。根據(jù)英偉達(dá)介紹,Project Digits定價(jià)3000美元,最快5月上市。但值得關(guān)注的是,英偉達(dá)在官方聲明中提到了與聯(lián)發(fā)科的合作,稱聯(lián)發(fā)科參與了GB10的設(shè)計(jì),“在能效、性能和互連上做出了貢獻(xiàn)”。
期待更高的重磅產(chǎn)品“缺席”?
英偉達(dá)通常會(huì)在CES展會(huì)上發(fā)布重要的產(chǎn)品公告,許多投資者希望獲得Blackwell更具體的進(jìn)展信息,以及對(duì)下一代數(shù)據(jù)中心GPU架構(gòu)Rubin的更多介紹。但CES是消費(fèi)電子產(chǎn)品的主場,黃仁勛在演進(jìn)中并未透露更多數(shù)據(jù)中心產(chǎn)品業(yè)務(wù)線的信息,只提到“Blackwell已全面投入生產(chǎn)”。
此前,英偉達(dá)在2024年11月的財(cái)報(bào)電話會(huì)議中確認(rèn),Blackwell芯片的生產(chǎn)已在本季度加速,預(yù)計(jì)將提前向客戶發(fā)貨。市場預(yù)期,這些芯片將推動(dòng)英偉達(dá)產(chǎn)品需求進(jìn)入一個(gè)新的增長周期。2024年8月,其首款產(chǎn)品B200 GPU被曝存在設(shè)計(jì)缺陷,遇到了散熱、封裝緊缺等一系列工程難題,市場當(dāng)時(shí)緊張猜測英偉達(dá)是否會(huì)延遲交貨。
雖然在這次CES上沒有等到更多相關(guān)的爆料,但根據(jù)英偉達(dá)的規(guī)劃,本月月底即將發(fā)布的第四財(cái)季財(cái)報(bào)與3月要舉辦的GTC大會(huì),才是英偉達(dá)回到主場的重頭戲。
近年來,摩爾定律的發(fā)展速度有所放緩。然而,黃仁勛聲稱,英偉達(dá)的AI芯片正以自身的加速節(jié)奏發(fā)展,“我們可以同時(shí)構(gòu)建架構(gòu)、芯片、系統(tǒng)、庫和算法,如果這樣做,我們就能比摩爾定律更快地發(fā)展,因?yàn)槲覀兛梢栽谡麄€(gè)技術(shù)棧中進(jìn)行創(chuàng)新”,性能提升速度已遠(yuǎn)超數(shù)十年來推動(dòng)計(jì)算機(jī)技術(shù)進(jìn)步的摩爾定律設(shè)定的標(biāo)準(zhǔn),AI世界正以「超摩爾定律」的速度發(fā)展。
黃仁勛還強(qiáng)調(diào),隨著計(jì)算能力的提升,AI推理成本將逐步降低,類似于摩爾定律推動(dòng)計(jì)算成本下降的歷史進(jìn)程。英偉達(dá)最新的數(shù)據(jù)中心超級(jí)芯片GB200 NVL72,在運(yùn)行AI推理工作負(fù)載方面的速度比H100快30-40倍,成本將隨著時(shí)間的推移而降低,預(yù)計(jì)這種趨勢將隨著AI推理模型的發(fā)展而繼續(xù)下去。
評(píng)論