<meter id="pryje"><nav id="pryje"><delect id="pryje"></delect></nav></meter>

<label id="pryje"></label>

新聞中心

EEPW首頁 > 智能計(jì)算 > 新品快遞 > NVIDIA推出用于大型語言模型和生成式AI工作負(fù)載的推理平臺

NVIDIA推出用于大型語言模型和生成式AI工作負(fù)載的推理平臺

作者：徐鵬時(shí)間：2023-03-27 來源：中關(guān)村在線

加入技術(shù)交流群
- 掃碼加入
  和技術(shù)大咖面對面交流
  海量資料庫查詢

收藏

近日，NVIDIA推出了四款推理平臺。這些平臺針對各種快速興起的生成式AI應(yīng)用進(jìn)行了優(yōu)化，能夠幫助開發(fā)人員快速構(gòu)建用于提供新服務(wù)和洞察的AI驅(qū)動的專業(yè)應(yīng)用。

本文引用地址：http://www.ex-cimer.com/article/202303/444918.htm

谷歌云、D-ID、Cohere將新平臺用于各種生成式AI服務(wù)，包括聊天機(jī)器人、文本生成圖像內(nèi)容、AI視頻等

這些平臺將NVIDIA的全棧推理軟件與最新的NVIDIA Ada、Hopper和Grace Hopper處理器相結(jié)合，包括今天推出的NVIDIA L4 Tensor Core GPU和NVIDIA H100 NVL GPU。各平臺針對AI視頻、圖像生成、大型語言模型部署、推薦系統(tǒng)推理等需求激增的工作負(fù)載進(jìn)行了優(yōu)化。

NVIDIA創(chuàng)始人兼首席執(zhí)行官黃仁勛表示：“生成式AI的興起需要更加強(qiáng)大的推理計(jì)算平臺。生成式AI應(yīng)用的數(shù)量是無限的，它唯一的限制就是人類的想象力。為開發(fā)人員提供最強(qiáng)大、靈活的推理計(jì)算平臺將加快新服務(wù)的創(chuàng)造速度，這些新服務(wù)將以前所未有的方式改善我們的生活?！?/p>

加速生成式AI的各種推理工作負(fù)載集

每個(gè)平臺都包含一個(gè)為特定生成式AI推理工作負(fù)載而優(yōu)化的NVIDIA GPU和專用的軟件：

· 適用于AI視頻的NVIDIA L4可提供比CPU高出120倍的AI視頻性能，同時(shí)能效提高了99%。這款適用于幾乎所有工作負(fù)載的通用GPU提供更加強(qiáng)大的視頻解碼和轉(zhuǎn)碼能力、視頻流式傳輸、增強(qiáng)現(xiàn)實(shí)、生成式AI視頻等。

· 適用于圖像生成的NVIDIA L40針對圖形以及AI支持的2D、視頻和3D圖像生成進(jìn)行了優(yōu)化。L40平臺是NVIDIA Omniverse（一個(gè)用于在數(shù)據(jù)中心構(gòu)建和運(yùn)行元宇宙應(yīng)用的平臺）的引擎，與上一代產(chǎn)品相比，其Stable Diffusion推理性能提高了7倍，Omniverse性能提高了12倍。

· 適用于大型語言模型部署的NVIDIA H100 NVL是規(guī)?；渴鹣馛hatGPT這樣的大型語言模型（LLMs）的理想平臺。這款新的H100 NVL擁有94GB內(nèi)存和Transformer引擎加速，在數(shù)據(jù)中心規(guī)模，與上一代A100相比，GPT-3上的推理性能提高了多達(dá)12倍。

· 適用于推薦模型的NVIDIA Grace Hopper是圖形推薦模型、矢量數(shù)據(jù)庫和圖神經(jīng)網(wǎng)絡(luò)的理想平臺。通過NVLink-C2C以900 GB/s 的速度連接CPU和GPU，Grace Hopper的數(shù)據(jù)傳輸和查詢速度比PCIe 5.0快了7倍。

這些平臺的軟件層采用NVIDIA AI Enterprise軟件套件，包括用于高性能深度學(xué)習(xí)推理的軟件開發(fā)套件NVIDIA TensorRT，以及幫助實(shí)現(xiàn)模型部署標(biāo)準(zhǔn)化的開源推理服務(wù)軟件NVIDIA Triton Inference Server。

早期采用者與支持

谷歌云是NVIDIA推理平臺的重要云合作伙伴和早期客戶。該公司正在將L4平臺整合到其機(jī)器學(xué)習(xí)平臺Vertex AI中，并且是第一家提供L4實(shí)例的云服務(wù)提供商，其G2虛擬機(jī)的私人預(yù)覽版已于今天推出。

NVIDIA和谷歌今天分別宣布了首批在谷歌云上使用L4的兩家機(jī)構(gòu)——Descript和WOMBO，前者使用生成式AI幫助創(chuàng)作者制作視頻和播客，后者提供“Dream”這一AI驅(qū)動的文本-數(shù)字藝術(shù)轉(zhuǎn)換應(yīng)用程序。

另一個(gè)早期采用者快手提供了一個(gè)短視頻應(yīng)用程序，利用GPU對傳入的實(shí)時(shí)流媒體視頻進(jìn)行解碼、捕捉關(guān)鍵幀并優(yōu)化音視頻。然后，它使用一個(gè)基于Transformer的大型模型理解多模態(tài)內(nèi)容，從而提高全球數(shù)億用戶的點(diǎn)擊率。

快手高級副總裁于越表示：“快手推薦系統(tǒng)所服務(wù)的社區(qū)每天的用戶人數(shù)超過3.6億，他們每天貢獻(xiàn)3000萬條UGC視頻。在相同的總體擁有成本下，相較于CPU，NVIDIA GPU將系統(tǒng)的端到端吞吐量提高了11倍，將延遲降低了20%?！?/p>

生成式AI技術(shù)平臺D-ID，通過使用NVIDIA L40 GPU從文本中生成逼真的數(shù)字人，支持任何內(nèi)容來生成人臉，不僅幫助專業(yè)人士改進(jìn)視頻內(nèi)容，同時(shí)減少了大規(guī)模視頻制作的成本和麻煩。

D-ID研發(fā)副總裁Or Gorodissky表示：“L40的性能十分驚人。有了它，我們將推理速度提高了一倍。D-ID十分高興能夠?qū)⑦@個(gè)新硬件作為我們產(chǎn)品的一部分，以前所未有的性能和分辨率實(shí)現(xiàn)AI人的實(shí)時(shí)流傳輸，并降低我們的計(jì)算成本?！?/p>

AI制作工作室Seyhan Lee使用生成式AI為電影、廣播和娛樂行業(yè)開發(fā)沉浸式體驗(yàn)和迷人的創(chuàng)意內(nèi)容。

Seyhan Lee聯(lián)合創(chuàng)始人Pinar Demirdag表示：“L40 GPU為我們的生成式AI應(yīng)用帶來了驚人的性能提升。憑借L40的推理能力和內(nèi)存容量，我們可以部署非常先進(jìn)的模型，并以驚人的速度和精度向客戶提供創(chuàng)新的服務(wù)。”

語言AI領(lǐng)域的先鋒Cohere所運(yùn)行的平臺使得開發(fā)人員能夠在保護(hù)數(shù)據(jù)隱私和安全的情況下，構(gòu)建自然語言模型。

Cohere首席執(zhí)行官Aidan Gomez表示：“憑借NVIDIA的全新高性能H100推理平臺，我們可以使用先進(jìn)的生成式模型為客戶提供更加優(yōu)質(zhì)、高效的服務(wù)，推動對話式AI、多語言企業(yè)搜索、信息提取等各種NLP應(yīng)用的發(fā)展?！?/p>

供應(yīng)情況

NVIDIA L4 GPU私人預(yù)覽版現(xiàn)已通過谷歌云平臺以及30多家計(jì)算機(jī)制造商所組成的全球網(wǎng)絡(luò)提供。

NVIDIA L40 GPU現(xiàn)已通過全球領(lǐng)先的系統(tǒng)提供商提供，并且合作伙伴平臺的數(shù)量將在今年持續(xù)增加。

Grace Hopper超級芯片已開始樣品供貨，預(yù)計(jì)下半年將全面投產(chǎn)。H100 NVL GPU也將于下半年面市。

NVIDIA AI Enterprise現(xiàn)在通過各大云市場以及數(shù)十家系統(tǒng)提供商和合作伙伴提供。NVIDIA AI Enterprise為客戶提供NVIDIA 企業(yè)級支持、定期安全審查以及NVIDIA Triton Inference Server、TensorRT和50多個(gè)預(yù)訓(xùn)練模型與框架的API穩(wěn)定性。

NVIDIA LaunchPad上免費(fèi)提供的動手實(shí)驗(yàn)室可以試用用于生成式AI的NVIDIA推理平臺。樣品實(shí)驗(yàn)室的內(nèi)容包括訓(xùn)練和部署一個(gè)客服聊天機(jī)器人、部署一個(gè)端到端AI工作負(fù)載、在H100上調(diào)整和部署一個(gè)語言模型以及使用NVIDIA Triton部署一個(gè)欺詐檢測模型。

<a target='_blank'><img src='https://ad.eepw.com.cn/www/delivery/avw.php?zoneid=114&cb=INSERT_RANDOM_NUMBER_HERE&n=a7a83b30' border='0' alt='' /></a>
<a target='_blank'><img src='https://ad.eepw.com.cn/www/delivery/avw.php?zoneid=115&cb=INSERT_RANDOM_NUMBER_HERE&n=a3d98779' border='0' alt='' /></a>
<a target='_blank'><img src='https://ad.eepw.com.cn/www/delivery/avw.php?zoneid=116&cb=INSERT_RANDOM_NUMBER_HERE&n=abca108c' border='0' alt='' /></a>
<a target='_blank'><img src='https://ad.eepw.com.cn/www/delivery/avw.php?zoneid=117&cb=INSERT_RANDOM_NUMBER_HERE&n=a1775170' border='0' alt='' /></a>
<a target='_blank'><img src='https://ad.eepw.com.cn/www/delivery/avw.php?zoneid=118&cb=INSERT_RANDOM_NUMBER_HERE&n=a449048b' border='0' alt='' /></a>

關(guān)鍵詞： NVIDIA

評論

相關(guān)推薦

ARM.新聞稿

資源下載 Zilog ARM 32位微控制器嵌入式 MCU SoC Cortex-M3 多核處理器消費(fèi)電子 Mali-400 MP NVIDIA Tegra 高度優(yōu)化下一代機(jī)頂盒納米片上系統(tǒng) | 2009-04-12

有關(guān) High-Level Synthesis (HLS) 的 NVIDIA 案例分析

資源下載 mentor HLS NVIDIA | 2018-11-09

Nvidia RTX 3050對決AMD RX 6600 ：哪個(gè)GPU主導(dǎo)200美元市場？

嵌入式系統(tǒng) Nvidia RTX 3050 AMD RX 6600 GPU | 2024-07-02

Nvidia DRIVE AGX Xavier上的ADI成像雷達(dá)

視頻 ADI Nvidia DRIVE AGX | 2020-06-12

英偉達(dá)CEO黃仁勛COMPUTEX 2024大會演講

嵌入式系統(tǒng) Nvidia COMPUTEX 2024 英偉達(dá) | 2024-06-04

Supermicro推支持NVIDIA Blackwell和? HGX H100/H200的機(jī)柜級即插即用液冷AI SuperCluster

網(wǎng)絡(luò)與存儲 Supermicro NVIDIA Blackwell HGX 液冷AI SuperCluster | 2024-06-07

讓你去選擇的話，3年后英特爾股票會在哪里？

嵌入式系統(tǒng) 英特爾 AMD NVIDIA | 2024-06-24

NVIDIA：以Jetson邊緣設(shè)備在現(xiàn)實(shí)世界探索生成式AI無限可能

智能計(jì)算 202406 NVIDIA Jetson 生成式AI | 2024-06-10

Nvidia MCP55P Desige guide

資源下載 Nvidia MCP55P Desige guide | 2013-09-18

NVIDIA Corporation、麗臺科技股份有限公司被訴侵權(quán)糾紛案將申請?jiān)賹?/a>

吳鳳清 | 2009-12-16

臺積電3nm供不應(yīng)求引漲價(jià)潮！NVIDIA、AMD、蘋果等都要漲價(jià)

EDA/PCB 臺積電 3nm 供不應(yīng)求漲價(jià) NVIDIA AMD 蘋果 | 2024-06-17

顯卡大亨Nvidia有意購?fù)?3種合作方案出爐

wxy_88kl | 2008-03-20

NVIDIA獲ARM授權(quán)，為圖形處理器增添應(yīng)用處理功能

xiaosongs | 2005-10-19

nvidia一款顯卡pcb_layout和sch（allegro）.rar

資源下載 nvidia layout allegro | 2015-04-16

什么是 DLSS，值得嗎？

智能計(jì)算 DLSS gpu NVIDIA | 2024-07-17

RTI Connext賦予NVIDIA Holoscan以數(shù)據(jù)為中心的網(wǎng)絡(luò)互聯(lián)功能

網(wǎng)絡(luò)與存儲 RTI Connext NVIDIA Holoscan 數(shù)據(jù)中心網(wǎng)絡(luò)互聯(lián) | 2024-06-27

NVIDIA發(fā)布超級手機(jī) 基于Tegra平臺

視頻 NVIDIA 手機(jī) | 2011-01-20

打破NVIDIA壟斷！英國公司實(shí)現(xiàn)CUDA軟件在AMD GPU上無縫運(yùn)行

智能計(jì)算 NVIDIA CUDA軟件 AMD GPU | 2024-07-22

GF106+DDR3.zip?

資源下載 NVIDIA GF106 | 2015-04-23

NVIDIA報(bào)告：當(dāng)前海外電信行業(yè)的四大AI趨勢

手機(jī)與無線通信 AI 電信行業(yè) 運(yùn)營商 NVIDIA | 2024-06-20

NVIDIA Corporation被訴侵權(quán)糾紛案將申請?jiān)賹?/a>

吳鳳清 | 2010-01-08

聲明：NVIDIA Corporation等公司被訴侵權(quán)糾紛案將申請?jiān)賹?/a>

吳鳳清 | 2009-03-31

焦點(diǎn)

推薦視頻

技術(shù)專區(qū)

看屁屁www成人影院,亚洲人妻成人图片,亚洲精品成人午夜在线,日韩在线欧美成人 (function(){ var bp = document.createElement('script'); var curProtocol = window.location.protocol.split(':')[0]; if (curProtocol === 'https') { bp.src = 'https://zz.bdstatic.com/linksubmit/push.js'; } else { bp.src = 'http://push.zhanzhang.baidu.com/push.js'; } var s = document.getElementsByTagName("script")[0]; s.parentNode.insertBefore(bp, s); })();