<meter id="pryje"><nav id="pryje"><delect id="pryje"></delect></nav></meter>

<label id="pryje"></label>

新聞中心

EEPW首頁 > 智能計(jì)算 > 設(shè)計(jì)應(yīng)用 > 第一時(shí)間適配！英特爾銳炫GPU在運(yùn)行Llama 3時(shí)展現(xiàn)卓越性能

第一時(shí)間適配！英特爾銳炫GPU在運(yùn)行Llama 3時(shí)展現(xiàn)卓越性能

作者：時(shí)間：2024-04-24 來源：EEPW

加入技術(shù)交流群
- 掃碼加入
  和技術(shù)大咖面對(duì)面交流
  海量資料庫查詢

收藏

在Meta發(fā)布Llama 3大語言模型的第一時(shí)間，英特爾即優(yōu)化并驗(yàn)證了80億和700億參數(shù)的Llama 3模型能夠在英特爾AI產(chǎn)品組合上運(yùn)行。在客戶端領(lǐng)域，英特爾銳炫?顯卡的強(qiáng)大性能讓開發(fā)者能夠輕松在本地運(yùn)行Llama 3模型，為生成式AI工作負(fù)載提供加速。

本文引用地址：http://www.ex-cimer.com/article/202404/458007.htm

在Llama 3模型的初步測(cè)試中，英特爾^?酷睿?Ultra H系列處理器展現(xiàn)出了高于普通人閱讀速度的輸出生成性能，而這一結(jié)果主要得益于其內(nèi)置的英特爾銳炫 GPU，該GPU具有8個(gè)Xe核心，以及DP4a AI加速器和高達(dá)120 GB/s的系統(tǒng)內(nèi)存帶寬。

英特爾酷睿Ultra處理器和英特爾銳炫顯卡在Llama 3模型發(fā)布的第一時(shí)間便提供了良好適配，這彰顯了英特爾和Meta攜手為本地AI開發(fā)和數(shù)百萬設(shè)備的部署所做出的努力。英特爾客戶端硬件性能的大幅提升得益于用于本地研發(fā)的PyTorch和英特爾? PyTorch擴(kuò)展包等豐富的軟件框架與工具，以及用于模型部署和推理的OpenVINO?工具包。

圖片1.gif

在內(nèi)置英特爾銳炫顯卡的英特爾酷睿 Ultra 7上運(yùn)行Meta-Lama3-8B-Instruct

在英特爾銳炫A770上運(yùn)行Llama 3的下一個(gè)Token延遲

上圖展示了在搭配PyTorch框架和針對(duì)英特爾GPU的優(yōu)化后，英特爾銳炫A770顯卡在運(yùn)行Llama 3模型時(shí)表現(xiàn)出卓越的性能。除此之外，英特爾銳炫顯卡亦支持開發(fā)者在本地運(yùn)行包括Mistral-7B-Instruct LLM、Phi2、Llama2等在內(nèi)的大語言模型。

基于相同的基礎(chǔ)安裝，開發(fā)者可以在本地運(yùn)行多種模型的主要原因，可以歸功于IPEX-LLM，即一個(gè)針對(duì)PyTorch的大語言模型庫。它主要基于英特爾^? PyTorch擴(kuò)展包打造，涵蓋時(shí)下最新的大語言模型優(yōu)化和低比特?cái)?shù)據(jù)壓縮（INT4/FP4/INT8/FP8），以及針對(duì)英特爾硬件的大多數(shù)最新性能優(yōu)化。得益于如銳炫A系列顯卡等英特爾獨(dú)立顯卡上的Xe核心XMX AI加速功能，IPEX-LLM能夠顯著提高性能，其支持在Windows子系統(tǒng)Linux版本2、原生Windows環(huán)境和原生Linux上的英特爾銳炫A系列顯卡。

由于所有的操作和模型均基于原生PyTorch框架，開發(fā)者可以非常方便地更換或使用不同的PyTorch模型以及輸入數(shù)據(jù)。而上述模型和數(shù)據(jù)不僅能夠在英特爾銳炫顯卡上運(yùn)行，開發(fā)者亦能享受到英特爾銳炫顯卡加速帶來的性能提升。

產(chǎn)品和性能信息

英特爾^?酷睿?Ultra處理器：

在英特爾酷睿Ultra 7 155H平臺(tái)（MSI Prestige 16 AI Evo B1MG-005US）上進(jìn)行測(cè)試，使用32GB LP5x 6400Mhz總內(nèi)存，英特爾顯卡驅(qū)動(dòng)101.5382 WHQL，Windows 11 Pro版本22631.3447，平衡操作系統(tǒng)電源計(jì)劃，最佳性能操作系統(tǒng)電源模式，極限性能MSI Center模式，已啟用核心隔離，基于英特爾2024年4月17日的測(cè)試。

英特爾銳炫?A系列顯卡：

在英特爾銳炫A770 16GB顯卡上進(jìn)行測(cè)試，使用英特爾酷睿 i9-14900K、華碩ROG MAXIMUS Z790 HERO主板、32GB（2x 16GB）DDR5 5600Mhz，Corsair MP600 Pro XT 4TB NVMe。軟件配置包括英特爾顯卡驅(qū)動(dòng)101.5382 WHQL、Windows 11 Pro版本22631.3447、性能電源策略和核心隔離禁用?；谟⑻貭?024年4月17日的測(cè)試。

注釋：

性能因使用情況、配置和其他因素而異?？稍谛阅苤笖?shù)網(wǎng)站上了解更多信息。

性能結(jié)果基于所示日期的配置測(cè)試，可能不反映所有公開可用的更新。請(qǐng)參閱附件以了解配置詳情。沒有任何產(chǎn)品或組件可以絕對(duì)安全。

基于預(yù)生產(chǎn)系統(tǒng)和組件的結(jié)果，以及使用英特爾參考平臺(tái)（內(nèi)部新系統(tǒng)的內(nèi)部示例）、英特爾內(nèi)部分析或架構(gòu)模擬或建模估算或模擬的結(jié)果，僅供參考。結(jié)果可能會(huì)因?qū)韺?duì)任何系統(tǒng)、組件、規(guī)格或配置的更改而變化。

成本和結(jié)果可能會(huì)有所不同。

英特爾技術(shù)可能需要啟用硬件、軟件或服務(wù)進(jìn)行激活。

<a target='_blank'><img src='https://ad.eepw.com.cn/www/delivery/avw.php?zoneid=114&cb=INSERT_RANDOM_NUMBER_HERE&n=a7a83b30' border='0' alt='' /></a>
<a target='_blank'><img src='https://ad.eepw.com.cn/www/delivery/avw.php?zoneid=115&cb=INSERT_RANDOM_NUMBER_HERE&n=a3d98779' border='0' alt='' /></a>
<a target='_blank'><img src='https://ad.eepw.com.cn/www/delivery/avw.php?zoneid=116&cb=INSERT_RANDOM_NUMBER_HERE&n=abca108c' border='0' alt='' /></a>
<a target='_blank'><img src='https://ad.eepw.com.cn/www/delivery/avw.php?zoneid=117&cb=INSERT_RANDOM_NUMBER_HERE&n=a1775170' border='0' alt='' /></a>
<a target='_blank'><img src='https://ad.eepw.com.cn/www/delivery/avw.php?zoneid=118&cb=INSERT_RANDOM_NUMBER_HERE&n=a449048b' border='0' alt='' /></a>

關(guān)鍵詞： 英特爾 銳炫 GPU Llama 3

評(píng)論

相關(guān)推薦

消息稱英偉達(dá)曾向臺(tái)積電詢問建設(shè)廠外 CoWoS 先進(jìn)封裝專線可能，遭拒絕

EDA/PCB 英偉達(dá) GPU 封裝工藝臺(tái)積電 | 2024-07-23

英特爾承認(rèn)13、14代處理器問題大將推出修補(bǔ)程序

消費(fèi)電子英特爾處理器修補(bǔ)程序 | 2024-07-24

家中處處都有英特爾”--英特爾稱要讓芯片無所不在

hpnet | 2002-10-25

嵌入式圖形界面GUI-3，需要的請(qǐng)排隊(duì)！

jackwang | 2002-05-21

Meta訓(xùn)練Llama 3遭遇頻繁故障

智能計(jì)算 Meta Llama 3 英偉達(dá) H100 顯卡 GPU | 2024-07-29

英特爾整車方案：拓寬汽車制造商利潤(rùn)提升之路

汽車電子英特爾汽車制造商 | 2024-07-25

可控硅三相過零觸發(fā)控制板KJZ6-3電原理圖

設(shè)計(jì)方案可控硅三相觸發(fā) 控制板 KJZ6-3 原理 | 2009-07-06

由MIC5156-3.3構(gòu)成的由5V變?yōu)?.3V的穩(wěn)壓器電路

設(shè)計(jì)方案 MIC5156-3.3 構(gòu)成穩(wěn)壓器電路 | 2009-07-06

MSP430 IAR 3.42環(huán)境使用指南（中文完整版?。?

資源下載 TI 軟件介紹 MSP430 IAR 3.42環(huán)境 | 2007-11-28

Lattice的3.3伏ispMACH 4000V CPLD上市

hpnet | 2002-08-27

英特爾發(fā)布Quark X1000處理器搶奪物聯(lián)網(wǎng)市場(chǎng)

視頻英特爾 Quark | 2014-02-12

消息稱英特爾挖角臺(tái)積電工程師，芯片代工競(jìng)爭(zhēng)加劇

EDA/PCB 英特爾臺(tái)積電 | 2024-07-30

PC產(chǎn)業(yè)已跌無可跌 AMD /英特爾季報(bào)均未達(dá)預(yù)期

hpnet | 2002-10-17

Intel 收購 NVDIA 意欲何為

視頻 Intel NVDIA CPU GPU 移動(dòng)處理 | 2012-12-26

同創(chuàng)ATX-200SE-3型開關(guān)電源(KA7500B) 電路

設(shè)計(jì)方案同創(chuàng) ATX-200SE-3 開關(guān)電源 KA7500B 電路 | 2009-07-06

消息稱英偉達(dá) RTX 4070 及以上顯卡因 GDDR6X 顯存缺貨 8 月供應(yīng)緊張

消費(fèi)電子英偉達(dá) GPU | 2024-07-29

摩根士丹利：僅 GB200 AI 服務(wù)器業(yè)務(wù)，就為英偉達(dá)創(chuàng)造 2100 億美元年收入

智能計(jì)算 GB200 AI 英偉達(dá) GPU | 2024-07-26

觸摸屏軟件開發(fā)系統(tǒng)2.3.1

資源下載觸摸屏軟件系統(tǒng) 2.3.1 | 2007-02-09

英特爾Quark處理器，打通端到端的物聯(lián)網(wǎng)戰(zhàn)略布局

視頻物聯(lián)網(wǎng) 可穿戴設(shè)備智能硬件高峰論壇英特爾 quark | 2015-01-15

多功能車載酒精測(cè)試器

視頻信息技術(shù)大賽單片機(jī) STC15F2K61S2 車載 ADC0832 LCD 傳感器 MQ-3 | 2013-01-18

擅自下載被判侵權(quán) 微軟在港贏官司獲償3500萬元

hpnet | 2002-10-11

WINRAR 3.3

資源下載 RAR ZIP 壓縮格式 WINRAR 3.3 | 2007-02-09

Cyclone 與Spartan-3對(duì)比

資源下載 altera Cyclone 與Spartan-3 器件對(duì)比 | 2007-12-13

英特爾CPU故障率100％游戲商大崩潰改用AMD

消費(fèi)電子英特爾 CPU 故障率游戲商 AMD | 2024-07-24

全系 E 核 4.6GHz，英特爾 Arrow Lake-S 處理器未鎖頻版頻率曝光

消費(fèi)電子英特爾 CPU | 2024-07-29

3-DES算法的FPGA高速實(shí)現(xiàn)(Xilinx)

資源下載 Xilinx FPGA 3-DES算法 | 2007-12-13

英特爾AI解決方案為最新Meta Llama 3.1模型提供加速

智能計(jì)算英特爾 AI解決方案 Meta Llama 3.1 | 2024-07-25

MIC29300-3.3和MIC5014構(gòu)成的具有開關(guān)穩(wěn)壓器的效率和線性穩(wěn)壓器的高穩(wěn)定度的穩(wěn)壓器電路

設(shè)計(jì)方案 MIC29300-3.3 MIC5014 構(gòu)成具有開關(guān) | 2009-07-06

大嘴業(yè)話：A12真的能改變競(jìng)爭(zhēng)格局么？

視頻 ARM A12 GPU | 2013-06-21

AST-3型彩色顯示器的電源電路圖

設(shè)計(jì)方案 AST-3 彩色顯示器電源電路圖 | 2009-07-06

焦點(diǎn)

推薦視頻

技術(shù)專區(qū)

看屁屁www成人影院,亚洲人妻成人图片,亚洲精品成人午夜在线,日韩在线欧美成人 (function(){ var bp = document.createElement('script'); var curProtocol = window.location.protocol.split(':')[0]; if (curProtocol === 'https') { bp.src = 'https://zz.bdstatic.com/linksubmit/push.js'; } else { bp.src = 'http://push.zhanzhang.baidu.com/push.js'; } var s = document.getElementsByTagName("script")[0]; s.parentNode.insertBefore(bp, s); })();