<meter id="pryje"><nav id="pryje"><delect id="pryje"></delect></nav></meter>

<label id="pryje"></label>

新聞中心

EEPW首頁 > 智能計算 > 業(yè)界動態(tài) > 英特爾AI解決方案為最新Meta Llama 3.1模型提供加速

英特爾AI解決方案為最新Meta Llama 3.1模型提供加速

作者：時間：2024-07-25 來源：EEPW

加入技術(shù)交流群
- 掃碼加入
  和技術(shù)大咖面對面交流
  海量資料庫查詢

收藏

為了推動“讓AI無處不在”的愿景，英特爾在打造AI軟件生態(tài)方面持續(xù)投入，并為行業(yè)內(nèi)一系列全新AI模型提供針對英特爾AI硬件的軟件優(yōu)化。今日，英特爾宣布公司橫跨數(shù)據(jù)中心、邊緣以及客戶端AI產(chǎn)品已面向Meta最新推出的大語言模型（LLM）Llama 3.1進行優(yōu)化，并公布了一系列性能數(shù)據(jù)。

本文引用地址：http://www.ex-cimer.com/article/202407/461396.htm

繼今年4月推出Llama 3之后，Meta于7月24日正式發(fā)布了其功能更強大的AI大模型Llama 3.1。Llama 3.1涵蓋多個不同規(guī)模及功能的全新模型，其中包括目前可獲取的、最大的開放基礎(chǔ)模型——Llama 3.1 405B（4050億參數(shù)）。目前，英特爾豐富的AI產(chǎn)品組合已支持上述最新模型，并通過開放生態(tài)系統(tǒng)軟件實現(xiàn)針對性優(yōu)化，涵蓋PyTorch及英特爾^? PyTorch擴展包（Intel? Extension for PyTorch）、DeepSpeed、Hugging Face Optimum庫和vLLM等。此外，企業(yè)AI開放平臺（OPEA）亦為這些模型提供支持，OPEA這一全新的開放平臺項目是由LF AI & Data基金會發(fā)起，旨在聚合生態(tài)之力，推動創(chuàng)新，構(gòu)建開放、多供應(yīng)商的、強大且可組合的生成式AI解決方案。

Llama 3.1多語言大模型組合包含了80億參數(shù)、700億參數(shù)以及4050億參數(shù)（文本輸入/文本輸出）預(yù)訓(xùn)練及指令調(diào)整的生成式AI模型。其每個模型均支持128k長文本和八種不同的語言。其中，4050億參數(shù)的Llama 3.1模型在基本常識、可操作性、數(shù)學(xué)、工具使用和多語言翻譯方面具有行業(yè)領(lǐng)先的能力。同時，該模型亦幫助開發(fā)者社區(qū)解鎖諸如合成數(shù)據(jù)生成和模型蒸餾（Model Distillation）等全新功能。

以下內(nèi)容展示了英特爾的部分AI產(chǎn)品組合運行Llama 3.1模型的初步性能結(jié)果，包括英特爾?至強?處理器、搭載英特爾?酷睿? Ultra處理器和英特爾銳炫?顯卡的AI PC產(chǎn)品。

運行Llama 3.1時展現(xiàn)出卓越性能

作為通用計算的基石，英特爾^?至強^?處理器為全球用戶提供強大算力，現(xiàn)已通過各大云服務(wù)商面市。英特爾至強處理器在其每個核心中均內(nèi)置了英特爾^?高級矩陣擴展（AMX）AI引擎，可將AI性能提升至新水平。根據(jù)基準測試，在第五代英特爾至強平臺上以1K token輸入和128 token輸出運行80億參數(shù)的Llama 3.1模型，可以達到每秒176 token的吞吐量，同時保持下一個token延遲小于50毫秒。圖1展示了運行支持128k長文本的80億參數(shù)Llama 3.1模型時，下一個token延遲可低于100毫秒。

圖1 基于第五代英特爾^?至強^?可擴展處理器的Llama 3.1推理延遲

由英特爾^?酷睿? Ultra處理器和英特爾銳炫?顯卡驅(qū)動的AI PC可為客戶端和邊緣提供卓越的設(shè)備端AI推理能力。憑借諸如英特爾酷睿平臺上的NPU，以及銳炫顯卡上英特爾^? Xe Matrix Extensions加速等專用的AI硬件，在AI PC上進行輕量級微調(diào)和應(yīng)用定制比以往更加容易。對于本地研發(fā)，PyTorch及英特爾PyTorch擴展包等開放生態(tài)系統(tǒng)框架可幫助加速。而對于應(yīng)用部署，用戶則可使用英特爾OpenVINO?工具包在AI PC上進行高效的模型部署和推理。AI工作負載可無縫部署于CPU、GPU以及NPU上，同時實現(xiàn)性能優(yōu)化。

圖2 在配備內(nèi)置英特爾銳炫?顯卡的英特爾^?酷睿? Ultra 7 165H AI PC上，Llama 3.1推理的下一個token延遲

圖3 在使用英特爾銳炫?A770 16GB限量版顯卡的AI PC上，Llama 3.1推理的下一個token延遲

利用Llama 3.1和OPEA部署企業(yè)RAG解決方案

英特爾AI平臺和解決方案能夠有助于企業(yè)部署AI RAG。作為OPEA的發(fā)起成員之一，英特爾正幫助引領(lǐng)行業(yè)為企業(yè)AI打造開放的生態(tài)系統(tǒng)，同時，OPEA亦助力Llama 3.1模型實現(xiàn)性能優(yōu)化。

基于可組合且可配置的多方合作組件，OPEA為企業(yè)提供開源、標準化、模塊化以及異構(gòu)的RAG流水線（pipeline）。此次測試中，微服務(wù)部署于OPEA藍圖的每一支細分領(lǐng)域中，包括防護（Guardrail）、嵌入（Embedding）、大模型、數(shù)據(jù)提取及檢索。端到端RAG流水線通過Llama 3.1進行大模型的推理及防護，使用BAAI/bge-base-en-v1.5模型進行嵌入，基于Redis向量數(shù)據(jù)庫，并通過Kubernetes（K8s）系統(tǒng)進行編排。

圖4 基于Llama 3.1的端到端RAG流水線，由英特爾Gaudi 2加速器和至強處理器提供支持

目前，英特爾AI PC及數(shù)據(jù)中心AI產(chǎn)品組合和解決方案已面向全新Llama 3.1模型實現(xiàn)優(yōu)化，OPEA亦在基于英特爾至強等產(chǎn)品上全面啟用。未來，英特爾將持續(xù)投入軟件優(yōu)化，支持更多全新的模型與用例。

產(chǎn)品與性能信息

英特爾至強處理器：在第五代英特爾^?至強^?可擴展處理器上測量，使用：2個英特爾至強Platinum 8593Q、64核、超線程開啟、睿頻開啟、NUMA 4、512GB（16x32GB DDR5 5600 MT/s [5600 MT/s]）、BIOS 3B07.TEL2P1、微碼0x21000200、三星SSD 970 EVO Plus 2TB、CentOS Stream 9、5.14.0-437.el9.x86_64、使用PyTorch和IPEX 2.4運行的模型。英特爾于2024年7月22日進行測試。

英特爾^?酷睿? Ultra：在搭載英特爾酷睿Ultra 7 165H平臺的微軟Surface Laptop 6上進行測量，使用32GB LPDDR5 7467Mhz總內(nèi)存、英特爾顯卡驅(qū)動程序101.5762、IPEX-LLM 2.1.0b20240718、Windows 11 Pro版本22631.3593、性能電源策略與核心隔離啟用。英特爾銳炫?顯卡僅適用于部分H系列英特爾?酷睿? Ultra處理器驅(qū)動的系統(tǒng)，且雙通道配置中系統(tǒng)內(nèi)存至少為16GB。需要OEM支持，請咨詢OEM或零售商了解系統(tǒng)配置詳情。英特爾于2024年7月18日進行測試。

英特爾銳炫? A系列顯卡：使用英特爾酷睿i9-14900K、華碩ROG MAXIMUS Z790 HERO主板、32GB (2x 16GB) DDR5 5600Mhz和Corsair MP600 Pro XT 4TB NVMe SSD，對英特爾銳炫A770 16GB限量版顯卡進行測量。軟件配置包括英特爾顯卡驅(qū)動程序101.5762、IPEX-LLM 2.1.0b20240718、Windows 11 Pro版本22631.3593、性能電源策略與核心隔離禁用。英特爾于2024年7月18日進行測試。

免責聲明

性能因使用情況、配置和其他因素而異。欲了解更多信息，請訪問性能指數(shù)網(wǎng)站。性能結(jié)果基于截至所示日期的測試，可能無法反映所有公開可用的更新。請參閱備份以了解配置詳情。沒有任何產(chǎn)品或組件是絕對安全的。您的成本和結(jié)果可能會有所不同。英特爾技術(shù)可能需要啟用硬件、軟件或激活服務(wù)。

AI免責聲明

AI功能可能需要購買軟件、訂閱或由軟件/平臺提供商啟用，或者可能有特定的配置或兼容性要求。結(jié)果可能會有所不同。

<a target='_blank'><img src='https://ad.eepw.com.cn/www/delivery/avw.php?zoneid=114&cb=INSERT_RANDOM_NUMBER_HERE&n=a7a83b30' border='0' alt='' /></a>
<a target='_blank'><img src='https://ad.eepw.com.cn/www/delivery/avw.php?zoneid=115&cb=INSERT_RANDOM_NUMBER_HERE&n=a3d98779' border='0' alt='' /></a>
<a target='_blank'><img src='https://ad.eepw.com.cn/www/delivery/avw.php?zoneid=116&cb=INSERT_RANDOM_NUMBER_HERE&n=abca108c' border='0' alt='' /></a>
<a target='_blank'><img src='https://ad.eepw.com.cn/www/delivery/avw.php?zoneid=117&cb=INSERT_RANDOM_NUMBER_HERE&n=a1775170' border='0' alt='' /></a>
<a target='_blank'><img src='https://ad.eepw.com.cn/www/delivery/avw.php?zoneid=118&cb=INSERT_RANDOM_NUMBER_HERE&n=a449048b' border='0' alt='' /></a>

關(guān)鍵詞： 英特爾 AI解決方案 Meta Llama 3.1

評論

相關(guān)推薦

Meta訓(xùn)練Llama 3遭遇頻繁故障

智能計算 Meta Llama 3 英偉達 H100 顯卡 GPU | 2024-07-29

可控硅三相過零觸發(fā)控制板KJZ6-3電原理圖

設(shè)計方案可控硅三相觸發(fā) 控制板 KJZ6-3 原理 | 2009-07-06

英特爾發(fā)布Quark X1000處理器搶奪物聯(lián)網(wǎng)市場

視頻英特爾 Quark | 2014-02-12

嵌入式圖形界面GUI-1，需要的請排隊！

jackwang | 2002-05-21

Cyclone 與Spartan-3對比

資源下載 altera Cyclone 與Spartan-3 器件對比 | 2007-12-13

英特爾承認13、14代處理器問題大將推出修補程序

消費電子英特爾處理器修補程序 | 2024-07-24

擅自下載被判侵權(quán) 微軟在港贏官司獲償3500萬元

hpnet | 2002-10-11

嵌入式圖形界面GUI-3，需要的請排隊！

jackwang | 2002-05-21

Lattice的3.3伏ispMACH 4000V CPLD上市

hpnet | 2002-08-27

HDMI 1.3規(guī)范

資源下載 High-Definition Multimedia Interface HDMI 1.3規(guī)范 | 2007-12-20

由MIC5156-3.3構(gòu)成的由5V變?yōu)?.3V的穩(wěn)壓器電路

設(shè)計方案 MIC5156-3.3 構(gòu)成穩(wěn)壓器電路 | 2009-07-06

MSP430 IAR 3.42環(huán)境使用指南（中文完整版?。?

資源下載 TI 軟件介紹 MSP430 IAR 3.42環(huán)境 | 2007-11-28

同創(chuàng)ATX-200SE-3型開關(guān)電源(KA7500B) 電路

設(shè)計方案同創(chuàng) ATX-200SE-3 開關(guān)電源 KA7500B 電路 | 2009-07-06

英特爾CPU故障率100％游戲商大崩潰改用AMD

消費電子英特爾 CPU 故障率游戲商 AMD | 2024-07-24

多功能車載酒精測試器

視頻信息技術(shù)大賽單片機 STC15F2K61S2 車載 ADC0832 LCD 傳感器 MQ-3 | 2013-01-18

特斯拉推送 FSD v12.5.1 更新，變道更早、更自然

汽車電子特斯拉 FSD v12.5.1 變道 Cybertruck 輔助駕駛 | 2024-07-29

英特爾整車方案：拓寬汽車制造商利潤提升之路

汽車電子英特爾汽車制造商 | 2024-07-25

過程控制演示

視頻 ADI DAC AD5755-1 | 2012-06-18

英特爾Quark處理器，打通端到端的物聯(lián)網(wǎng)戰(zhàn)略布局

視頻物聯(lián)網(wǎng) 可穿戴設(shè)備智能硬件高峰論壇英特爾 quark | 2015-01-15

英特爾AI解決方案為最新Meta Llama 3.1模型提供加速

智能計算英特爾 AI解決方案 Meta Llama 3.1 | 2024-07-25

PC產(chǎn)業(yè)已跌無可跌 AMD /英特爾季報均未達預(yù)期

hpnet | 2002-10-17

Meta發(fā)布“前沿級”開源AI模型扎克伯格：不怕競爭者使用

智能計算 Meta 開源 AI 模型扎克伯格 | 2024-07-24

IEEE 1149.1-2001 技術(shù)規(guī)范

資源下載 IEEE 標準規(guī)范 IEEE 1149.1-2001 | 2008-01-06

消息稱英特爾挖角臺積電工程師，芯片代工競爭加劇

EDA/PCB 英特爾臺積電 | 2024-07-30

百盛BS-2506-1型ATX開關(guān)電源(TL494) 電路

設(shè)計方案百盛 BS-2506-1 開關(guān)電源 TL494 電路 | 2009-07-06

無線電源傳輸器系統(tǒng)2

視頻 EEPW TI 電源技術(shù) WPC1.1 | 2014-10-14

3-DES算法的FPGA高速實現(xiàn)(Xilinx)

資源下載 Xilinx FPGA 3-DES算法 | 2007-12-13

高通新中端芯片驍龍7s Gen 3曝光：采用Adreno 810 GPU，下月發(fā)布

EDA/PCB 高通中端芯片驍龍7s Gen 3 Adreno 810 GPU | 2024-07-23

全系 E 核 4.6GHz，英特爾 Arrow Lake-S 處理器未鎖頻版頻率曝光

消費電子英特爾 CPU | 2024-07-29

KJZ2-1單相調(diào)功板電原理圖

設(shè)計方案 KJZ2-1 單相調(diào)功板電原理 | 2009-07-06

焦點

推薦視頻

技術(shù)專區(qū)

看屁屁www成人影院,亚洲人妻成人图片,亚洲精品成人午夜在线,日韩在线欧美成人 (function(){ var bp = document.createElement('script'); var curProtocol = window.location.protocol.split(':')[0]; if (curProtocol === 'https') { bp.src = 'https://zz.bdstatic.com/linksubmit/push.js'; } else { bp.src = 'http://push.zhanzhang.baidu.com/push.js'; } var s = document.getElementsByTagName("script")[0]; s.parentNode.insertBefore(bp, s); })();