英特爾公布代號(hào)Arctic Sound-M數(shù)據(jù)中心GPU的更多細(xì)節(jié)
英特爾?至強(qiáng)?可擴(kuò)展處理器是面向云游戲、多媒體處理與傳輸、虛擬桌面基礎(chǔ)架構(gòu)和推理運(yùn)算的處理器標(biāo)桿,致力于為當(dāng)今的媒介消費(fèi)提供鼎力支持。隨著當(dāng)前工作負(fù)載密度和復(fù)雜程度的快速增長,以上每個(gè)細(xì)分領(lǐng)域都將提出不同的工作負(fù)載需求,包括從處理像素、推理和分析、到渲染新的畫面內(nèi)容,再到將這些像素輸出至客戶端設(shè)備進(jìn)行查看或進(jìn)一步分析。然而,目前這些工作都是通過在云端的各個(gè)獨(dú)立產(chǎn)品來完成的。
本文引用地址:http://www.ex-cimer.com/article/202205/434042.htm在本屆英特爾 On 產(chǎn)業(yè)創(chuàng)新峰會(huì)(Intel Vision)上,英特爾分享了其代號(hào)為 Arctic Sound-M(ATS-M)的數(shù)據(jù)中心 GPU 的更多細(xì)節(jié)。ATS-M 是一顆支持高質(zhì)量轉(zhuǎn)碼和高性能的強(qiáng)大 GPU,能夠提供每秒 150 萬億次運(yùn)算(150 TOPS),共擁有兩種配置。ATS-M 能夠通過單一解決方案靈活地處理廣泛的工作負(fù)載,并在不犧牲性能或者質(zhì)量的同時(shí),優(yōu)化總體擁有成本(TCO)。
面向數(shù)據(jù)中心工作負(fù)載的多用途GPU
該英特爾數(shù)據(jù)中心 GPU 將包含兩種不同的配置。150W 功率版本在一個(gè)3/4長、全高尺寸的 PCIe 4.0 加速卡中封裝了 32 個(gè) Xe 內(nèi)核。75W 功率版本則在半高尺寸的 PCIe 4.0 加速卡中封裝了兩顆具有 8 個(gè) Xe 內(nèi)核的 GPU,共 16 個(gè) Xe 內(nèi)核。這兩種配置均配備了 4 個(gè) Xe 媒體引擎、英特爾首款面向數(shù)據(jù)中心的 AV1 硬件編碼器和加速器、GDDR6 內(nèi)存、光線追蹤單元和內(nèi)置 XMX AI 加速。
采用開源軟件的行業(yè)領(lǐng)先數(shù)據(jù)中心GPU
該英特爾數(shù)據(jù)中心 GPU 由完整的解決方案堆棧支持,為開發(fā)者提供了面向流媒體、云游戲和云端推理的開源軟件堆棧,并廣泛支持 AVC、HEVC、VP9,以及更多 API、框架和最新的編解碼器。
oneAPI 為加速計(jì)算提供了高效、智能的路徑,讓開發(fā)者免受專有編程模型所帶來的經(jīng)濟(jì)和技術(shù)負(fù)擔(dān)。它為專用硬件的封閉編程語言供了開放的選擇,即通過一套完整、可靠的工具包來完善現(xiàn)有編程語言和并行計(jì)算模型,從而釋放硬件的全部性能,并且能夠讓開發(fā)者設(shè)計(jì)出開放、可移植的代碼,更大限度地利用多種 CPU 和 GPU 的組合。
云游戲
全球云游戲市場呈現(xiàn)持續(xù)快速增長趨勢,預(yù)計(jì)到2026年,其復(fù)合年增長率(CAGR)將達(dá)到 43.2%,市值將近 32 億美元[1]。英特爾可為 Windows 和 Android 云游戲平臺(tái)提供支持,為廣大玩家?guī)砀咂焚|(zhì)的游戲體驗(yàn)。ATS-M 擁有兩種不同的產(chǎn)品外形設(shè)計(jì),用戶可靈活地選擇符合他們特定工作負(fù)載的產(chǎn)品配置。無論用戶對峰值性能、高密度提出需求,還是期待通過一個(gè)平臺(tái)滿足跨智能手機(jī)和 PC 游戲的融合云游戲解決方案,這款 GPU 均可以提供出色的游戲串流體驗(yàn)。
全堆棧媒體流支持
該GPU配備了英特爾首款基于硬件加速的 AV1 編碼器,可在不犧牲質(zhì)量的同時(shí),帶來 30%[2]比特率的提升。[3]作為引領(lǐng)新一代媒體串流的 GPU,它可實(shí)現(xiàn)一卡同時(shí)處理多達(dá) 8 路 4K 視頻流或超過30 路 1080p 視頻流。在一臺(tái) 4 卡服務(wù)器中,可以實(shí)現(xiàn)每節(jié)點(diǎn)處理 120 路視頻流以及每機(jī)架處理 13,000 路視頻流。
利用 Intel? oneVPL,媒體串流和傳輸軟件堆棧可以面向包括 AV1 在內(nèi)的所有主流編解碼器進(jìn)行解碼和編碼加速。流媒體發(fā)行商可以在 FFmpeg 或 GStreamer 這兩大領(lǐng)先多媒體處理框架中進(jìn)行選擇,它們均可通過 oneVPL 針對英特爾 CPU 和 GPU 進(jìn)行加速。英特爾還提供了開放視覺云(Open Visual Cloud),這是一套用于媒體、分析、圖形和沉浸式媒體的開源軟件堆棧,它針對云原生部署進(jìn)行了優(yōu)化,使其能夠在 FFmpeg 和 GStreamer 框架內(nèi)運(yùn)行。
全堆棧虛擬桌面基礎(chǔ)架構(gòu)支持(VDI)
過去兩年,隨著遠(yuǎn)程辦公需求的增加,虛擬桌面基礎(chǔ)架構(gòu)(VDI)和設(shè)備即服務(wù)(DaaS)迎來了快速增長(最近一項(xiàng)研究表明增長超過 11%[4])?,F(xiàn)代操作系統(tǒng)和應(yīng)用程序?qū)D形處理的要求越來越高,顯示器的分辨率也隨之提高;GPU 可以通過承載渲染和編碼功能,以更短的響應(yīng)時(shí)間和更高的幀率來改善用戶體驗(yàn)。由此釋放出來的 CPU 處理能力可以帶來應(yīng)用程序工作負(fù)載的性能提升。
英特爾的這款數(shù)據(jù)中心 GPU 還提供了靈活的虛擬 GPU(vGPU)調(diào)度策略(固定的、靈活的以及硬件利用率優(yōu)化過的時(shí)間片任務(wù)調(diào)度器),讓管理員能夠單獨(dú)微調(diào) GPU 上每個(gè)虛擬機(jī)的運(yùn)行指令。目前,其他廠商的產(chǎn)品僅允許在所有虛擬機(jī)的全局設(shè)置中進(jìn)行相關(guān)調(diào)整。
與目前市面上其他產(chǎn)品不同的是,英特爾不會(huì)針對基于硬件的可擴(kuò)展 I/O 虛擬化(SIOV)額外收取任何軟件授權(quán)費(fèi),這將有助于相關(guān)提供商降低虛擬化部署的總成本。
全堆棧媒體分析支持
每個(gè)在視覺媒體場景執(zhí)行的推理都需先經(jīng)過視頻解碼和預(yù)處理,然后才能交給 AI 模型進(jìn)行下一步操作。集成兩顆 GPU 的 75W 功率版本 ATS-M 能夠在計(jì)算和解碼能力上實(shí)現(xiàn)很好的平衡,且不受媒體限制。因此,它能夠針對媒體分析類的工作負(fù)載提供良好的擴(kuò)展性,為客戶提供更高的流密度和更低的成本。
在使用 oneVPL 對于視頻流的解碼和編碼進(jìn)行加速的同時(shí),oneDNN(oneAPI 深度神經(jīng)網(wǎng)絡(luò)庫)可針對內(nèi)核進(jìn)行 AI 優(yōu)化,加速面向 TensorFlow 或 PyTorch 框架的推理模型;也可通過 OpenVINO 的模型優(yōu)化器和推理引擎,進(jìn)一步加速推理以及客戶工作負(fù)載的部署。上述 AI 和媒體軟件以及堆棧的組合可以在至強(qiáng)處理器和英特爾數(shù)據(jù)中心 GPU 之間無縫運(yùn)行。
代號(hào)為 Arctic Sound-M 的英特爾數(shù)據(jù)中心 GPU 已經(jīng)獲得超過 15 款來自業(yè)界領(lǐng)先合作伙伴的設(shè)計(jì),并將于 2022 年第三季度發(fā)布。
##
注意事項(xiàng)與免責(zé)聲明:
實(shí)際性能受使用情況、配置和其他因素的差異影。更多信息請?jiān)L問:www.Intel.com/PerformanceIndex。
性能結(jié)果基于配置信息中顯示的日期進(jìn)行測試,且可能并未反映所有公開可用的更新。配置詳情見備用信息。沒有任何產(chǎn)品或組件能夠保證絕對安全。
您的成本和結(jié)果可能有所不同。
2GPU 質(zhì)量數(shù)據(jù)由英特爾于 2022 年 2 月 9 日在試驗(yàn)生產(chǎn)的英特爾數(shù)據(jù)中心 GPU(150)上取得,配置為 IFWI ATS_M1_512_B0_EU_008_IFWI_21WW50_01_GS1463_PC9446A_HEADLESS_OP1040_P2SB_DS_14GT_LRG_TR_DS,1 節(jié)點(diǎn)雙插槽第三代英特爾?至強(qiáng) Gold 6336Y 微代碼 0x11,服務(wù)器主板(Coyote pass)客戶參考號(hào) 128GB 32-ch 3200 MT/sec,HT 啟用,睿頻加速開啟,Ubuntu 20.04 LT2 內(nèi)核 5.10.54,gfx-driver-master-10017,試驗(yàn)生產(chǎn)FFMPEG。CPU 質(zhì)量數(shù)據(jù)由英特爾于 2022 年 2 月 9 日在Intel SawTooth Pass Server 上取得,配置為 1 節(jié)點(diǎn)雙插槽英特爾?至強(qiáng)? Platinum 8180 CPU @ 2.50GHz,HT 啟用,睿頻加速開啟,CPU 微代碼 0x4D,Windows 10 Enterprise LTSC 64位操作系統(tǒng),240GB 15-ch,DDR4-2666 DRAM。命令行參見預(yù)發(fā)布版本https://github.com/intel/media-delivery。 用27個(gè)播放/游戲序列的 TU1 (質(zhì)量模式)收集“2 秒延遲”的數(shù)據(jù),詳情請參見https://dgpu-docs.intel.com/devices/iris-xe-max-graphics/guides/media.html,使用 VBENCH 序列收集的“超低延遲”數(shù)據(jù),詳情請參見 http://arcade.cs.columbia.edu/vbench。PSNRY-BDRATE質(zhì)量指標(biāo)與在英特爾至強(qiáng) 6336Y上測量的x264-medium(PSNR 調(diào)優(yōu), 1-pass)相比。
所有產(chǎn)品計(jì)劃和路線圖可能隨時(shí)更改,恕不另行通知。
英特爾不控制或?qū)徍说谌綌?shù)據(jù)。在評估數(shù)據(jù)準(zhǔn)確性時(shí),請參考其他信息源。
英特爾技術(shù)可能需要已啟用的硬件、軟件或激活服務(wù)。
本文中有關(guān)未來計(jì)劃或預(yù)期的陳述均為前瞻性陳述。此類陳述基于當(dāng)前的預(yù)期,涉及若干風(fēng)險(xiǎn)和不確定,并可能導(dǎo)致實(shí)際結(jié)果與這些前瞻性陳述中明示或隱含的內(nèi)容之間存在重大差異。欲進(jìn)一步了解有關(guān)可能導(dǎo)致實(shí)際結(jié)果出現(xiàn)重大差異的因素,請參見我們最近發(fā)布的收益報(bào)告和美國證券交易委員會(huì)文件,網(wǎng)站:www.intc.com
?英特爾公司,英特爾、英特爾logo及其它英特爾標(biāo)識(shí),是英特爾公司或其分支機(jī)構(gòu)的商標(biāo)。文中涉及的其它名稱及品牌屬于各自所有者資產(chǎn)。
[1] 《對2026年全球云游戲市場的洞見——包括英特爾、谷歌和微軟等公司》——《調(diào)查與市場》,2022年1月4日。https://www.globenewswire.com/news-release/2022/01/24/2371478/28124/en/Insights-on-the-Cloud-Gaming-Global-Market-to-2026-Featuring-Intel-Google-and-Microsoft-Among-Others.html
[2] 基于主張與免責(zé)聲明下的性能
[3] H.264/AVC聲明根據(jù)https://engineering.fb.com/2018/04/10/video-engineering/av1-beats-x264-and-libvpx-vp9-in-practical-use-case/.
[4] https://www.gminsights.com/industry-analysis/virtual-desktop-infrastructure-vdi-market?gclid=EAIaIQobChMIyKDg3bLD9wIVF5BoCR2P1gbvEAAYAiAAEgK7YfD_BwE
評論