賦能開(kāi)發(fā)者,英特爾發(fā)布o(jì)neAPI 2022工具包
英特爾發(fā)布了oneAPI 2022工具包。此次發(fā)布的最新增強(qiáng)版工具包擴(kuò)展了跨架構(gòu)開(kāi)發(fā)的特性,為開(kāi)發(fā)者提供更強(qiáng)的實(shí)用性和更豐富的架構(gòu)選擇,用以加速計(jì)算。
英特爾公司首席技術(shù)官、高級(jí)副總裁、軟件和先進(jìn)技術(shù)事業(yè)部總經(jīng)理 Greg Lavender表示:“我十分敬佩oneAPI軟件工程團(tuán)隊(duì)所完成的900多項(xiàng)技術(shù)改進(jìn),這些技術(shù)改進(jìn)加速了關(guān)鍵應(yīng)用工作負(fù)載在英特爾的客戶端和服務(wù)器CPU和GPU上的開(kāi)發(fā)時(shí)間和性能。深度技術(shù)創(chuàng)新的豐富oneAPI套組符合關(guān)鍵的行業(yè)標(biāo)準(zhǔn),讓應(yīng)用程序開(kāi)發(fā)者能獲得從云到邊緣更出色的運(yùn)行性能。今天發(fā)布的oneAPI 2022版本,已準(zhǔn)備好多語(yǔ)言支持和跨架構(gòu)性能加速,以進(jìn)一步提高英特爾平臺(tái)上程序員的生產(chǎn)力。”
新功能包括第一款能執(zhí)行C++、SYCL和Fortran的統(tǒng)一編譯器,用于CPU和GPU的Data Parallel Python,先進(jìn)的加速器性能建模和調(diào)試,以及用于AI和光線追蹤可視化工作負(fù)載的性能加速。oneAPI跨架構(gòu)編程模型為開(kāi)發(fā)者提供了工具,旨在構(gòu)建跨架構(gòu)應(yīng)用程序時(shí)提高代碼開(kāi)發(fā)的效率和速度的工具。
據(jù)Evans Data的調(diào)查顯示,40%的開(kāi)發(fā)者需要在異構(gòu)系統(tǒng)上使用一種以上的處理器、處理器內(nèi)核或協(xié)處理器[1]。oneAPI正在推動(dòng)跨CPU、GPU、FPGA及其他加速器的異構(gòu)構(gòu)造中的跨架構(gòu)計(jì)算創(chuàng)新,加速其步伐。跨架構(gòu)計(jì)算創(chuàng)新需要軟件將其中要素組合成一個(gè)完整的解決方案。oneAPI讓開(kāi)發(fā)者可以自由地為特定解決方案選擇最佳硬件,而無(wú)需承擔(dān)專有編程模型的經(jīng)濟(jì)和技術(shù)負(fù)擔(dān)。
2022年英特爾? oneAPI工具包通過(guò)一套完整的先進(jìn)工具,包括編譯器、庫(kù)、預(yù)優(yōu)化框架、分析器和調(diào)試器,提供性能和生產(chǎn)力。自去年以來(lái),增加了超過(guò)900個(gè)新的、增強(qiáng)的功能,加強(qiáng)了基礎(chǔ)和特定領(lǐng)域工具包中的每一個(gè)工具。新版本現(xiàn)可在英特爾? DevCloud中免費(fèi)下載或使用。
跨架構(gòu)編程
● 英特爾創(chuàng)建了世界領(lǐng)先的統(tǒng)一編譯器,使用通用的LLVM后端實(shí)現(xiàn)用于CPU和GPU的C++、SYCL和Fortran。
● 在CPU和GPU上對(duì)目前最流行的編程語(yǔ)言Python進(jìn)行加速計(jì)算。
● 英特爾? DPC++兼容性工具得到完善,可以將90%至95%的CUDA代碼自動(dòng)遷移到SYCL/DPC++。[2]
在最新硬件上的性能
● 硬件支持:英特爾Intel oneAPI工具包進(jìn)行了優(yōu)化,以支持最新和即將推出的新硬件的先進(jìn)功能,包括具備AVX-VNNI的第12代英特爾?酷睿?處理器,具備英特爾?高級(jí)矩陣擴(kuò)展(AMX)的下一代英特爾? 至強(qiáng)? 可拓展處理器,代號(hào) Sapphire Rapids,以及即將推出的Xe客戶端和數(shù)據(jù)中心GPU。
● AI性能優(yōu)化
o 憑借最新的英特爾?TensorFlow優(yōu)化版和英特爾?PyTorch優(yōu)化版,深度學(xué)習(xí)框架性能比早期版本提速10倍。[3]
o 全新英特爾?Scikit-learn擴(kuò)展包(Intel? Extension for Scikit-learn)在英特爾CPU上的機(jī)器學(xué)習(xí)算法相比現(xiàn)有開(kāi)源版本提速超過(guò)100倍。[4]
o 推出英特爾?神經(jīng)網(wǎng)絡(luò)壓縮器(Intel? Neural Compressor),通過(guò)跨多個(gè)深度學(xué)習(xí)框架訓(xùn)練后的優(yōu)化技術(shù)來(lái)提高推理性能。
提升開(kāi)發(fā)生產(chǎn)力的先進(jìn)工具
● 針對(duì)CPU及加速器的專業(yè)性能分析 :英特爾?VTune? Profiler的Flame Graph顯示有助于提高性能熱點(diǎn)可視化能力。英特爾?Advisor的加速器性能建模使得開(kāi)發(fā)者可以在修改代碼前評(píng)估卸載到GPU的性能優(yōu)勢(shì)。
● 為先進(jìn)光線追蹤技術(shù)包括錐體遙測(cè),輔助特征降噪和FP16在內(nèi)的新功能提供支持,提供更強(qiáng)大的形狀并縮短渲染時(shí)間,以提高整體渲染性能。同時(shí),為即將發(fā)布的英特爾Xe GPU實(shí)時(shí)去噪提供支持,并進(jìn)一步提高業(yè)界領(lǐng)先、最終幀、產(chǎn)品化質(zhì)量的渲染效果。
● 擴(kuò)展了開(kāi)發(fā)環(huán)境的支持范圍,包括更深層次的Microsoft Visual Studio Code集成、支持Microsoft Visual Studio 2022和適用于Linux開(kāi)發(fā)的Windows子系統(tǒng)Microsoft WSL2。
關(guān)于英特爾? oneAPI工具包:英特爾oneAPI工具包提供了為英特爾CPU、GPU和FPGA等開(kāi)發(fā)高性能跨架構(gòu)應(yīng)用程序和解決方案所需的工具。oneAPI的組合工具包(基本工具包和特定領(lǐng)域的附加組件)簡(jiǎn)化了編程,幫助開(kāi)發(fā)者提高生產(chǎn)力并提供出色性能,加速創(chuàng)新。這些工具包包括用于高性能異構(gòu)計(jì)算的先進(jìn)優(yōu)化編譯器、庫(kù)、框架和分析工具,實(shí)現(xiàn)了oneAPI規(guī)范并與優(yōu)化工具協(xié)同工作。
關(guān)于oneAPI:oneAPI提供一個(gè)開(kāi)放、統(tǒng)一的跨架構(gòu)編程模型,旨在簡(jiǎn)化跨多架構(gòu)的開(kāi)發(fā)過(guò)程(如CPU、GPU、FPGA、其他加速器)。oneAPI讓開(kāi)發(fā)者在一個(gè)開(kāi)放、基于標(biāo)準(zhǔn)的編程環(huán)境中,打破基于單個(gè)廠商的封閉式編程模型的限制,為加速計(jì)算提供出色性能,并且允許代碼持續(xù)迭代。
注意事項(xiàng)與免責(zé)聲明
[1] Evan Data2020年全球發(fā)展調(diào)查第2卷
[2] 英特爾?DPC++兼容性工具工作流遷移:英特爾預(yù)估,截止至2021年9月?;趯?duì)一組 70 個(gè) HPC 基準(zhǔn)測(cè)試和樣本的測(cè)量值,例如 Rodinia、SHOC、PENNANT 遷移到Data Parallel C++ (DPC++)。結(jié)果可能會(huì)有所不同。
[3] 加速你的AI Today解決方案摘要,英特爾,2021
[4] 新的第三代英特爾?至強(qiáng)?可擴(kuò)展處理器通過(guò)Scikit-learn的英特爾?擴(kuò)展展示了機(jī)器學(xué)習(xí)性能的領(lǐng)先地位,英特爾,2021
性能因使用、配置和其他因素而異。
性能結(jié)果基于配置中顯示的日期進(jìn)行測(cè)試,且可能并未反映所有公開(kāi)可用的安全更新。詳細(xì)配置請(qǐng)參見(jiàn)備份。
沒(méi)有任何產(chǎn)品或組件是絕對(duì)安全的。
實(shí)際成本與測(cè)試結(jié)果可能有所差異。
英特爾技術(shù)可能需要啟用硬件、軟件或服務(wù)來(lái)激活。
英特爾公司不控制或?qū)徍说谌焦镜臄?shù)據(jù)。您應(yīng)該咨詢其他來(lái)源以評(píng)估準(zhǔn)確性。
? 英特爾公司。 英特爾、英特爾logo、至強(qiáng)、酷睿、VTune、OpenVINO及其他英特爾標(biāo)識(shí)是英特爾公司或其分支機(jī)構(gòu)的商標(biāo)。
文中涉及的其它名稱及品牌屬于各自所有者資產(chǎn)。
評(píng)論