全新英特爾(R)至強(qiáng)融核(TM)處理器發(fā)布
英特爾®發(fā)布了其全新一代至強(qiáng)融核™處理器。隨著數(shù)據(jù)量繼續(xù)激增且日益復(fù)雜,業(yè)界需要新的硬件、軟件和架構(gòu)來推動更深刻的洞察的獲取,進(jìn)而加速新的發(fā)現(xiàn)和促進(jìn)業(yè)務(wù)創(chuàng)新,以及推動機(jī)器學(xué)習(xí)和人工智能領(lǐng)域數(shù)據(jù)分析的下一輪演進(jìn)。
本文引用地址:http://www.ex-cimer.com/article/201606/293199.htm
全新英特爾高性能計算和高級分析技術(shù)加速獲取更深刻的洞察
英特爾發(fā)布了其全新一代至強(qiáng)融核處理器。作為英特爾可擴(kuò)展系統(tǒng)框架的基本要素,英特爾至強(qiáng)融核產(chǎn)品家族旨在為易于部署的高性能集群整體解決方案帶來關(guān)鍵的計算引擎。全新一代英特爾®至強(qiáng)融核™處理器正是獲取更深刻洞察的關(guān)鍵。作為英特爾® 可擴(kuò)展系統(tǒng)框架(英特爾®SSF)的基本要素,英特爾®至強(qiáng)融核™產(chǎn)品家族旨在為易于部署的高性能集群整體解決方案帶來關(guān)鍵的計算引擎。
借助英特爾® 至強(qiáng)融核™ 處理器家族1更快速地解決最大挑戰(zhàn)
英特爾至強(qiáng)融核處理器是英特爾首款專門針對高度并行工作負(fù)載而設(shè)計的可獨立自啟動的主處理器,且首次實現(xiàn)了內(nèi)存與高速互聯(lián)技術(shù)的集成。作為可獨立自啟動的 x86 CPU,英特爾至強(qiáng)融核處理器可實現(xiàn)高效擴(kuò)展,而不會像 GPU 加速器等受到 PCIe 總線的限制。通過消除對 PCIe 總線的依賴性,英特爾至強(qiáng)融核處理器與加速器產(chǎn)品相比,可提供更高的可擴(kuò)展性,能應(yīng)對更廣泛的工作負(fù)載和配置。
集成 16GB 高帶寬內(nèi)存,可為內(nèi)存訪問密集型的工作負(fù)載2提供高達(dá) 500 GB/秒的可持續(xù)高內(nèi)存帶寬,此外,雙端口英特爾® Omni-Path 架構(gòu)(英特爾® OPA)還進(jìn)一步降低了解決方案成本、能耗和空間占用率。英特爾至強(qiáng)融核處理器是基于開放標(biāo)準(zhǔn)構(gòu)建的通用 CPU,可有效保障用戶未來的軟件投資。
在廣泛的應(yīng)用和環(huán)境中,從機(jī)器學(xué)習(xí)到高性能計算(HPC),英特爾至強(qiáng)融核產(chǎn)品家族助企業(yè)更快速地解決最具挑戰(zhàn)性的計算問題,同時提供更高的效率和可擴(kuò)展性3。該產(chǎn)品家族還能幫助企業(yè)借助高性能建模以及仿真、可視化和數(shù)據(jù)分析取得新突破。
英特爾至強(qiáng)融核處理器的特性和優(yōu)勢還包括:
高性能:具有多達(dá) 72 個強(qiáng)大的高效內(nèi)核,以及超寬的矢量寬度(英特爾® 高級矢量擴(kuò)展或 AVX-512),從而提高了高度并行計算性能的標(biāo)準(zhǔn)。
高可擴(kuò)展性:提供數(shù)據(jù)中心級 CPU 可擴(kuò)展性和可靠性,以運行高性能工作負(fù)載,例如機(jī)器學(xué)習(xí)中的復(fù)雜神經(jīng)網(wǎng)絡(luò)的快速訓(xùn)練,可擴(kuò)展性及其效率對其至關(guān)重要。
可編程性:提供與英特爾®至強(qiáng)®處理器相同的二進(jìn)制代碼兼容性,從而可支持運行任意 x86 工作負(fù)載。這使數(shù)據(jù)中心的資產(chǎn)利用率達(dá)到最佳,而通用編程模型可借助共享的開發(fā)者社區(qū)群體和代碼復(fù)用提高工作效率。
投資保護(hù):基于通用 x86 CPU 架構(gòu)和開放標(biāo)準(zhǔn)構(gòu)建,支持由各種合作伙伴、編程語言和可用工具組成的廣泛生態(tài)系統(tǒng),從而可實現(xiàn)卓越的靈活性、軟件可移植性和可復(fù)用性。
現(xiàn)在公開發(fā)布的配有英特爾至強(qiáng)融核處理器家族的系統(tǒng),有望在今年9月推出更多選擇。迄今為止,英特爾已發(fā)運了數(shù)萬臺設(shè)備,英特爾預(yù)計今年能總共售出100,000臺以上。該產(chǎn)品家族的廣泛生態(tài)系統(tǒng)支持包括 50 多家原始設(shè)備制造商(OEM)、ISV 和中間件合作伙伴。更多信息敬請登錄:www.intel.com/xeonphi/partners。
全新英特爾高性能計算和高級分析技術(shù)加速獲取更深刻的洞察
英特爾® 至強(qiáng)融核™ 處理器讓機(jī)器學(xué)習(xí)更深入
機(jī)器學(xué)習(xí)需要強(qiáng)大的計算能力來運行復(fù)雜的數(shù)學(xué)算法并處理海量數(shù)據(jù)。面對這些挑戰(zhàn),英特爾通過發(fā)布全新一代英特爾®至強(qiáng)融核™處理器家族拓展了機(jī)器學(xué)習(xí)的技術(shù)范疇。該英特爾®至強(qiáng)融核™處理器 可為機(jī)器學(xué)習(xí)訓(xùn)練模型(training)提供強(qiáng)勁性能,且借助可獨立啟動主處理器的靈活性,它可運行多種分析工作負(fù)載。基于英特爾®可擴(kuò)展系統(tǒng)框架的集群采用了英特爾至強(qiáng)融核處理器和集成英特爾® Omni-Path 高速互聯(lián),可幫助數(shù)據(jù)科學(xué)家大幅降低復(fù)雜的神經(jīng)網(wǎng)絡(luò)的訓(xùn)練時間。在32 節(jié)點的基礎(chǔ)設(shè)施中,英特爾至強(qiáng)融核家族的擴(kuò)展性比 GPU 好1.38倍;在128節(jié)點的基礎(chǔ)設(shè)施中,英特爾至強(qiáng)融核家族將構(gòu)建訓(xùn)練模型的速度加快了50倍。
英特爾至強(qiáng)融核家族是對英特爾®至強(qiáng)™處理器 E5 家族的有力補充,后者則是機(jī)器學(xué)習(xí)領(lǐng)域4部署最廣泛的基礎(chǔ)設(shè)施。英特爾至強(qiáng)處理器 E5 v4 產(chǎn)品家族極其適用于機(jī)器學(xué)習(xí)評分模型(scoring),且可為廣泛數(shù)據(jù)中心工作負(fù)載提供強(qiáng)大性能和重要價值。同時,該英特爾至強(qiáng)處理器家族還可為開發(fā)人員提供一致的用于訓(xùn)練和評分的編程模型,以及可用于高性能計算、數(shù)據(jù)分析和機(jī)器學(xué)習(xí)工作負(fù)載的通用架構(gòu)。
全新英特爾® 可擴(kuò)展系統(tǒng)框架參考架構(gòu)
英特爾® SSF 覆蓋從小型集群到全球最大的超級計算機(jī)的工作負(fù)載,可為計算密集型應(yīng)用、數(shù)據(jù)密集型應(yīng)用、機(jī)器學(xué)習(xí)和可視化提供可擴(kuò)展性和平衡性能。英特爾已發(fā)布了其首款英特爾® SSF 參考架構(gòu),它為經(jīng)過優(yōu)化的 HPC 系統(tǒng)提供推薦的基準(zhǔn)硬件和軟件配置。英特爾 SSF 參考架構(gòu)由兩種參考設(shè)計提供支持,這兩種設(shè)計記錄了 HPC 系統(tǒng)的特殊要求,包括硬件和軟件元素以及安裝和配置說明。該全新的參考架構(gòu)和設(shè)計可幫助系統(tǒng)構(gòu)建人員簡化設(shè)計和驗證流程,還可為最終用戶提供購買指南以便更加全面地獲取英特爾® SSF 的價值,保護(hù)廣泛的軟件應(yīng)用可移植性。該全新參考架構(gòu)和設(shè)計的更多信息,敬請登錄:www.intel.com/SSF.
借助英特爾® HPC Orchestrator 簡化軟件部署
英特爾® HPC Orchestrator 是一種全新的支持產(chǎn)品家族,可通過減少需要的集成、測試和驗證工作來簡化高性能系統(tǒng)軟件堆棧的實施和后續(xù)的持續(xù)維護(hù)。英特爾 HPC Orchestrator 產(chǎn)品預(yù)定于2016年第四季度上市,基于 OpenHPC 社區(qū)軟件,并可提供專業(yè)服務(wù)和技術(shù)支持。作為首款產(chǎn)品,英特爾®HPC Orchestrator - Advanced 是一種模塊化軟件堆棧,可提供定制特性、出色性能、可擴(kuò)展性以及易用性。有關(guān)英特爾® HPC Orchestrator 特性和優(yōu)勢的更多信息請訪問:www.intel.com/hpcorchestrator。
行業(yè)快速采用英特爾 Omni-Path 架構(gòu)
英特爾 Omni-Path 架構(gòu)(英特爾® OPA)是一款全新的端到端高速互聯(lián)解決方案,可針對入門級和大規(guī)模高性能集群經(jīng)濟(jì)高效地提升高性能計算應(yīng)用的性能。英特爾® OPA 的市場采用率正迅速激增,目前市場上已有超過 80,000 個節(jié)點,且眾多系統(tǒng)制造商正大規(guī)模發(fā)運基于英特爾 OPA 的交換機(jī)和服務(wù)器平臺,包括:戴爾*、富士通*、日立*、惠普*、浪潮*、聯(lián)想*、NEC*、Oracle*、Quanta*、SGI*、美超微*、Colfax* 等。
英特爾 OPA 部署的主要成功案例,包括:
美國能源部 CTS-1系統(tǒng)將部署14,500 個節(jié)點的英特爾®OPA (該系統(tǒng)由三個國家級實驗室——勞倫斯利弗莫爾國家實驗室、圣地亞國家實驗室、洛斯阿拉莫斯國家實驗室三方聯(lián)合實施)
意大利Cineca超算中心將部署超過 6,000+ 個節(jié)點的英特爾®OPA
其他客戶包括美國國家核安全局的 Tri Labs、德州高級計算中心、英國赫爾大學(xué)、劍橋大學(xué)、德國Alfred Wegener 研究所和科羅拉多大學(xué)。
更多材料和多媒體信息請訪問:http://www.intel.com/newsroom/isc。
*其他的名稱和品牌可能是其他所有者的資產(chǎn)。
1 英特爾® 至強(qiáng)融核™ 處理器可提供超過 3 Teraflop(每秒萬億次浮點運算)的雙精度性能,遠(yuǎn)快于英特爾® 至強(qiáng)融核™ 處理器 x100 家族的 1 Teraflop 以上雙精度性能。
2資料來源:英特爾使用 STREAM Triad 性能指標(biāo)評測測量了英特爾® 至強(qiáng)融核™ 處理器 7250 的性能(以 GB/秒計),截至 2016 年 3 月。
3 相比單節(jié)點,128 節(jié)點實現(xiàn)了 50 倍的訓(xùn)練速度提升,基于 AlexNet* 拓?fù)涔ぷ髫?fù)載(批量大小 = 1024),在運行單節(jié)點英特爾至強(qiáng)融核處理器 7250(16 GB MCDRAM,1.4 GHz,68 核)的英特爾® 服務(wù)器系統(tǒng) LADMP2312KXXX41 中使用大型圖像數(shù)據(jù)庫,96GB DDR4-2400 MHz,四集群模式,MCDRAM 平面內(nèi)存模式,Red Hat Enterprise Linux* 6.7 (Santiago),1.0 TB SATA 硬盤 WD1003FZEX-00MK2A0 系統(tǒng)磁盤,運行英特爾® Optimized DNN Framework。有關(guān)如何獲取二進(jìn)制的更多信息,請聯(lián)系您的英特爾代表。節(jié)點數(shù)量為 32 時擴(kuò)展效率提升多達(dá) 38%,基于 GoogLeNet 深度學(xué)習(xí)圖像分類訓(xùn)練拓?fù)?,使用大型圖像數(shù)據(jù)庫,將使用上述配置、英特爾® Optimized DNN Framework(87% 的能效)的單節(jié)點英特爾至強(qiáng)融核處理器 7250(16 GB MCDRAM,1.4 GHz,68 核)與各自運行 32 節(jié)點的 NVIDIA Tesla* K20 GPU(62% 的能效)的未知主機(jī)進(jìn)行了比較。http://arxiv.org/pdf/1511.00175v2.pdf)
4 英特爾估計基于英特爾至強(qiáng) E5 處理器內(nèi)部銷售數(shù)據(jù)和客戶反饋
在性能檢測過程中涉及的軟件及其性能只有在英特爾微處理器的架構(gòu)下方能得到優(yōu)化。諸如 SYSmark 和 MobileMark 等測試均系基于特定計算機(jī)系統(tǒng)、硬件、軟件、操作系統(tǒng)及功能,上述任何要素的變動都有可能導(dǎo)致測試結(jié)果的變化。請參考其它信息及性能測試(包括結(jié)合其它產(chǎn)品使用時的運行性能)以對目標(biāo)產(chǎn)品進(jìn)行全面評估。更多信息敬請登錄http://www.intel.com/performance。
英特爾處理器標(biāo)號不是性能的指標(biāo)。處理器標(biāo)號僅用于區(qū)分同屬一個家族的處理器的特性,而不能夠用于區(qū)分不同家族的處理器。如欲了解更多信息,請訪問 http://www.intel.com/performance 。
英特爾技術(shù)的特性和優(yōu)勢取決于系統(tǒng)配置,并需要兼容的硬件、軟件或需要激活服務(wù)。實際性能會因您使用的具體系統(tǒng)配置的不同而有所差異。沒有一項計算機(jī)系統(tǒng)可以提供所有運行環(huán)境下的絕對安全。描述的成本降低方案旨在作為舉例,說明指定的英特爾架構(gòu)產(chǎn)品在特定環(huán)境和配置下,可能如何影響未來的成本和提供成本節(jié)省。環(huán)境將有所不同。英特爾不保證任何成本或成本降低。
所有日期和產(chǎn)品僅用于規(guī)劃目的,可隨時更改,恕不另行通知。
各性能指標(biāo)評測的相對性能計算規(guī)則為:將第一個被測試平臺的實際性能指標(biāo)評測結(jié)果賦值為 1.0,作為計算基礎(chǔ),之后將其它性能指標(biāo)評測結(jié)果與其進(jìn)行比較。其余被測平臺的相對性能的計算規(guī)則為:用基準(zhǔn)平臺的實際性能指標(biāo)評測結(jié)果去除其它各平臺的具體性能指標(biāo)評測結(jié)果,并賦予它們一個與所報告的性能改進(jìn)相關(guān)的相對性能值。
評論