英特爾因應(yīng)深度學(xué)習(xí)需求 對(duì)Xeon Phi進(jìn)行調(diào)整
軟、硬件共同設(shè)計(jì)趨勢(shì)正在席卷整個(gè)IT部門,不論是資料分析或是機(jī)器學(xué)習(xí),每種工作項(xiàng)目的分工都 將更為精細(xì),硬件廠商也開始針對(duì)軟體設(shè)計(jì)新的產(chǎn)品。為了維系資料中心的市場(chǎng)霸主地位,英特爾(Intel)瞄準(zhǔn)機(jī)器學(xué)習(xí)的特殊需求,將推出代號(hào)為 Knights Mill的多核心處理器。
本文引用地址:http://www.ex-cimer.com/article/201609/296559.htm據(jù)The Next Platform報(bào)導(dǎo),英特爾現(xiàn)有的Knights Landing Xeon Phi芯片可提供雙精度(Double Precision)3.46 teraflop及單精度(Single Precision)6.92 teraflop的尖峰效能,但卻無法像NVIDIA的Pascal GPU提供半精度的運(yùn)算能力,因此在資料量比精度更為重要的機(jī)器學(xué)習(xí)與特定影像、訊號(hào)處理,Knights Landing顯得較為吃虧。
Knights Mill于是后退一步,轉(zhuǎn)而標(biāo)榜支援可變精度,如此一來便能以同樣的硬件及熱足跡(Thermal Footprint),處理更大型的機(jī)器學(xué)習(xí)模型。Knights Mill若以現(xiàn)有的Knights Landing為基礎(chǔ),調(diào)整為16位元半精度,理論上每周期就能處理64半精度運(yùn)算,并能有效將本地MCDRAM存儲(chǔ)器增加至32GB,提升資料訓(xùn)練效 率。
如果英特爾能讓Knights Landing上的76個(gè)核心全部運(yùn)作,并稍稍增加時(shí)脈,就能進(jìn)一步將半精度效能提升至16.8 teraflop,每teraflop的成本也能降至372美元,勝過使用Pascal的Tesla P100。Pascal則是在每瓦效能方面勝出。
不過超大規(guī)模資料中心業(yè)者最關(guān)心的,或許還是每瓦每teraflop的成本。
經(jīng) 過計(jì)算之后,Tesla P100每瓦每teraflop成本為1.65美元,頂級(jí)Xeon Phi 7290為1.84美元,稍低階的Xeon Phi 7250為1.86美元,更低階的Xeon Phi 7230為1.62美元。如果Knights Mill是以Knights Landing為基礎(chǔ)進(jìn)行調(diào)整,在英特爾不收取額外費(fèi)用的情況下,其每瓦每teraflop成本推估為1.24美元。Knights Mill的推出,將對(duì)至今無法大量出貨的Pascal Tesla P100造成嚴(yán)重壓力。
上述推論的前提,都是以Knights Landing作為Knights Mill的技術(shù)基礎(chǔ),而根據(jù)英特爾釋出的資料,Knights Mill的實(shí)際效能將不止于此。
為 提供超大規(guī)模資料中心業(yè)者一個(gè)GPU外的選擇,并滿足超級(jí)電腦中對(duì)于分析、機(jī)器學(xué)習(xí)與模擬的需求,英特爾不斷加快Knights處理器家族的發(fā)展腳步,并 且試圖提升產(chǎn)品的多樣性。此外,英特爾也透過收購填補(bǔ)所有缺口,像是Altera與Nervana Systems即可望在英特爾的深度學(xué)習(xí)發(fā)展上扮演重要角色。
英特爾資料中心總經(jīng)理Diane Bryant指出,目前英特爾已取得97%的機(jī)器學(xué)習(xí)伺服器市場(chǎng),其中Xeon E5是最常被使用在機(jī)器學(xué)習(xí)與深度學(xué)習(xí)的處理器。Bryant并提出,到了2020年,多數(shù)伺服器都將投入資料分析工作。
評(píng)論