<meter id="pryje"><nav id="pryje"><delect id="pryje"></delect></nav></meter>

<label id="pryje"></label>

新聞中心

EEPW首頁(yè) > 嵌入式系統(tǒng) > 業(yè)界動(dòng)態(tài) > 【E問(wèn)E答】英特爾的CPU+FPGA能否打敗谷歌TPU？

【E問(wèn)E答】英特爾的CPU+FPGA能否打敗谷歌TPU？

作者：時(shí)間：2017-04-13 來(lái)源：網(wǎng)絡(luò)

加入技術(shù)交流群
- 掃碼加入
  和技術(shù)大咖面對(duì)面交流
  海量資料庫(kù)查詢

收藏

　　近日，英特爾宣布與科大訊飛達(dá)成技術(shù)合作，共同優(yōu)化在機(jī)器學(xué)習(xí)與深度學(xué)習(xí)領(lǐng)域的離線訓(xùn)練與在線預(yù)測(cè)，并在上周舉辦電博會(huì)上進(jìn)行了展示。本文是網(wǎng)易智能對(duì)英特爾技術(shù)專家與科大訊飛深度學(xué)習(xí)平臺(tái)研發(fā)總監(jiān)張致江的采訪，值得一讀。

本文引用地址：http://www.ex-cimer.com/article/201704/346533.htm

　　英特爾AI芯片技術(shù)布局：CPU+FPGA

　　據(jù)了解，2016年11月，英特爾和訊飛簽署了一個(gè)為期是三年的人工智能技術(shù)合作框架。英特爾與科大訊飛的技術(shù)合作涵蓋了深度學(xué)習(xí)的完整流程，包括數(shù)據(jù)采集，離線訓(xùn)練(Traning)，在線預(yù)測(cè)(Inferencing)，采集新數(shù)據(jù)組，進(jìn)行新的離線訓(xùn)練。

　　機(jī)器學(xué)習(xí)/深度學(xué)習(xí)中最重要的技術(shù)是離線訓(xùn)練和在線推理。針對(duì)離線訓(xùn)練，英特爾和訊飛主要是針對(duì)現(xiàn)在的KNL和即將要發(fā)布的KNM來(lái)提升訊飛在深度學(xué)習(xí)平臺(tái)的性能?？拼笥嶏w深度學(xué)習(xí)平臺(tái)研發(fā)總監(jiān)張致江表示，英特爾下一代的處理器KNL和KNM這方面去做這樣的事情效果非常好，目前在這個(gè)上面做的跟主流的深度學(xué)習(xí)處理方案水平相差很小，同時(shí)下一代的KNL、KNM因?yàn)橛泻艽蟮娘@存、編程的特性，未來(lái)可能考慮用這種方案去做平臺(tái)建設(shè)。張致江稱，現(xiàn)在主流的一些加速方案可能會(huì)限制整個(gè)計(jì)算的memory，而KNL、KNM實(shí)際上是打破了這樣一個(gè)限制。

　　在線推理方面，主要是用英特爾的FPGA技術(shù)。張致江稱，在線預(yù)測(cè)傳統(tǒng)的方法基本上都是用CPU的方式去做這樣的事情，但是隨著業(yè)務(wù)量的增長(zhǎng)整個(gè)服務(wù)器的數(shù)量也是隨著線性增長(zhǎng)的，成本太高。張致江稱，我們?cè)谟肅PU加FPGA的方案去做的時(shí)候，一臺(tái)服務(wù)器里面就插了一張F(tuán)PGA的加速處理器，整個(gè)性能是遠(yuǎn)遠(yuǎn)超過(guò)于兩臺(tái)甚至三臺(tái)、四臺(tái)CPU機(jī)器的性能，成本也會(huì)降低很多。

　　也就是說(shuō)，英特爾將人工智能芯片的技術(shù)路徑分為離線訓(xùn)練與在線推理兩方面，針對(duì)離線訓(xùn)練會(huì)主推至強(qiáng)融核KNL/KNM處理器(KNM尚未上市)，特點(diǎn)是針對(duì)單精度操作進(jìn)行了優(yōu)化，支持自啟動(dòng)，能夠獨(dú)立運(yùn)行操作系統(tǒng)和應(yīng)用軟件，內(nèi)置片上內(nèi)存，直接通過(guò)內(nèi)存控制器從DDR4內(nèi)存讀取數(shù)據(jù)到處理器緩存，對(duì)行業(yè)標(biāo)準(zhǔn)的開(kāi)源深度學(xué)習(xí)框架進(jìn)行了優(yōu)化。在線預(yù)測(cè)階段，英特爾主推至強(qiáng)CPU+Arria10FPGA的方案，聲稱可以實(shí)現(xiàn)低延遲高通量在線處理，因?yàn)橛⑻貭朅10FPGA原生支持并行多通道任務(wù)處理，超過(guò)1500個(gè)單精度浮點(diǎn)計(jì)算單元會(huì)同片上/本地存儲(chǔ)提供穩(wěn)定的低處理遲延，成本更低。

　　基于CPU+FPGA，能替代GPU嗎?

　　英特爾人工智能事業(yè)部(AIPG)首席技術(shù)官Amir Khosrowshahi在最近接受媒體采訪時(shí)表示，目前所使用GPU太低級(jí)了，半導(dǎo)體行業(yè)需要構(gòu)建全新的神經(jīng)網(wǎng)絡(luò)架構(gòu)。Khosrowshahi認(rèn)為，在執(zhí)行圖形渲染過(guò)程中輔助圖形處理單元的部分功能是沒(méi)有必要的，比如大容量緩存，頂點(diǎn)處理，渲染和紋理等等，從能源利用率上考慮也產(chǎn)生了相當(dāng)高的成本。Khosrowshahi稱，“神經(jīng)網(wǎng)絡(luò)則相當(dāng)簡(jiǎn)單，利用小巧的矩陣乘法和非線性就能直接創(chuàng)建半導(dǎo)體來(lái)實(shí)現(xiàn)GPU的功能，而且你所創(chuàng)建的半導(dǎo)體非常忠誠(chéng)于神經(jīng)網(wǎng)絡(luò)架構(gòu)，顯然這是GPU所無(wú)法給予的?！?/p>

　　而CPU+FPGA的優(yōu)勢(shì)在于，對(duì)于開(kāi)發(fā)人員CPU的編程是相對(duì)比較容易的。如果說(shuō)是用CPU加另外一個(gè)企業(yè)的加速處理器，往往這個(gè)加速處理器跟CPU不是編程體系或者不是一個(gè)優(yōu)化體系，那么就要選另外一套優(yōu)化體系。張致江稱，如果你不是學(xué)計(jì)算機(jī)專業(yè)的，這相當(dāng)于另外一個(gè)，它是一個(gè)異構(gòu)體系，你去優(yōu)化這個(gè)異構(gòu)體系的性能，實(shí)際上還是非常吃力的，它甚至跟CPU完全不一樣。英特爾出了KNL、KNM這樣的東西，你在CPU上寫(xiě)的程序直接放上去就可以了，只要再學(xué)習(xí)一點(diǎn)點(diǎn)優(yōu)化方法效率就能很好，所以我覺(jué)得這個(gè)接受程度會(huì)更高。

　　但顯然，GPU是占了先機(jī)的，NVIDIA的方案是目前人工智能的主流。張致江坦言，人工智能剛剛興起也就是這幾年，剛剛興起之初業(yè)內(nèi)很多人都是用GPU這個(gè)方案去做的，但是AI有自己的一些計(jì)算特點(diǎn)，這時(shí)候我們就看了KNL和FPGA，我們做的KNL、FPGA不能說(shuō)是比它多好或者比它差，它是兩種不同應(yīng)用領(lǐng)域的東西，有擅長(zhǎng)、有適合的地方，GPU有些地方走的時(shí)間比較早一點(diǎn)，可能它的庫(kù)各方面會(huì)成熟一些。因?yàn)镕PGA的原因，在編程方式各方面更加容易，會(huì)更加適合這樣一些特殊應(yīng)用場(chǎng)景的需求。

　　英特爾技術(shù)專家認(rèn)為，F(xiàn)PGA最初是用在通訊領(lǐng)域，在英特爾收購(gòu)的Altera這家公司出的這一代產(chǎn)品，當(dāng)時(shí)很多人普遍認(rèn)為他們出的這一代東西不是很好，為什么不是很好呢?是因?yàn)樵谕ㄓ嶎I(lǐng)域另外一些發(fā)現(xiàn)會(huì)更好，但是后來(lái)我們做過(guò)研究發(fā)現(xiàn)A10這一代更加適合深度學(xué)習(xí)和大數(shù)據(jù)的應(yīng)用場(chǎng)景，而且獲得了非常好的效果。

　谷歌TPU秒殺CPU/GPU，CPU+FPGA能招架嗎?

　　英特爾用CPU+FPGA叫板GPU，但谷歌的TPU成了螳螂后面的黃雀。

　　近日，谷歌首次透露TPU細(xì)節(jié)，其執(zhí)行谷歌常規(guī)機(jī)器學(xué)習(xí)工作負(fù)載的處理速度比GPU/CPU快15-30倍。這一消息表明隨著人工智能的發(fā)展，以往的GPU/CPU架構(gòu)已經(jīng)相對(duì)落后。

　　不過(guò)除了Google，英特爾通過(guò)不斷的收購(gòu)也在進(jìn)行相關(guān)的研發(fā)。Khosrowshahi給出的答案：就是目前尚在開(kāi)發(fā)中的LakeCrest，這是英特爾今年會(huì)面向部分客戶提供離散加速器。但伴隨著時(shí)間的推移，它將會(huì)成為Xeon處理器的最佳伴侶。

　　另外，軟件的優(yōu)化和整合也是英特爾、英偉達(dá)、谷歌搶占市場(chǎng)的關(guān)鍵。張致江稱，無(wú)論在前端還是后端，英特爾擅長(zhǎng)的其實(shí)是底層的計(jì)算架構(gòu)、硬件這一塊，訊飛特別擅長(zhǎng)的在于軟件這一塊，包括有自己的算法、神經(jīng)網(wǎng)絡(luò)、數(shù)據(jù)結(jié)構(gòu)模型、處理方式等等。

<a target='_blank'><img src='https://ad.eepw.com.cn/www/delivery/avw.php?zoneid=114&cb=INSERT_RANDOM_NUMBER_HERE&n=a7a83b30' border='0' alt='' /></a>
<a target='_blank'><img src='https://ad.eepw.com.cn/www/delivery/avw.php?zoneid=115&cb=INSERT_RANDOM_NUMBER_HERE&n=a3d98779' border='0' alt='' /></a>
<a target='_blank'><img src='https://ad.eepw.com.cn/www/delivery/avw.php?zoneid=116&cb=INSERT_RANDOM_NUMBER_HERE&n=abca108c' border='0' alt='' /></a>
<a target='_blank'><img src='https://ad.eepw.com.cn/www/delivery/avw.php?zoneid=117&cb=INSERT_RANDOM_NUMBER_HERE&n=a1775170' border='0' alt='' /></a>
<a target='_blank'><img src='https://ad.eepw.com.cn/www/delivery/avw.php?zoneid=118&cb=INSERT_RANDOM_NUMBER_HERE&n=a449048b' border='0' alt='' /></a>

關(guān)鍵詞： 英特爾 FPGA

評(píng)論

相關(guān)推薦

PC產(chǎn)業(yè)已跌無(wú)可跌 AMD /英特爾季報(bào)均未達(dá)預(yù)期

hpnet | 2002-10-17

ALTERA的PCI_IP Core問(wèn)答集

資源下載 Altera FPGA PCI_IP Core | 2007-12-13

英特爾、三星后，又一廠商或跟進(jìn)玻璃基板技術(shù)

EDA/PCB 英特爾、三星后，又一廠商或跟進(jìn)玻璃基板技術(shù) | 2024-07-16

Altera的FPGA下載常見(jiàn)問(wèn)題經(jīng)驗(yàn)小結(jié)

資源下載 Altera FPGA 常見(jiàn)問(wèn)題經(jīng)驗(yàn) | 2007-12-13

LabVIEW 8.20技術(shù)資料大全簡(jiǎn)介

資源下載 NI LabVIEW 射頻和通信 FPGA | 2007-12-11

Altera: 采用全系列40-nm收發(fā)器FPGA和ASIC實(shí)現(xiàn)創(chuàng)新

視頻 Altera FPGA ASIC | 2009-07-13

英特爾56周年：從硅谷走向AI時(shí)代

智能計(jì)算英特爾硅谷 AI | 2024-07-19

基于FPGA的可編程數(shù)字濾波器系統(tǒng)

資源下載 Max FPGA 可編程數(shù)字濾波器 | 2007-12-14

英特爾 Panther Lake 移動(dòng)處理器規(guī)格曝光：最高“4+8+4”16 核 CPU、12 Xe3 核顯

消費(fèi)電子英特爾 CPU | 2024-07-16

英特爾AI解決方案為最新Meta Llama 3.1模型提供加速

智能計(jì)算英特爾 AI解決方案 Meta Llama 3.1 | 2024-07-25

實(shí)時(shí)的噪聲源定位系統(tǒng)

視頻 NI LabVIEW FPGA | 2009-03-25

LabVIEW FPGA 模塊簡(jiǎn)介

視頻 NI LabVIEW FPGA | 2009-04-01

英特爾承認(rèn)13、14代處理器問(wèn)題大將推出修補(bǔ)程序

消費(fèi)電子英特爾處理器修補(bǔ)程序 | 2024-07-24

基于SD7502構(gòu)成的FPGA-ASK電路圖

設(shè)計(jì)方案基于 SD7502 構(gòu)成 FPGA-ASK 電路圖 | 2011-07-13

家中處處都有英特爾”--英特爾稱要讓芯片無(wú)所不在

hpnet | 2002-10-25

3-DES算法的FPGA高速實(shí)現(xiàn)(Xilinx)

資源下載 Xilinx FPGA 3-DES算法 | 2007-12-13

萊迪思全新推出邏輯優(yōu)化的通用FPGA拓展其小型FPGA產(chǎn)品組合

嵌入式系統(tǒng) 萊迪思 FPGA 小型FPGA | 2024-07-23

拓?zé)o線市場(chǎng) 英特爾啟動(dòng)PCA無(wú)線手持設(shè)備設(shè)計(jì)協(xié)作計(jì)劃

hpnet | 2002-11-05

FPGA如何同DDR3存儲(chǔ)器進(jìn)行接口?

視頻 Altera FPGA DDR3 | 2008-06-18

LatticeECP3設(shè)計(jì)的視頻協(xié)議板電路圖-FPGA配置

設(shè)計(jì)方案 LatticeECP3 設(shè)計(jì) 視頻協(xié)議電路圖 -FPGA | 2011-06-27

視頻協(xié)議板-FPGA配置基于LatticeECP3的設(shè)計(jì)

設(shè)計(jì)方案視頻協(xié)議 -FPGA 配置基于 LatticeECP3 | 2014-05-20

英特爾披露可重配置無(wú)線電架構(gòu)計(jì)劃

hpnet | 2003-02-19

英特爾CPU故障率100％游戲商大崩潰改用AMD

消費(fèi)電子英特爾 CPU 故障率游戲商 AMD | 2024-07-24

利用強(qiáng)大的軟件設(shè)計(jì)工具為FPGA開(kāi)發(fā)者賦能

嵌入式系統(tǒng) 軟件設(shè)計(jì)工具 FPGA 萊迪思 | 2024-07-17

消息稱臺(tái)積電代工英特爾下代 AI HPC 用 GPU 芯片 Falcon Shores

EDA/PCB 臺(tái)積電英特爾 AI HPC GPU 芯片 Falcon Shores | 2024-07-17

英特爾整車方案：拓寬汽車制造商利潤(rùn)提升之路

汽車電子英特爾汽車制造商 | 2024-07-25

基于FPGA的鎖相環(huán)位同步提取電路

設(shè)計(jì)方案電子電路圖，F(xiàn)PGA 鎖相環(huán) | 2012-07-27

用C/C++語(yǔ)言開(kāi)發(fā)大規(guī)模FPGA [轉(zhuǎn)載于www.fpga.com.cn]

xiaohua | 2002-09-24

Altera公司cyclone系列FPGA-1C6電路圖

設(shè)計(jì)方案 Altera 公司 cyclone 系列 FPGA-1C6 | 2009-07-17

高速ADC與內(nèi)置嵌入式串行收發(fā)器的FPGA接口

視頻 Altera FPGA ADC Linear 串行收發(fā)器 | 2009-05-19

焦點(diǎn)

推薦視頻

技術(shù)專區(qū)

看屁屁www成人影院,亚洲人妻成人图片,亚洲精品成人午夜在线,日韩在线欧美成人 (function(){ var bp = document.createElement('script'); var curProtocol = window.location.protocol.split(':')[0]; if (curProtocol === 'https') { bp.src = 'https://zz.bdstatic.com/linksubmit/push.js'; } else { bp.src = 'http://push.zhanzhang.baidu.com/push.js'; } var s = document.getElementsByTagName("script")[0]; s.parentNode.insertBefore(bp, s); })();