英特爾借由投入FPGA推動機(jī)器學(xué)習(xí)與AI
自從機(jī)器學(xué)習(xí)(machinelearning;ML)與人工智能(AI)在近期受到歡迎后,包括英特爾(Intel)等科技大廠也積極抓緊機(jī)會投入開發(fā)相關(guān)領(lǐng)域。該公司高層日前也表示,英特爾正利用現(xiàn)場可編程閘陣列(FPGA)技術(shù),提供ML或AI的解決方案。據(jù)NewElectronics報導(dǎo),為了搶搭ML與AI風(fēng)潮,英特爾透過收購與內(nèi)部發(fā)展打造解決方案。英特爾的可編程系統(tǒng)事業(yè)群(ProgrammableSystemsGroup;PSG)前身為Altera,AI產(chǎn)品專家BillJenkins表示,PSG專注在機(jī)器學(xué)習(xí)。ML/AI目標(biāo)則包含資料中心、自駕車與工業(yè)系統(tǒng)以及以大量數(shù)據(jù)分析來解決無法預(yù)測的問題。
本文引用地址:http://www.ex-cimer.com/article/201708/363678.htmJenkins也舉出一些目前遭遇困難,例如1輛車在1天約產(chǎn)生4Tbyte數(shù)據(jù),而1間工廠則產(chǎn)生1ExaByte。在美國搜集后的數(shù)據(jù)有94%都被丟棄,至于要如何使用上述數(shù)據(jù)的答案在于變得更聰明。他也指出,讓業(yè)者能在合理成本與資源下解決之前無法處理的問題,其中的硬體解決方案之一就是FPGA。Jenkins表示,使用FPGA時是為了問題創(chuàng)造1個架構(gòu),讓人可控制數(shù)據(jù)路徑,有別于讓數(shù)據(jù)從CPU移動再儲存在存儲器,目前數(shù)據(jù)已可直接進(jìn)入FPGA,之后在最少延遲下做個別處理。換言之,F(xiàn)PGA重點就是系統(tǒng)效能與延遲。Jenkins表示,F(xiàn)PGA已出現(xiàn)大約30年,在該領(lǐng)域目前所使用的是Arria10,因為其浮點運算能力可保持精準(zhǔn)度。
Arria10元件可提供達(dá)1.5TFlop的運算能力,而Stratix10則為10TFlop。Jenkins也指出,F(xiàn)PGA有大量內(nèi)部存儲器頻寬,大概8Tbyte/s以及數(shù)個MB內(nèi)建存儲器,所以可很快取得數(shù)據(jù)、分析并在最短延遲內(nèi)將結(jié)果回傳,其表現(xiàn)也比CPU好,例如CPU需要在GHz時脈運轉(zhuǎn),F(xiàn)PGA可在300MHz運轉(zhuǎn)并維持輸入輸出量。另外,在較慢時脈運轉(zhuǎn)元件并將結(jié)果保存在FPGA上也可節(jié)省能源。他認(rèn)為,外界雖可使用ASIC來執(zhí)行ML/AI,但其問題在于一旦打造1個ASIC后便無法改變,而且建造1個ASIC成本不便宜。廠商要投入ML/AI時必須厘清如何拓展用戶群等問題。
早期FPGA是透過OpenCL作為軟件方案來增加潛在用戶。Jenkins表示,OpenCL目的就是將FPGA帶入軟件發(fā)展社群中。由于OpenCL是軟件為基礎(chǔ)的發(fā)展流程,因此外界已利用OpenCL寫出學(xué)習(xí)資料庫,但開發(fā)人員需要了解FPGA能提供的平行結(jié)構(gòu)與更細(xì)致的路徑,才不會讓外界眼光被固定架構(gòu)所限。收購Altera后,英特爾隨后發(fā)布的消息之一便是將FPGA與其Xeon伺服器處理器整合。Jenkins表示,外界正在尋找方法加速處理,而且搭載特定加速器的系統(tǒng)也被打造。雖然CPU可執(zhí)行任何東西,但要速度快,意味著需要更多處理器或加速器,至于FPGA則容易擴(kuò)充而且易連接。Jenkins指出,英特爾目前作法是將機(jī)器學(xué)習(xí)元件從Xeon卸載并引進(jìn)FPGA,如果不是FPGA原生,暫存匯流排會將數(shù)據(jù)推回CPU,運算之后再送回FPGA,成為無縫整合。
另外,F(xiàn)PGA作為服務(wù)(FPGAasaService)概念正在形成。云端服務(wù)供應(yīng)商并提供客戶使用FPGA當(dāng)作加速器,2家英特爾客戶已提供該服務(wù)。大陸阿里云提供云端工作量加速來作為投資FPGA基礎(chǔ)建設(shè)的另1種選項,在歐洲與Accelize合作則讓OVH用戶采用預(yù)建FPGA加速器、客制化或新建。
評論