數(shù)據(jù)中心加速器芯片年增50%,Achoronix聯(lián)手BittWare推出FPGA加速卡
數(shù)據(jù)中心加速器的芯片市場預測
本文引用地址:http://www.ex-cimer.com/article/201911/406845.htm數(shù)據(jù)中心市場的加速芯片主要包括CPU、GPU、FPGA和ASIC等。據(jù)Semico Research于2019年5月的預測,從2018年到2023年的5年間,數(shù)據(jù)中心加速器市場預計將從28.4億美元增長211.9億美元,年均增長率為49.47%。其中,FPGA預計將是年均增長率最高的細分市場(如下圖),該增長將由企業(yè)級工作負載加速應用驅(qū)動。
數(shù)據(jù)加速可以分成計算、網(wǎng)絡和存儲三大類。有一部分是GPU可以做的,但是另外很大一部分更適合于用FPGA來做加速。
業(yè)界普遍認為的性能對比顯示,相比于傳統(tǒng)CPU,F(xiàn)PGA提升的性能是10~100倍,倍數(shù)變化主要來自不同的應用。不僅如此,在提高性能的同時,F(xiàn)PGA的功耗也會大幅降低。
從市場上來看,這幾年FPGA加速卡的應用越來越多。從下圖右可以看出,F(xiàn)PGA加速卡和服務器是新的技術(shù),目前正處于上升期。
業(yè)界的Tier 1客戶,諸如亞馬遜和微軟的數(shù)據(jù)中心在二三年前就已經(jīng)把FPGA加速方案用到他們的數(shù)據(jù)中心。只不過因為他們是Tier 1,工程師資源和軟件都有雄厚的實力,所以可以把芯片直接做進服務器主板里,即嵌入到他們的硬件系統(tǒng)中。但是對于很多Tier 2和Tier 3的OEM(生產(chǎn)商),或一些小型的數(shù)據(jù)中心及純做軟件的客戶,并不具備這樣的工程資源,所以可以通過采購基于標準的PCIe接口的FPGA加速卡,快速地部署到自己的業(yè)務和應用中。
數(shù)據(jù)中心部署FPGA加速方案有很多好處。①效率方面,F(xiàn)PGA相對于GPU和CPU有更高的能效比。②FPGA可以根據(jù)客戶的特殊需求重新配置。③FPGA加速卡可以快速部署,使客戶的實驗室應用快速地推向市場,而無需把更多的精力和資源放在底層的開發(fā)上。④對于hyperscaler(超大規(guī)模廠商),也可以做大規(guī)模的部署。
采用Speedster7t獨立FPGA芯片的VectorPath加速卡
2019年10月,基于FPGA的數(shù)據(jù)加速器件和高性能嵌入式FPGA(eFPGA)半導體知識產(chǎn)權(quán)(IP)的領(lǐng)導性企業(yè)Achronix半導體公司,與Molex旗下的一家領(lǐng)先企業(yè)級FPGA加速器產(chǎn)品供應商BittWare聯(lián)合宣布:推出面向高性能計算和數(shù)據(jù)加速應用的FPGA加速卡。
新推出的VectorPath S7t-VG6加速卡搭載了Achronix采用7nm工藝打造的Speedster7tAC7t1500獨立FPGA芯片,它在同類PCIe FPGA加速卡中,提供了目前業(yè)界最高性能的接口。這些高性能接口包括1x400GbE和2x100GbE接口,以及總帶寬為4Tbps的8組GDDR6的板上存儲器,使該加速卡成為高帶寬數(shù)據(jù)加速應用的理想選擇。
為此,Achronix市場營銷副總裁Steve Mensor和Molex副總裁Sam Bichara向電子產(chǎn)品世界記者介紹了其特色。
圖 從左至右:Achronix市場營銷副總裁Steve Mensor,Molex副總裁Sam Bichara
VectorPath加速卡是基于Achronix新一代的7t的高性能,針對高帶寬優(yōu)化的一個FPGA。優(yōu)勢有兩點:①二維的高速片上網(wǎng)絡,②針對人工智能、機器學習優(yōu)化的MLR單元(如下圖)。
因此,數(shù)據(jù)中心開發(fā)人員可以不用關(guān)注硬件,只要采用現(xiàn)成可用的硬件,加上自己的軟件、算法就可實現(xiàn)應用,這樣就可以大大加速部署和開發(fā)。
Achronix的合作伙伴BittWare非常有實力:有約30年的FPGA加速卡的設計和生產(chǎn)制造經(jīng)驗,于2018年被Molex收購,成為更大規(guī)模公司——Molex的子公司,可以充分利用Molex更廣闊的技術(shù)支持和銷售團隊服務客戶。
VetcorPath加速卡所具有的功能
VectorPath加速卡系專為高性能和高帶寬數(shù)據(jù)應用而設計,具有以下硬件功能:400GbE QSFP-DD和100GbE QSFP56接口;8組GDDR6存儲器可提供4 Tbps的總帶寬;1組帶有錯誤檢查和糾正(ECC)功能的、運行頻率為2666MHz的DDR4存儲器;Speedster7t FPGA芯片集成了帶寬為20 Tbps的二維片上網(wǎng)絡(NoC);692K的6輸入查找表(LUT);40K Int8 MAC提供高于80 TOps的算力;OCuLink – 用于連接擴展卡的4通道PCIe Gen 4連接器。
VectorPath加速卡包括一整套Achronix的ACE開發(fā)工具,以及BittWare的基板管理控制器和開發(fā)工具包,其中包括API、PCIe驅(qū)動程序、診斷自測和應用示例設計,以提供快速的、開箱即用的體驗。
TeraBox FPGA服務器
TeraBox是基于FPGA的服務器(如下圖)。在過去BittWare注意到,客戶在買獨立的FPGA芯片,或者是基于FPGA板卡的加速卡時,獨立的板卡放在服務器中進行設計,但是對于很多Tier 2、Tier 3甚至更小的客戶,沒有時間、精力以及工程資源去把FPGA卡給集成到服務器中,因此有一部分客戶需要更高的集成,這樣客戶只需簡單的配置就可以應用起來。
TeraBox主要有兩大類客戶,一類是有特殊需求的客戶,他需要把上層軟件快速部署到業(yè)務中,或客戶需要快速地去展示他們的軟件。另一類是對于一些IT經(jīng)理,他的技術(shù)水準不是那么深,因此無需關(guān)注底層,還可以降低風險,同時可以簡單部署,縮短整個業(yè)務的上線時間。
采購TeraBox的另一優(yōu)勢是:傳統(tǒng)的FPGA加速卡,一般只提供一年的質(zhì)保和技術(shù)服務,但是服務器一般是3年。
與競品的差異化
除了Achronix之外,另外兩大FPGA廠商此前已推出了加速卡;2019年下半年,兩大FPGA廠商忙于發(fā)布各自的“統(tǒng)一軟件開發(fā)平臺”,Achronix有類似的軟件平臺產(chǎn)品嗎?
實際上,競品的芯片不僅有FPGA、處理器(Arm SoC),還有另外的處理器(例如AI引擎)等。例如AI引擎,X公司的AI引擎底層是Synopsys公司的矢量處理器,但是這種矢量處理器跟Arm CPU是不同架構(gòu)的處理器,再加上外部的高速接口,客戶要面對3種不同的硬件底層。
“統(tǒng)一軟件平臺”從表面上看是用同一個軟件的思維去開發(fā),但是作為開發(fā)者,處理數(shù)據(jù)時要考慮哪部分放在FPGA里,哪部分放在CPU里,哪部分放在AI引擎/矢量處理器;另外要考慮互相之間的數(shù)據(jù)怎樣去流動,而不是只是簡單的有一個工具讓你去用。因此,怎樣讓設計者很好地利用你的架構(gòu),對于軟件工程師是非常有挑戰(zhàn)的。
對于Achronix而言,走的是另外一個方向:對傳統(tǒng)的FPGA做了很多優(yōu)化,諸如二維的高速網(wǎng)絡;另外,為了提高算力,雖然名字叫機器學習處理器(MLP),但它不是處理器,它實際上最底層是一種乘累加陣列(MAC,如下圖),是硬件。所以所有底層的思維還是硬件的思維。
圖 MLP架構(gòu):專為計算密集的人工智能/機器學習(AI/ML)應用而優(yōu)化的Speedster7t
當然Achronix也有開發(fā)工具,但是整個底層架構(gòu)是硬件架構(gòu),沒有不同類型的單元。Achronix的開發(fā)思路是讓原有的FPGA工程師很容易地去用Achronix的平臺,而且Achronix的平臺性能有大幅的提升,甚至軟件工程師通過Achronix的工具也可以很容易去用這個硬件平臺。
總之,Achronix的思路是延續(xù)傳統(tǒng)模式,在傳統(tǒng)模式上做進一步的優(yōu)化。即硬件軟件化——有很容易用起來的硬件,好像用軟件一樣。例如Speedster7t的二維片上網(wǎng)絡(如下圖),讓整個的硬件的設計,更像軟件的思維去做。
另外,關(guān)于競品的加速卡,例如I公司,采用的存儲是HBM2,而Achronix采用的是GDDR6,特點是速度快,同時價格便宜(相對于目前業(yè)界通用的HBM2,價格會便宜很多),而且HBM2實現(xiàn)起來也比較復雜,需要封裝到FPGA上,制造也比較困難。
上市時間和售價
VectorPath現(xiàn)在就可以接受訂單,預計在2020年第2季度發(fā)貨到客戶。在客戶拿到這個加速卡之前,客戶現(xiàn)在就可以開始做開發(fā)。加速卡的價格是7500美元。
總結(jié)
對于數(shù)據(jù)中心、邊緣計算等需要計算加速的領(lǐng)域,整個硬件加速市場正在快速增長,CPU已經(jīng)趕不上性能的需求,F(xiàn)PGA是一種高效選擇。
除了極少數(shù)超大數(shù)據(jù)中心有能力和用量可支撐自己建立FPGA團隊,包括硬件團隊去開發(fā)加速卡以外,絕大部分的Tier 2或Tier 3需要去外部采購加速卡,包括相應的底層軟件。因此,F(xiàn)PGA廠商紛紛祭出FPGA加速卡。Achronix和BittWare聯(lián)手推出了采用Speedster7t獨立FPGA芯片的VectorPath加速卡,可以快速部署,簡單易用。相比競品,VectorPath還具有超高性能的特點。
評論