國產FPGA,走到哪一步了?
隨著人工智能(AI)技術的飛速發(fā)展,其應用邊界不斷拓寬,從簡單的圖像識別到復雜的自然語言處理,再到自動駕駛、智能制造等前沿領域,AI 正以前所未有的速度改變著我們的世界。
本文引用地址:http://www.ex-cimer.com/article/202407/461498.htm在這場 AI 革命中,深度學習作為其核心驅動力,不斷推動著算法與模型的革新,同時也對計算資源提出了更為嚴苛的要求。
誕生于 1985 年的 FPGA 雖然問世時間不長,但已經憑借「可編程」的獨特優(yōu)勢,在百花齊放的芯片浪潮中奪得一席之地,成為 GPU 芯片的又一勁敵。
FPGA 的特點
FPGA 芯片是基于可編程器件(PAL、GAL、CPLD)發(fā)展而來的,是半定制化、可編程的集成電路。FPGA 主要有三大特點:
可編程靈活性高
無論是 CPU、GPU、DSP、Memory 還是各類 ASIC 芯片,在芯片被制造完成之后,其芯片的功能就已被固定,用戶無法對其硬件功能進行任何修改。而 FPGA 芯片在制造完成后,其功能并未固定,用戶可以根據自己的實際需要,將自己設計的電路通過 FPGA 芯片公司提供的專用 EDA 軟件對 FPGA 芯片進行功能配置,從而將空白的 FPGA 芯片轉化為具有特定功能的集成電路芯片。
每顆 FPGA 芯片均可以進行多次不同功能配置,從而實現(xiàn)不同的功能,具有高度靈活性。
開發(fā)周期短
在邏輯芯片里面,如 ASIC 制造流程包括邏輯實現(xiàn)、布線處理和流片等多個步驟;而 FPGA 無需布線、掩膜和定制流片等,芯片開發(fā)大大簡化。一般邏輯芯片,如 ASIC、DSP、SOC 等,開發(fā)周期需要 14—24 個月,甚至更長,而 FPGA 則只需要 6—12 個月,比其他芯片開發(fā)周期減少 55% 的時間。
正如全球 FPGA 第一大廠商 Xilinx(賽靈思)認為,更快比更便宜重要,產品晚上市 6 個月,5 年內將減少 33% 的利潤,每晚四周等于損失 14% 的市場份額。
并行計算效率高
FPGA 屬于并行計算,也即一次可執(zhí)行多個指令算法。而傳統(tǒng)的 ASIC、DSP、CPU 都是串行計算,一次只能處理一個指令集。因此在部分特殊任務中,F(xiàn)PGA 的并行計算效率比串行計算效率更高。
CPU、GPU、ASIC 和 FPGA 是四種計算機處理器類型,不同處理器有著獨特的優(yōu)勢。
FPGA 與主流芯片的對比
CPU 的邏輯運算單元(ALU)較少,控制器(control)占比較大;GPU 的邏輯運算單元(ALU)小而多,控制器功能簡單,緩存(cache)也較少。架構的不同使得 CPU 擅長進行邏輯控制、串行計算,而 GPU 擅長高強度的并行計算。GPU 單個運算單元處理能力弱于 CPU 的 ALU,但是數量眾多的運算單元可以同時工作,當面對高強度并行計算時,其性能要優(yōu)于 CPU?,F(xiàn)如今 GPU 除了圖像處理外,也越來越多地運用到別的計算中。
可以說,CPU 更像是一個有多種功能的優(yōu)秀領導者。它的優(yōu)點在于調度、管理、協(xié)調能力強,計算能力則位于其次。而 GPU 相當于一個接受 CPU 調度的「擁有大量計算能力」的員工。
ASIC 即專用集成電路,指應特定用戶要求和特定電子系統(tǒng)的需要而設計、制造的集成電路。ASIC 的特點是面向特定用戶的需求,ASIC 在批量生產時與通用集成電路相比具有體積更小、功耗更低、可靠性提高、性能提高、保密性增強、成本降低等優(yōu)點。
基于 ASIC 開發(fā)人工智能芯片更像是電路設計,需要反復優(yōu)化,需要經歷較長的流片周期,故開發(fā)周期較長。
量產后 ASIC 人工智能芯片成本及價格較低。雖然相較于 FPGA,ASIC 人工智能芯片需要經歷較長的開發(fā)周期,并且需要價格昂貴的流片投入,但是這些前期開發(fā)投入在量產后會被攤薄,所以量產后,ASIC 人工智能芯片的成本和價格會低于 FPGA 人工智能芯片。
受益于與眾不同的架構,F(xiàn)PGA 的可編程屬性使其相比其他處理器,在算力、成本、功耗之間更能取得平衡。
FPGA 迎來爆發(fā)時刻
FPGA 由于具備可編程靈活性高、開發(fā)周期短以及并行計算效率高的特點,使得 FPGA 的應用場景特別廣泛。
通信是目前 FPGA 規(guī)模最大的應用市場。FPGA 在通信領域的應用包括網絡交換、通信協(xié)議轉換、流量控制等。它可以用于實現(xiàn)高效數據處理和大規(guī)模的射頻中繼等。例如,在 5G 通信技術中,F(xiàn)PGA 被用于基站的信號處理和數據處理,提高了通信系統(tǒng)的性能和穩(wěn)定性。
工業(yè)領域是 FPGA 芯片的主要應用市場之一。FPGA 在工業(yè)領域主要應用于視頻處理、圖像處理、數控機床等領域實現(xiàn)信號控制和運算加速功能。例如,在自動化生產線中,F(xiàn)PGA 被用于控制機械臂的運動和協(xié)調各個設備的運作。
數據中心是 FPGA 芯片的新興應用市場之一。在數據中心運算處理領域,F(xiàn)PGA 芯片主要用于硬件加速。相比于 CPU,F(xiàn)PGA 芯片由于其無指令、無需共享內存的體系結構,能夠同時提供強大的計算能力和足夠的靈活性;相比 GPU,F(xiàn)PGA 芯片在數據中心具有低延遲及高吞吐的優(yōu)勢;相比 ASIC,F(xiàn)PGA 芯片可在靈活性、開發(fā)時間等方面達到出色的平衡。
隨著電動汽車興起,F(xiàn)PGA 在汽車中的應用越來越廣泛。汽車電子行業(yè)對 FPGA 的需求主要來自 ADAS(智能感知系統(tǒng))和 AV(自動駕駛汽車)。比如:FPGA 芯片可用于控制和驅動電動汽車電機控制系統(tǒng),連接駕駛系統(tǒng)、儀表盤、雷達、超聲波傳感器等各種車載設備,實現(xiàn)激光雷達、毫米波雷達等信號處理和控制。在視頻橋接和融合領域,F(xiàn)PGA 芯片可用于實現(xiàn)多個圖像傳感器的信號橋接、3D 環(huán)視視頻融合、倒車輔助視頻、輔助駕駛視頻等功能。在輔助駕駛和自動駕駛領域,F(xiàn)PGA 芯片可用于實現(xiàn)機器視覺與目標檢測等各種功能。
在人工智能時代,AI 的算法不斷推陳出新,對于硬件的算力和靈活度要求很高,F(xiàn)PGA 的靈活性剛好符合 AI 的特性。FPGA 主要被用作矩陣乘算法的加速器和神經網絡加速器的執(zhí)行器。它可以實現(xiàn)低延遲的計算和高性能的運算,為人工智能的發(fā)展提供了強大的硬件支持。例如,在深度學習領域,F(xiàn)PGA 被用于加速神經網絡的推理和訓練過程,提高了人工智能系統(tǒng)的處理速度和能效。此外,隨著異構計算融合等形式越來越受推崇,F(xiàn)PGA+CPU 等架構也給 AI 帶來更多的潛在優(yōu)勢。
國際 FPGA 競爭格局
全球 FPGA 市場主要被賽靈思(已被 AMD 收購)和 Intel 兩家海外企業(yè)雙寡頭壟斷,在 2019 年,兩家合計占據了全球市場份額的 85% 以上。由于技術壁壘高、更新?lián)Q代速度快,全球 FPGA 市場高度集中,國內廠商占比較低。
AMD 產品已進入 7nm 復雜異構
AMD(Xilinx)FPGA 相關產品矩陣主要包括:四大 FPGA 產品系列(VIRTEX、KINTEX、ARTIX、SPARTAN),以及集成度更高的兩大自適應 SoC(AdaptiveSoC)系列(ZYNQ、VERSAL)。
AMD(Xilinx)FPGA 高/中/低端產品系列對比
從芯片制程來看,主要有 UltraScale+(16nm)、UltraScale(20nm)、7 系列(28nm)和 6 系列(45nm)四大類,VERSAL 則是整體升級為 7nm 制程。
從芯片架構來看,F(xiàn)PGA 單芯片向更先進工藝、更高速電路結構、復雜異構 SoC 系統(tǒng)發(fā)展,AMD 的 VERSAL 系列產品中集成了 PCIe、Ethernet 通信協(xié)議以及 AI 引擎、NoC 架構等。
從產品價格來看,隨著產品定位從低端走向高端,F(xiàn)PGA 容量等指標不斷提升,通信架構逐漸升級,對應開發(fā)板的價格也從數百美元逐步上漲到一萬多美元。
從應用領域來看,數據中心等高端應用所適用的 FPGA 芯片大多為高端 FPGA 產品線,僅有少部分中高端 FPGA 也能夠滿足數據中心網絡加速需求。
英特爾:高端已大量出貨,低功耗系列即將推出
今年 3 月,英特爾將其可編程解決方案事業(yè)部(PSG)獨立運營,并以 Altera 的品牌形象重新呈現(xiàn)。新成立的 Altera 制定了全新的發(fā)展戰(zhàn)略,旨在通過聚焦高性能 FPGA 市場來鞏固并擴大其市場地位,同時積極開拓中低端 FPGA 市場,以吸引更廣泛的客戶基礎并拓展發(fā)展空間。
Agilex FPGA 和 SoC FPGA家族基于英特爾 10 納米制程節(jié)點構建,可提高性能并降低功耗。
Agilex9 FPGA 和 SoC FPGA為目標應用提供前所未有的功能和優(yōu)化,超越了主流可編程邏輯的極限。目前已實現(xiàn)規(guī)?;a。這款產品憑借業(yè)界領先的數據轉換器,尤其適用于需要處理高帶寬混合信號 FPGA 的應用場景。
Agilex7 FPGA 和 SoC FPGA是一款高性能 FPGA,提供業(yè)界領先的架構和 I/O 速度,是大多數帶寬密集型和計算密集型應用的理想之選。英特爾 Agilex 7 的邏輯結構性能功耗比,對比競爭對手的 7nm 節(jié)點 FPGA,提升約 2 倍。
Agilex 7器件采用先進的 10 納米 SuperFin 技術(F 系列和 I 系列)、英特爾 7 技術(M 系列)和第二代英特爾 Hyperflex FPGA 架構。這款產品的應用領域包括數據中心、網絡、國防和工業(yè)。
Agilex 5是一款針對需要高性能、低功耗和小尺寸的應用進行了優(yōu)化的中端 FPGA。該產品現(xiàn)已全面上市。
英特爾 Agilex 5 是首批支持 LPDDR4、LPDDR5(+DDR4、DDR5)的 FPGA、首批配備 AI 張量塊的產品,擁有首個非對稱多核應用處理器系統(tǒng)(2xArm A76、2xArm A55),可提升在邊緣端 AI 推理能力。其 E 系列進行了功耗和尺寸優(yōu)化,對比 16nm 競品,性能功耗比提升 1.6 倍;D 系列進行了性能優(yōu)化,對比 7nm 競品,性能功耗比提升 2 倍。
Agilex 3即將問世,該產品系列具有更小的外形尺寸以及功耗和成本優(yōu)化。這款產品旨在為云計算、通信和智能邊緣應用中的低復雜度功能提供領先的低功耗 FPGA 系列產品。
綜上所述,Altera 的產品線日益完善,其中 Agilex 9 正處于規(guī)?;a階段,Agilex 7 的 F 系列和 I 系列設備已投入生產,Agilex 5 已全面上市,而即將推出的 Agilex 3 將滿足云、通信和智能邊緣應用對低復雜度、低功耗 FPGA 的需求。
國產之爭愈發(fā)激烈
目前,本土 FPGA 廠商和海外龍頭的差距客觀存在,有充分的追趕空間。
國內外廠商的差距
首先看一下國產廠商與國際廠商當前的差距。
從 FPGA 的容量來看,目前國產民用 FPGA 最高水平能做到約 400k 邏輯單元,而目前全球容量最大的 FPGA 為 AMD 在 2023 年 6 月 27 日推出的 VP1902(VersalPremium),邏輯單元數高達 18,507k,是國內的 46 倍。
從制程上看,目前國產最先進制程在 14/16nm,而 Xilinx 在 2018 年便發(fā)布了 7nm 的異構 FPGA 產品 Versal。
從收入來看,中國主要的 FPGA 公司有紫光同創(chuàng)、安路科技、復旦微電、高云半導體、國微電子、易靈思、西安智多晶、京微齊力等。中國作為全球 FPGA 市場的重要組成部分,2022 年市占率在 1/3 左右,但在供應鏈側,國產 FPGA 芯片的全球市占率卻不足 10%。
從下游應用看,目前最高端的 FPGA 兩大領域——原型驗證、數據中心加速計算仍未有國產 FPGA 能夠進入。
從毛利率看,目前國產 FPGA 集中于在消費電子領域進行中低容量的替代,相比大容量 FPGA 市場的進入壁壘相對較低,出現(xiàn)了一定程度的「內卷」,典型毛利率在 35%—40% 之間,而 AMD 在高端 FPGA 市場競爭優(yōu)勢突出,近 10 年毛利率基本維持在 65% 以上,近 3 年更是接近 70%。
國產廠商技術進步迅速
中國 FPGA 產業(yè)雖起步晚,但近年來發(fā)展迅速。
在市場側驅動和國家政策的扶持下,本土 FPGA 企業(yè)不斷發(fā)力,在技術和市場兩方面都取得了不小的成績。
目前中國廠商的低容量 FPGA 技術已發(fā)展較為成熟。低容量 FPGA 的邏輯單元<100k,要求極致的低成本和低功耗,主要集中在 55nm、40nm 和 28nm 這三個節(jié)點。
國產廠商大部分在 2019 年及之前就推出了此類產品,它也往往是本土 FPGA 廠商的第一代產品。例如,紫光同創(chuàng)的 Logos 系列在 2017 年推出,為 40nm 的低功耗、低成本 FPGA,邏輯單元在 12-102k 之間;安路科技的 55nm 的 Eagle4 在 2016 年推出,邏輯單元 20k,主要用于伺服控制、高速圖像接口轉換的領域;高云半導體的 55nm 的 FPGA 小蜜蜂(LittleBee)在 2016 年推出,是公司第一代產品,邏輯單元數在 1-8k。
在 28nm 的中低容量市場,中國 FPGA 廠商也已經具備成熟的產品。中容量 FPGA 主要指邏輯單元在 100k-500k 的 FPGA,主要應用集中在無線通信的空口側、工業(yè)、汽車、A&D 領域,中容量市場不追求最高的性能,性能和功耗同等重要,對成本亦有一定要求。比如紫光同創(chuàng)、安路科技、智多晶均在 2020 年推出了 28nm 的 FPGA 產品,主要對標 Xilinx 的 7 系列產品等。
此外還有部分廠商推出 22nm 的 FPGA,以實現(xiàn)替代部分 28nm 的中低容量 FPGA。比如高云在 2022 年 9 月推出的 Aurora V,是其 22nm 的 FPGA 產品,邏輯單元數為 138k。
500K 以上的高容量 FPGA 是目前國產替代的難點。需要本土公司在硬件架構、EDA 軟件、IP 性能等方面深入發(fā)展。其中,最重要的是解決 EDA 軟件在大規(guī)模 FPGA 的布局布線問題。
國產 FPGA 營收大幅增長
再看國產 FPGA 廠商的營收情況。
安路科技作為國內 FPGA 領域的領軍企業(yè),2018、2019 年,安路科技營業(yè)收入只有 2852.03 萬元、1.22 億元。之后在 2021 年、2022 年其業(yè)績出現(xiàn)翻倍增長。
根據公開數據,2020 年安路科技的 FPGA 業(yè)務收入為 2.8 億元,隨后幾年持續(xù)攀升。到 2021 年,其 FPGA 業(yè)務收入增長至 6.42 億元,同比增長超過一倍。到 2022 年,這一數字更是增長至 9.89 億元,顯示出強勁的市場增長勢頭。
安路科技的毛利率同樣表現(xiàn)優(yōu)異。從 2020 年到 2022 年,其毛利率分別為 34.05%、34.18% 和 39.13%,呈現(xiàn)出穩(wěn)步上升的趨勢。特別是在 FPGA 業(yè)務領域,其毛利率在 2022 年達到了 39.13%。
復旦微作為國內老牌 IC 設計企業(yè),在 FPGA 領域同樣表現(xiàn)出色。近年來,其 FPGA 業(yè)務收入持續(xù)增長。2020 年,復旦微的 FPGA 業(yè)務收入為 2.04 億元;到 2021 年,這一數字增長至 4.27 億元;而到了 2022 年,更是達到了 7.81 億元,顯示出公司在 FPGA 市場中的強勁競爭力。
復旦微的毛利率同樣處于較高水平。從 2020 年到 2022 年,其 FPGA 業(yè)務毛利率分別為 82.56%、84.71% 和 84.7%,保持了較高的穩(wěn)定性和盈利能力。這主要得益于公司強大的技術實力和完善的產品線布局。
國產 FPGA 廠商機遇眾多
目前 FPGA 國產化有兩大有利條件:一是近年國產 FPGA 廠商收到的政府補助金額較大,體現(xiàn)國家對 FPGA 國產化的強烈扶持態(tài)度。二是 28nm 生命周期比以往代際更長,給了國產廠商較為充分的追趕空間。
從已披露數據來看,2018 年—2022 年 5 年間,國產 FPGA 廠商每年均收到了千萬級甚至上億的政府補助。2022 年,安路科技、復旦微、紫光國微計入當期損益的政府補助金額分別為人民幣 3000 萬+、6000 萬+和 1.7 億元。而主要產品為 CPU 的龍芯中科 2022 年政府補助金額為 1.9 億元,主營產品為 CPU 和 DCU 的海光信息為 6000 萬+,景嘉微為 3000 萬+。根據 WSTS 數據,2022 年微處理器市場規(guī)模 508 億美元,是 FPGA 市場規(guī)模的 6 倍。對比其它品類的數字芯片公司,F(xiàn)PGA 公司收到的政府補助金額依然較大,體現(xiàn)出國家對 FPGA 的強烈扶持意愿。
此外,作為典型的數字芯片,F(xiàn)PGA 生命周期一般只有 10—15 年(而模擬芯片可以高達 20 年以上),快速迭代的特征使其收入的頂峰往往發(fā)現(xiàn)在推出之后的第 4—5 年,60% 收入在前 6 年發(fā)生,隨后是量價齊跌的市場。因此,市場玩家必須努力競逐制程領先,因為制程落后廠商往往無法取得足夠的收入以支撐下一代產品的開發(fā)。而 28nm 生命周期比以往代際更長,這正給了國產廠商較為充分的追趕空間。
未來,F(xiàn)PGA 芯片市場將繼續(xù)保持快速增長態(tài)勢。隨著 5G、物聯(lián)網、人工智能等技術的不斷發(fā)展,F(xiàn)PGA 芯片將在更多領域發(fā)揮重要作用。同時,隨著國產 FPGA 芯片技術的不斷進步和市場份額的逐步提升,國內 FPGA 芯片市場也將迎來更加廣闊的發(fā)展空間。
據 Frost&Sullivan 預測,預計 2025 年全球 FPGA 市場規(guī)模將超過 125 億美元,國內市場規(guī)模將從 2022 年的 208.8 億人民幣提升至 2025 年的 332.2 億人民幣,三年 CAGR 約 17%。
總的來說,F(xiàn)PGA 芯片市場是一個充滿機遇和挑戰(zhàn)的市場。隨著技術的不斷進步和應用領域的不斷拓展,F(xiàn)PGA 芯片將在更多領域發(fā)揮重要作用,并推動相關產業(yè)的快速發(fā)展。
評論