可編程能力在新一代安全設(shè)備中的重要性
數(shù)據(jù)包編輯:安全處理涉及在完成解析、包頭查找和過(guò)濾之后將修改后的加密或解密數(shù)據(jù)包發(fā)送到出站端口。傳出流量包括修改后的新包頭、更新后的數(shù)據(jù)包字段、認(rèn)證包頭以及糾錯(cuò)字段。部分常見(jiàn)數(shù)據(jù)包處理需求包括:
本文引用地址:http://www.ex-cimer.com/article/202112/430462.htm● 更改 L2/L3 包頭 (MAC/VLAN/IPv4/IPv6)
● 創(chuàng)建與更新安全 (MACSec/IPSec) 包頭
● 更新 IP 包頭校驗(yàn)和
● 更新 TCP 校驗(yàn)和
● 更新以太網(wǎng) CRC
● 更新認(rèn)證字段
圖7 顯示了用于 MACSec 和 IPSec 的數(shù)據(jù)包編輯/修改操作。在通過(guò)出站端口發(fā)送數(shù)據(jù)包之前,可能需要對(duì)包頭字段進(jìn)行多次修改,這包括校驗(yàn)和與 CRC 的計(jì)算與插入。除了標(biāo)準(zhǔn)包頭,數(shù)據(jù)包通常還包括專用包頭,而且也可能需要采用不同的協(xié)議包頭(VXLAN、IP in IP、GRE 等)對(duì)數(shù)據(jù)包進(jìn)行封裝與解封。賽靈思可編程器件能夠在線路速率下以最大靈活性實(shí)現(xiàn)數(shù)據(jù)包修改。
圖7 MACSec 與 IPSec 數(shù)據(jù)包重寫(xiě)
此外,賽靈思器件還提供 P4 可編程能力,因此也可以采用 P4 實(shí)現(xiàn)數(shù)據(jù)包重寫(xiě)操作。與 RTL 實(shí)現(xiàn)方案相比,P4 逆解析器功能能夠進(jìn)一步簡(jiǎn)化包頭的創(chuàng)建與插入。為在賽靈思器件上以線路速率運(yùn)行,可以使用賽靈思 P4 編譯器合成 P4 編輯器代碼。
對(duì)于應(yīng)用層安全實(shí)現(xiàn),對(duì)數(shù)據(jù)包重寫(xiě)操作的需求更加復(fù)雜。例如,如果 TCP 數(shù)據(jù)包在 FPGA 內(nèi)終止,則會(huì)話追蹤與封裝/解封需求會(huì)比 IPSec 或 MACSec 數(shù)據(jù)包修改需求需要更多的邏輯與存儲(chǔ)器資源。
此外,數(shù)據(jù)包修改任務(wù)也可以在軟件(運(yùn)行 CPU 核心)中執(zhí)行,但是高端安全設(shè)備所需的吞吐量無(wú)法通過(guò)軟件實(shí)現(xiàn)方案滿足線路速率操作。在可編程硬件中執(zhí)行數(shù)據(jù)包處理操作的另一個(gè)關(guān)鍵優(yōu)勢(shì)是可以節(jié)省大量的 CPU 資源(CPU 核心),節(jié)省下來(lái)的資源可以分配給軟件中運(yùn)行的實(shí)際應(yīng)用。
FPGA 中的應(yīng)用級(jí)安全處理
FPGA 是新一代防火墻內(nèi)聯(lián)安全處理的理想選擇,這是因?yàn)椴捎?FPGA 可以成功滿足對(duì)更高性能、靈活性和低時(shí)延操作的需求。此外,F(xiàn)PGA 還可以實(shí)現(xiàn)應(yīng)用級(jí)安全功能,從而進(jìn)一步節(jié)省計(jì)算資源并提高性能。
FPGA 中有關(guān)應(yīng)用安全處理的常見(jiàn)示例包括:
● TTCP 卸載引擎
● 正則表達(dá)式匹配
● 非對(duì)稱加密 (PKI) 處理
● TLS 處理
由于眾多用戶空間應(yīng)用采用 TCP 作為客戶端或服務(wù)器模式下的通信協(xié)議,并且 TCP 是客戶端與服務(wù)器之間的安全 (TLS/SSL) 連接基本塊,因此 TCP 卸載引擎 (TOE) 是用于內(nèi)聯(lián) FPGA 處理的重要卸載塊。企業(yè)防火墻通常同時(shí)終止大量 TCP 連接,這將消耗大量的 CPU 周期與存儲(chǔ)器。為了實(shí)現(xiàn)應(yīng)用級(jí)安全處理,可能需要采用擁有大量核心的昂貴的高端 CPU 來(lái)終止眾多 TCP/UDP 連接。FPGA 中的 TCP 處理實(shí)現(xiàn)方案通過(guò)節(jié)省眾多實(shí)現(xiàn) TOE 所需的內(nèi)核,能夠顯著節(jié)約成本和功耗。
圖 8 顯示了安全設(shè)備中由 FPGA 輔助完成數(shù)據(jù)包處理的示例。由于進(jìn)入防火墻網(wǎng)絡(luò)接口的數(shù)據(jù)包可能屬于眾多不同的應(yīng)用,因此追蹤與多個(gè)應(yīng)用關(guān)聯(lián)的數(shù)據(jù)包,并將其發(fā)送到正確應(yīng)用或者在正確應(yīng)用進(jìn)行接收是一種需要占用大量存儲(chǔ)器的狀態(tài)化操作。此外,上述關(guān)聯(lián)還需要對(duì) TCP 段進(jìn)進(jìn)行重新排序、分段和重組。雖然仍然可以采用 CPU 處理協(xié)議消息的新連接請(qǐng)求與認(rèn)證,但是 FPGA 可以追蹤活動(dòng)會(huì)話并且根據(jù)會(huì)話 ID 將數(shù)據(jù)包分配給相關(guān)應(yīng)用。
圖8 采用 FPGA進(jìn)行應(yīng)用級(jí)狀態(tài)處理
FPGA 中的 TLS 卸載/處理
FPGA 的 TLS 處理功能是 TCP 卸載引擎的擴(kuò)展,其中 TCP 有效載荷的加密與解密在 FPGA 中執(zhí)行。TSL 會(huì)話的發(fā)起與認(rèn)證在軟件中執(zhí)行(CPU)。在建立安全連接時(shí),由 FPGA 執(zhí)行后續(xù)的 TLS 記錄處理。
圖 9 顯示了在賽靈思器件中作為 CPU 卸載的完整內(nèi)聯(lián) SSL 處理功能的組件。賽靈思器件可以實(shí)現(xiàn)整個(gè)邏輯,以處理 100G 以太網(wǎng)接口數(shù)據(jù)包。它可以識(shí)別 TCP 與 TLS 流,并且相應(yīng)地將數(shù)據(jù)包引導(dǎo)到相關(guān) CPU 或者采用可編程資源進(jìn)行處理。
圖9 FPGA 中的 TLS 卸載
FPGA 中的正則表達(dá)式 (Regex)
正則表達(dá)式 (regex) 涉及流量的有效載荷數(shù)據(jù)中字符串或特殊字符的匹配。它廣泛應(yīng)用于 DPI、IPS/IDS、DLP 和 DDoS 防護(hù)。Regex 匹配通常是在軟件中執(zhí)行,其采用專用軟件庫(kù)。由于 regex 搜索需要針對(duì)眾多規(guī)則對(duì)有效載荷進(jìn)行匹配,因此純軟件 regex 處理給新一代安全設(shè)備帶來(lái)了性能與時(shí)延挑戰(zhàn)。
圖 10 說(shuō)明了采用賽靈思器件的 100Gb/s 內(nèi)聯(lián) regex 處理。在此 regex 加速處理模型中,Perl 兼容正則表達(dá)式 (PCRE) 或 Snort 規(guī)則首先在軟件編譯器中進(jìn)行編譯,然后通過(guò) PCI 接口發(fā)送到與 CPU 連接的 FPGA,作為二進(jìn)制字符串匹配規(guī)則條目保存到 FPGA 的內(nèi)部 SRAM 或DRAM(HBM 或 DDR)存儲(chǔ)器。FPGA 會(huì)在內(nèi)部 SRAM 或 DRAM (片上 HBM 或外部 DDR)中填充大量 regex 規(guī)則/條目(轉(zhuǎn)換成二進(jìn)制的特殊字符與字的組合)。regex 處理的內(nèi)聯(lián)加速與軟件相比可以顯著提高性能(10-30 倍)。
圖10 FPGA 中的 Regex 匹配
基于 FPGA 的安全設(shè)備中的機(jī)器學(xué)習(xí) (ML)
在新一代安全設(shè)備中,基于 ML 的流量分析與惡意軟件檢測(cè)是關(guān)鍵應(yīng)用之一。ML 模型將會(huì)被部署用于通過(guò)分析加密數(shù)據(jù)中的特定模式而實(shí)現(xiàn)的加密流量檢測(cè)。在高端安全設(shè)備中,則需要采用 ML 模型處理海量實(shí)時(shí)數(shù)據(jù),以便預(yù)測(cè)異常,因此采用加速器實(shí)現(xiàn) ML 模型將給高吞吐量與低時(shí)延惡意軟件預(yù)測(cè)帶來(lái)巨大優(yōu)勢(shì)。防火墻已經(jīng)開(kāi)始在軟件中部署用于異常檢測(cè)的 ML 模型。在新一代設(shè)備中,賽靈思可編程器件將會(huì)通過(guò)將 ML 模型卸載到可編程邏輯而提供顯著提高的預(yù)測(cè)速度。
此類基于 FPGA 的 ML 模型包括:
● 隨機(jī)樹(shù)(隨機(jī)森林)
● 深度神經(jīng)網(wǎng)絡(luò) (DNN)
o 多層感知機(jī) (MLP) 或卷積神經(jīng)網(wǎng)絡(luò) (CNN)
推斷模型的選擇取決于多種因素,如:準(zhǔn)確性、輸入模式改變頻率、訓(xùn)練需求、FPGA 資源利用率等。
賽靈思 ML 解決方案包括支持大多數(shù)常用 ML 框架的軟件庫(kù)與工具。這些模型可以高效映射到賽靈思可編程器件以及 Versal ACAP 所提供的 AI 引擎中的查找表 (LUT)、DSP 與 SRAM/DRAM 存儲(chǔ)器。
針對(duì) FPGA 中安全分析功能實(shí)現(xiàn) ML 模型的另一個(gè)優(yōu)勢(shì)是惡意軟件預(yù)測(cè)所需要的內(nèi)聯(lián)流量/數(shù)據(jù)包處理可以在同一個(gè) FPGA 中執(zhí)行。在 ML 模型的內(nèi)聯(lián)實(shí)現(xiàn)方案中,將網(wǎng)絡(luò)接口連接到同一個(gè) FPGA 可以節(jié)省從 CPU 向 ML 模型發(fā)送數(shù)據(jù)所需的 PCIe? 帶寬。
圖 11 顯示了 ML 模型在 200Gb/s 防火墻中的應(yīng)用。TLS 處理器具有 TSL 解析器以及 IP 數(shù)據(jù)報(bào)中 TLS 參數(shù)提取功能。隨后,這些參數(shù)反饋給 ML<5018/> 處理器,以便查找和調(diào)節(jié) ML 模型的系數(shù)。根據(jù)相關(guān)系數(shù),模型可以預(yù)測(cè) TSL 流量的善意與惡意簽名。
圖11 安全設(shè)備中的 ML 模型
采用 FPGA 的新一代安全技術(shù)
后量子加密
眾多現(xiàn)有的非對(duì)稱算法容易受到量子計(jì)算機(jī)的破壞。對(duì)量子計(jì)算安全加密算法的研究和實(shí)現(xiàn)已經(jīng)起步,而已經(jīng)有學(xué)術(shù)論文介紹了如何采用 FPGA 實(shí)現(xiàn)此類算法。RSA-2K、RSA-4K、ECC-256、DH 和 ECCDH 等非對(duì)稱安全算法受到量子計(jì)算技術(shù)的影響最大。目前正在探討新的非對(duì)稱算法實(shí)現(xiàn)方案和 NIST 標(biāo)準(zhǔn)化。
目前提議的后量子加密(PQC)包括針對(duì)以下方面的環(huán)上誤差學(xué)習(xí) (R- LWE) 算法:
● 公共密鑰加密 (PKC)
● 數(shù)字簽名
● 密鑰創(chuàng)建
提議的公共密鑰加密的實(shí)現(xiàn)方案包括某些眾所周知的數(shù)學(xué)運(yùn)算(TRNG、高斯噪聲采樣器、多項(xiàng)式加法、二進(jìn)制多項(xiàng)式定標(biāo)器除法、乘法等)。用于眾多此類算法的 FPGA IP 已經(jīng)面世或者可以采用 FPGA 構(gòu)建塊高效實(shí)現(xiàn),如:現(xiàn)有的和新一代賽靈思器件中的 DSP 與 AI 引擎。
安全訪問(wèn)服務(wù)邊緣 (SASE)
安全訪問(wèn)服務(wù)邊緣 (SASE) 是新興的新一代企業(yè)安全技術(shù),旨在滿足企業(yè)的動(dòng)態(tài)安全訪問(wèn)需求。SASE 的早期定義在企業(yè)邊緣集成自適應(yīng)網(wǎng)絡(luò)與安全需求,其中包括 SD-WAN、軟件與物理防火墻以及網(wǎng)絡(luò)安全網(wǎng)關(guān)。SASE 需要采用動(dòng)態(tài)安全策略更新來(lái)提供對(duì)聯(lián)網(wǎng)應(yīng)用的不間斷安全訪問(wèn)。
采用 FPGA 在硬件中實(shí)現(xiàn) SASE 剛剛起步,不過(guò),由于 FPGA 具有全面的可編程能力,因此它們?nèi)匀荒軌蛲ㄟ^(guò) L2/L3/L4 加密技術(shù)和上述其他技術(shù)在流量處理以及動(dòng)態(tài)安全連接流水線的提供方面起到重要作用。
用于安全設(shè)備的賽靈思工具與 IP
賽靈思器件具有高性能可編程資源以及業(yè)界一流的工具與 IP,是設(shè)計(jì)和實(shí)現(xiàn)網(wǎng)絡(luò)流量安全處理的理想選擇。它們可以提供最高數(shù)據(jù)與信號(hào)處理能力,以及最新的多速率高吞吐能力。SerDes 用于符合最新接口標(biāo)準(zhǔn)的設(shè)計(jì),其中包括 1G-400G 以太網(wǎng)、600G Interlaken 以及高達(dá) 400G PCIe 吞吐量。此外,賽靈思器件還提供注冊(cè)裸片間路由線路,可支持高達(dá) 600MHz 可編程邏輯運(yùn)算。
除了基本的高性能設(shè)計(jì)資源,賽靈思還提供用于安全處理的多種設(shè)計(jì) IP。這些可編程 IP 包括 MAC 接口、用于向/從主機(jī)傳輸數(shù)據(jù)的高速 DMA、用于流量分類與路由的搜索 IP(BCAM、TCAM 與 STCAM)以及使用 AES-GCM 密碼進(jìn)行批量加密的片上 HBM 和/或 DDR 存儲(chǔ)器接口與軟加密引擎 (SCE)。
此外,賽靈思還擁有合作伙伴生態(tài)系統(tǒng),其可以提供采用多種密碼協(xié)議的批量加密端到端解決方案,以及使用大多數(shù)常見(jiàn)密鑰交換(ECCDH、RSA-2K、RSA-4K 等)進(jìn)行非對(duì)稱加密的 IP。除了來(lái)自合作伙伴的基礎(chǔ)級(jí)標(biāo)準(zhǔn)加密 IP 之外,賽靈思目前還在與合作伙伴合作實(shí)現(xiàn)高級(jí) (L4+) 安全 IP,其中包括:
● 帶有大量活動(dòng)會(huì)話的 TCP 卸載引擎
● 內(nèi)聯(lián) SSL 卸載參考設(shè)計(jì)
● 應(yīng)用級(jí)安全卸載(5G L2 加速)
● 10K+ IPSec 會(huì)話數(shù)據(jù)包處理
賽靈思的最新器件 (Versal? Premium ACAP)配備有硬化高速加密引擎 (HSC),可用作加密引擎,實(shí)現(xiàn)基于 AES-GCM 協(xié)議的高達(dá) 400Gb/s 的 MACSec、IPSec 或 SSL 處理。每個(gè) HSC 引擎都能夠以 1x400G、2x200G 或 4x100G 通道化模式支持 MACSec、IPSec 和任何其他批量加密需求,每 100G 最多支持 128 個(gè)安全關(guān)聯(lián) (SA)。采用可編程邏輯可以實(shí)現(xiàn)其他SA。
總結(jié)
由于通信網(wǎng)絡(luò)(邊緣、接入和核心網(wǎng))正在向具有應(yīng)用級(jí)政策感知功能的更高性能轉(zhuǎn)型,對(duì)更高吞吐量的安全處理的需求已經(jīng)大幅增加。此外,隨著接入技術(shù)的升級(jí)以及 5G 接入技術(shù) (xHaul)、新一代 PON 和有線網(wǎng)絡(luò)的部署,接入網(wǎng)絡(luò)的設(shè)備數(shù)量會(huì)以指數(shù)方式增長(zhǎng)。新一代網(wǎng)絡(luò)安全設(shè)備需要具備 2~4 倍吞吐量,用于 L2 (MACSec) 安全與 L3 (IPSec) 安全處理。此外,新一代網(wǎng)絡(luò)會(huì)更多依賴意圖與策略,因此對(duì)高吞吐量應(yīng)用級(jí)安全處理(L4-L7 安全)的需求已經(jīng)顯著增加。高吞吐量應(yīng)用安全實(shí)現(xiàn)方案需要高吞吐量數(shù)據(jù)包處理,以及用于加密需求的大量計(jì)算資源。純軟件應(yīng)用安全實(shí)現(xiàn)方案無(wú)法滿足對(duì)性能與時(shí)延的期望。對(duì)于 5G 低時(shí)延應(yīng)用來(lái)說(shuō),時(shí)延需求更加重要,因此,采用可編程加速器作為內(nèi)聯(lián)安全處理器在新一代安全設(shè)備中的重要性日益突出。
在新一代防火墻中采用賽靈思器件不僅可以解決吞吐量和時(shí)延問(wèn)題,其他優(yōu)勢(shì)還包括助力新技術(shù)的實(shí)現(xiàn),如:機(jī)器學(xué)習(xí) (ML) 模型、安全訪問(wèn)服務(wù)邊緣 (SASE) 和后量子加密 (PQC)。賽靈思器件可以為面向這些技術(shù)的硬件加速提供理想平臺(tái),因?yàn)閮H用軟件實(shí)現(xiàn)方案無(wú)法滿足性能需求。賽靈思正在針對(duì)現(xiàn)有的和新一代網(wǎng)絡(luò)安全解決方案不斷開(kāi)發(fā)和升級(jí)IP、工具、軟件以及參考設(shè)計(jì)。
評(píng)論