中科馭數DPU技術開放日
一、DPU的產業應用價值及落地情況
本文引用地址:http://www.ex-cimer.com/article/202403/457021.htm· 證券基金行業
金融信創已步入深水區,由“邊緣替代”邁向“核心替代”。在金融行業,核心交易系統對網絡時延的需求從毫秒級提升到微秒甚至納秒,低時延網絡領域的核心設備長期被國外廠商Solarflare與Mellanox壟斷,時延和安全問題成了制約銀行、證券、期貨等行業發展的難點之一,行業內純軟件的加速方案遭遇瓶頸,超低時延網絡解決方案可有效解決這一難題,并實現完全自主可控。
中科馭數基于自主研發的低時延網絡DPU卡構建超低時延網絡,支撐金融交易核心鏈路從底層硬件到上層應用系統具備超低時延、低抖動、完全自主可控等特性,在超低時延網絡領域真正打破壟斷,實現國產升級替代。目前,中科馭數的DPU系列產品已經在金融證券領域實現規?;涞?,同時也是上交所天相實驗室、以及申萬宏源、東證期貨等低時延實驗室參與方,助力超過30家金融機構完成核心超低時延系統替換,有力保障金融系統的平穩運行。
以國內某頭部證券機構廠商的落地情況為例,中科馭數低時延網絡DPU卡在部署某金融機構核心交易系統之后,解決了該金融機構交易系統的低時延問題,幫助高頻交易客戶實現交易全鏈路時延優化,滿足了核心交易場景下對低時延、低抖動的極致要求。
中科馭數低時延網絡DPU卡作為證券交易鏈路的關鍵一環,對于證券行業全國產信創改造至關重要。申萬宏源聯合中科馭數等多家軟硬件廠商成立低時延實驗室,針對國內證券機構核心業務全信創改造的可能性進行了權威實驗測試,全面對比了全信創方案與非信創方案在基礎設施測評、以及業務系統測評下的不同技術性能表現。測試結果顯示,基于當前性能最優的超頻服務器,與Arista7150構成的集成測試環境中,D廠柜臺在使用中科馭數網卡時性能表現最佳,柜臺應答全鏈路時延領先17%;相比當前半信創生產環境,采用華為CE6885 + 鯤鵬920 + 中科馭數SWIFT-2200N,在全信創環境下整體提升6%-11%。鏈接參考:https://mp.weixin.qq.com/s/kpA32s8X1oJiFmwy6DKvmQ
隨著信創全面提速和展開,信創云也是當前證券機構上云的重要選擇。東方證券信創云平臺歷時4年多的持續建設和技術積累,目前已初具規模。從2023年開始,東方證券開始和中科馭數接觸,進行相關技術研討和產品的POC測試,嘗試引入低時延技術引入到我們信創云之中。隨著國產DPU卡的引入,進一步優化低時延信創云平臺業務架構,圍繞信創建設和時延優化雙重目標,打造一云多芯、超低時延的信創云?!耙辉贫嘈尽?作為信創產業鏈承上啟下的關鍵環節,對下納管多種國產CPU和DPU網絡設備,實現統一調度資源,屏蔽底層差異性;對上兼容各種國產操作系統、國產數據庫和各類低時延應用。
· 銀行
在銀行領域,近年來移動互聯網與金融科技的飛速發展,銀行數據中心的業務請求數量以及數據處理數量極速上漲。同時由于金融創新需求,銀行業開展的的業務種類也呈現爆發式增長。這些現狀都對銀行業的IT基礎設施,尤其是云化設施提出了新的嚴苛挑戰。隨著云原生技術的發展,其更加輕量的應用部署策略與更加完善的生命周期管理機制,逐漸成為下一代云計算的操作系統基座。同時,隨著數據中心網絡帶寬的更新換代以及存儲技術的進步,云計算基礎設施消耗的CPU資源逐漸增加。
在此背景下,作為中科馭數重要客戶的某大型國有銀行希望能借助新興的DPU技術完成下一代云計算系統的驗證與建設,達到降本增效的目的。中科馭數解決方案可以匹配該銀行的各種應用需求,包括高性能網絡、存儲底座,虛擬機、容器與裸金屬服務器的共池管理,VPC網絡等,可以幫助銀行數據中心高效、安全、平穩地過渡到云原生業務架構。
· 云計算
中科馭數的DPU產品已經在某頭部云計算廠商的云數據中心中落地?;贒PU的方案使得裸金屬服務的業務邏輯發生了明顯變化,可以大大縮短裸金屬服務的交付時間,實現了虛擬網絡功能的全面卸載,也為存算分離相關的多種存儲技術提供了統一的接口。中科馭數自主研發的DPU產品不但能夠提升云數據中心業務的性能表現,節省寶貴的算力資源,還可以從根本上消除非國產設備導致的潛在安全風險。
在某大型金融機構的數據中心中,DPU的高吞吐和低延遲特性幫助了該數據中心高效、安全、平穩地過渡到云原生業務架構,為其打造了更為高效可靠、自主可控的金融交易底座。憑借DPU芯片在新型數據中心的落地實踐,中科馭數相關產品和解決方案獲評新型數據中心創新發展案例。
· 5G通信
中科馭數是國內三大運營商的硬件合作伙伴,共同探索DPU在5G通信和云計算領域的技術解決方案。在5G通信網絡快速發展的過程中,算力和網絡融合發展需要更加綠色高效的數據處理硬件加速技術,亟待DPU提升系統性能。DPU將在高性能數據處理、低延遲數據傳輸、網絡管理、存儲以及安全等基礎設施底層建設發揮關鍵作用。DPU通過接手CPU不擅長的網絡協議處理、數據加解密等數據處理任務,不僅可以提高網絡傳輸效率,而且釋放了CPU算力資源。在新型算力DPU的加持下,能夠提供靈活高效的硬件加速服務,支持云基礎設施層功能卸載,云邊協同、云網一體都將逐步實現。
聯通研究院曹暢博士曾在2023中國計算機大會上表示,DPU是銜接計算和網絡兩大領域的重要樞紐,云、網、算協同,通過資源的深度感知與一體化編排,可以實現算力發現和跨域互通,打通數據與計算節點的通路。DPU作為網絡和計算的銜接點,可解決數據傳輸的“最后一米”問題。通過DPU可以實現虛擬化層的全卸載和定制化的業務加速能力,具有更強的可編程能力。
對于未來中國聯通研究院與中科馭數的合作,中國聯通研究院唐雄燕院長也表達了三點期待:一是在談到未來移動通信研究時,表達了借用DPU技術提供新的高效能硬件加速解決方案的期望。二是認為在引入DPU后,雙方可以為聯通包括云服務、超算服務等在內的服務體系提供差異化的服務,通過深度融合創新技術為用戶提供更靈活、高效的服務。三是積極探索在算網融合技術的研發和推廣應用,共建算力網絡生態。
中國移動云能力中心劉軍衛也在2023移動云大會中分享到,中國移動將助力打造國家級自主可控的高性能算力基礎設施,通過布局國產化智算生態、共建自主GPU+DPU產業聯盟、聯創高性能網絡技術三大舉措,帶動國產化智算產業成熟發展,抓住云計算技術定義權,引領云計算市場下一個黃金十年。到2024年,打通DPU、GPU、HPN三大單元,面向大模型場景打造一套全棧自主可控的系統。
二、中科馭數DPU技術開放日解決方案相關簡介
10:00-10:05 | 開場致辭 |
10:05-10:20 | 高性能云原生底座方案 三尺青鋒懷天下,一騎白馬開吳疆 為IaaS服務安裝DPU加速引擎 本方案使用支持RDMA協議的DPU卡代替傳統網卡,將RDMA網絡應用于并行文件系統,用RDMA高性能網絡替代傳統TCP/IP網絡?;赗DMA協議零拷貝、內核旁路的特性,大幅降低并行文件系統在數據讀寫,數據傳輸的時延,提高帶寬利用率,進而提升并行文件系統整體性能。同時利用DPU卡上的VirtIO-FS技術,將業務側host的虛擬化功能卸載至DPU,減少host端CPU的算力損耗。 |
10:20-10:45 | 基于DPU的極速服務網格方案 服務網格化繁為簡,為云原生業務提供極致時延體驗 本方案將服務網格的sidecar容器集中卸載到DPU卡上執行,可以顯著降低服務器CPU的算力消耗。同時,DPU卡對容器網絡CNI進行了硬件卸載,高性能轉發引擎實現了網絡轉發功能的加速,從而能夠有效降低業務時延。該方案支持和原生Istio的無縫對接,對用戶業務無侵入,可以實現業務的平滑遷移。 |
10:45-11:00 | 高性能國產密碼卸載方案 自主研發加解密引擎,助力安全業務高效運營 本方案通過自主研發的加解密算力引擎,將加密協議、密碼算法完全卸載到DPU卡上,突破傳統VPN產品的加解密性能瓶頸,充分釋放主機CPU資源,可以適用于國產化服務器平臺;支持可編程轉發引擎,實現非VPN場景用戶對指定報文的加解密運算;支持TRNG、SM國密算法及國際算法,滿足國家商密認證技術要求;支持防火墻訪問控制功能,為每臺服務器提供分布式貼身隔離防護,助力安全業務高效運營。 |
11:00-11:15 | RDMA加速并行文件系統解決方案 RDMA網絡DPU卡,解鎖存算高速通道 本方案使用支持RDMA協議的DPU卡代替傳統網卡,將RDMA網絡應用于并行文件系統,用RDMA高性能網絡替代傳統TCP/IP網絡?;赗DMA協議零拷貝、內核旁路的特性,大幅降低并行文件系統在數據讀寫,數據傳輸的時延,提高帶寬利用率,進而提升并行文件系統整體性能。同時利用DPU卡上的VirtIO-FS技術,將業務側host的虛擬化功能卸載至DPU,減少host端CPU的算力損耗。 |
11:15-11:30 | 證券期貨交易信創低時延網絡解決方案 異構加速 技術創新 自主安全 時延領先 在證券期貨交易領域,時延關乎收益。隨著國內金融信創快速推進,國內金融機構對國產高性能、低時延網絡方案,有著迫切的需求。 面向證券期貨交易場景,中科馭數推出了信創低時延網絡解決方案,基于自主研發并量產的低時延網絡DPU卡KPU SWIFT-2200N和超低時延數據處理開發平臺NDPP,搭配6大國產CPU構建低時延服務器,在系統層兼容各類國產操作系統,在應用層廣泛適配多家業內金融軟件廠商的交易系統,從而支撐核心交易業務從底層硬件到上層軟件,向全信創平臺遷移,同時還能獲取媲美非信創的時延性能。 整體方案,在性能上達到國際領先的水平,完備的生態為業務提供端到端的保障,業內權威機構的認證評測讓方案成為信創示范標桿,馭數的專業化交付運維和技術支持讓客戶創新無憂。 |
三、中科馭數企業基本情況
· 中科馭數是DPU新型算力基礎設施領軍企業
中科馭數專注于DPU芯片的研發設計,基于自研KPU芯片架構率先在國內進行了三代DPU芯片研發。自主研發的國際領先DPU芯片及系列產品,可以廣泛應用于超低延遲網絡、云和數據中心、金融計算、大數據處理、5G邊緣計算、高性能計算等場景,助力算力成為數字時代的新生產力。
發展至今,中科馭數從芯片底層架構,到網絡、存儲、計算等上層應用系統,已形成深厚的核心技術積累,成長為DPU芯片細分領域內唯一的國家專精特新小巨人企業、國家高新技術企業、北京市知識產權試點單位,獲得了多項國家級及省部級科技獎項。中科馭數牽頭并參與了30余項行業標準及團隊標準的制定,是DPU標準的重要推動者和參與者。
· 軟硬協同發展的技術路線
DPU的研發基于軟硬協同的自主研發技術。芯片設計的核心技術方面,中科馭數創新性地提出了軟件定義加速器(Software Defined Accelerator)技術路線,自主開發敏捷異構KPU創新架構,解決DPU芯片設計碎片化的問題,具有軟件定義可配置、低設計成本、計算高效的優勢。在芯片軟件生態方面,中科馭數自研的DPU軟件開發平臺HADOS,可兼容多種操作系統,大幅降低應用軟件開發難度。
· 中科馭數芯片產品及解決方案布局
中科馭數基于DPU打造超低時延網絡、云原生網絡、智算網絡三大方案,搭建了完善的應用生態,客戶可覆蓋云服務廠商、數據中心、運營商、證券基金、銀行等數字經濟領域企業。
· 中科馭數生態建設情況
基DPU軟件開發平臺HADOS,中科馭數全面擁抱國產化生態,已與國內6大CPU芯片、12家主流操作系統、9家主流數據庫廠商、8家頭部云/云原生廠商、17家TOP級服務器廠商完成兼容性適配。參與10大開源社區平臺,共同推動技術發展
四、DPU技術發展背景
· DPU已被證明是支撐下一代數據中心IaaS及PaaS的重要基礎設施
隨著信息技術的持續發展,數據中心網絡帶寬從100G邁入400G,甚至將提升至800G或1.6T。然而,作為提供算力的物理載體,受限于通用CPU的結構的馮諾依曼瓶頸、摩爾定律逐漸失效等因素的影響,以CPU為網絡核心的數據處理能力難以支持大規模新型數據中心的網絡和數據的算力需求。在此背景下,DPU已經成為繼CPU、GPU之后未來數據中心的第三顆主力芯片。
舉例來說,如果將數據中心中的每一臺服務器比喻為一座“城市”,在每個城市人口不斷膨脹,城市間交互需求爆炸式增長的背景下,對比傳統網卡,DPU幫助數據中心完成了從“鄉間公路”到“高速鐵路”的轉變。DPU提供的高吞吐、低時延、基礎設施卸載能力,幫助數據中心完美的規避了“信息孤島”問題。未來的技術發展趨勢將會是高度集成化的片上數據中心的模式(Data Center Infrastructure on a chip),即一個GPU、CPU、DPU共存的時代。
· DPU國內市場規模巨大
隨著新一代信息技術發展、算力應用場景不斷涌現,數據中心需求穩步提升,未來國內數據中心建設將繼續加大。根據2023年《中國數據中心產業發展白皮書》,預計至 2025 年“十四五”規劃期末,擬實現數據中心機架規模增長至 1400 萬架,規??偭糠瓋杀?,總增量投資約 7000 億元。
按服務器規模預計,未來幾年云與數據中心領域每年國內服務器出貨量將維持在500萬臺左右,其中DPU滲透率在10%左右,單臺服務器可以配置一塊到多塊DPU板卡,預計每年DPU需求量將在100萬片左右。
· 政策密集出臺,利好DPU產業發展
信創產業是數字經濟、信息安全發展的基礎。從國家層面的頂層設計、到地方發展規劃,加快建設算力基礎設施的各種重磅政策和方案接連出臺,產業技術創新受到高度重視。國家十四五規劃明確將“自主可控”列為制造強國戰略的必要要求。與CPU、GPU芯片一樣,當前國產自主網卡芯片的市場占有率極低。根據國務院印發的《新時期促進集成電路產業和軟件產業高質量發展的若干政策》要求,中國芯片自給率要在2025年達到70%。
2023年10月,工信部、中央網信辦、國務院國資委等六部門2023年10月聯合印發《算力基礎設施高質量發展行動計劃》,提出到2025年,算力規模超過300 EFLOPS,并將數據處理器 (DPU) 設為重要任務之一。
評論