利用 IP 融合云計(jì)算基礎(chǔ)架構(gòu)
數(shù)據(jù)中心工作負(fù)載和計(jì)算應(yīng)用程序不斷從傳統(tǒng)數(shù)據(jù)中心遷移到超大規(guī)模數(shù)據(jù)中心。根據(jù) Cisco 全球云指數(shù) 測(cè)算,“到 2021 年,94% 的工作負(fù)載和計(jì)算實(shí)例都將在云數(shù)據(jù)中心進(jìn)行處理”(圖 1)。雖然許多應(yīng)用程序由超大規(guī)模的公共云運(yùn)營(yíng)商托管,但許多關(guān)鍵任務(wù)工作負(fù)載和計(jì)算實(shí)例都是由私有超大規(guī)模數(shù)據(jù)中心托管的。預(yù)計(jì)從 2016 年到 2021 年,私有超大規(guī)模數(shù)據(jù)中心將以 11% 的復(fù)合年增長(zhǎng)率增長(zhǎng)。雖然大型云提供商開發(fā)了定制的機(jī)架級(jí)系統(tǒng),但私有云提供商通常采用融合基礎(chǔ)架構(gòu) (CI) 或超融合基礎(chǔ)架構(gòu) (HCI) 系統(tǒng)來(lái)提高效率并降低管理成本。CI 系統(tǒng)和 HCI 系統(tǒng)使私有云提供商能夠通過(guò)自動(dòng)化系統(tǒng)配置和控制、虛擬化計(jì)算、存儲(chǔ)和網(wǎng)絡(luò)操作,大規(guī)??焖俨渴鹦孪到y(tǒng)。向 CI 和 HCI 系統(tǒng)的過(guò)渡正在影響半導(dǎo)體片上系統(tǒng) (SoC) 供應(yīng)商,促使他們對(duì)其服務(wù)器處理器、低延遲存儲(chǔ)固態(tài)硬盤 (SSD) 和網(wǎng)絡(luò)交換機(jī)設(shè)計(jì)加以優(yōu)化。對(duì) CI 和 HCI 系統(tǒng)的需求推動(dòng)了一類新型 SoC 架構(gòu)的產(chǎn)生,這些架構(gòu)需要最新的 IP 來(lái)執(zhí)行產(chǎn)業(yè)功能,如 PCI Express (PCIe)、DDR5、緩存一致性、NVMExpress (NVMe) SSD 存儲(chǔ)和最高帶寬以太網(wǎng)網(wǎng)絡(luò)。
本文引用地址:http://www.ex-cimer.com/article/202204/432744.htm圖 1:在傳統(tǒng)和云數(shù)據(jù)中心之間分配 Cisco 工作負(fù)載和計(jì)算實(shí)例1
CI 系統(tǒng)將計(jì)算、存儲(chǔ)、網(wǎng)絡(luò)和管理結(jié)合到同一套解決方案中,而不是作為不同的數(shù)據(jù)中心功能提供。功能全面的 CI 和 HCI 系統(tǒng)實(shí)現(xiàn)了整體管理的自動(dòng)化,使 IT 人員能夠?qū)P墓芾響?yīng)用程序,而不是基礎(chǔ)架構(gòu)。預(yù)先集成的機(jī)架級(jí)系統(tǒng)降低了整體復(fù)雜性,以及集成和運(yùn)營(yíng)成本。CI 和 HCI 可實(shí)現(xiàn)更快的系統(tǒng)部署、更輕松的互操作性和穩(wěn)定的管理,同時(shí)還可減少培訓(xùn)和技術(shù)支持的開銷。為了滿足效率和性能要求,用于構(gòu)建 CI 和 HCI 系統(tǒng)的 SoC 元件(如設(shè)計(jì) IP)正在針對(duì)處理、內(nèi)存性能和連接功能進(jìn)行優(yōu)化。
利用 NVMe SSD 和基于 PCIe 的加速器提高性能
基于服務(wù)器的 SSD 可以利用在 PCIe IP 接口上運(yùn)行的 NVMe 協(xié)議直接連接到服務(wù)器 CPU,同時(shí)還能用作緩存加速器,極其快速地緩存頻繁訪問(wèn)的數(shù)據(jù)或“熱”數(shù)據(jù)。高性能的 NVMe SSD 利用極其高效的輸入/輸出操作和低讀取延遲特性在 PCIe 上運(yùn)行,不僅提高了服務(wù)器的效率而且避免了通過(guò)外部存儲(chǔ)設(shè)備訪問(wèn)數(shù)據(jù)的必要性。在 PCIe 上運(yùn)行、以實(shí)現(xiàn)服務(wù)器加速的 NVMe SSD 非常適合針對(duì)數(shù)據(jù)庫(kù)查詢的私有云的高處理量應(yīng)用程序。
除了使用基于 PCIe 的 NVMe SSD 進(jìn)行數(shù)據(jù)庫(kù)加速外,CI 和 HCI 系統(tǒng)還使用 PCIe 交換機(jī)架構(gòu)來(lái)加速人工智能 (AI) 應(yīng)用的主機(jī)處理器。AI 服務(wù)器需要在處理器加速后才能滿足深度學(xué)習(xí)性能的需求。由于圖 2 所示基于 PCIe 的交換機(jī)架構(gòu)帶來(lái)的低延遲特性,將主機(jī)處理器連接到 GPU 和基于硬件的加速器可對(duì)深度學(xué)習(xí)算法進(jìn)行優(yōu)化。對(duì)于需要緩存一致性的應(yīng)用程序,基于 PCI Express 協(xié)議棧構(gòu)建的加速器緩存一致性互連 (CCIX) 協(xié)議可在主機(jī)處理器和硬件加速器之間進(jìn)行高速連接。當(dāng)前運(yùn)行速率是 25 Gbps 且很快就提高為 32 Gbps 的 CCIX 通過(guò)定義命令,要求在更新內(nèi)存時(shí)即更新系統(tǒng)中的所有組件,確保系統(tǒng)實(shí)現(xiàn)單個(gè)內(nèi)存空間,從而減少?gòu)?fù)制的需求。CCIX 支持交換機(jī)拓?fù)洹⒅边B和網(wǎng)格連接。
圖 2:基于 PCIe 交換機(jī)架構(gòu)的多主機(jī) AI 服務(wù)器
利用高存儲(chǔ)性能優(yōu)化應(yīng)用
經(jīng)過(guò)融合的計(jì)算、存儲(chǔ)和網(wǎng)絡(luò)系統(tǒng)需要性能最高的 DRAM 解決方案才能在主機(jī)處理器上運(yùn)行虛擬應(yīng)用程序。整個(gè)行業(yè)正在從 DDR4 DRAM 過(guò)渡到新一代 DDR5 和 HBM2 DRAM。DDR5 解決方案能夠?qū)崿F(xiàn)高達(dá) 4800 Mbps 的數(shù)據(jù)運(yùn)行速率,從而能夠和每一個(gè)高達(dá) 80 位寬的通道的多個(gè)雙列直插式存儲(chǔ)模塊 (DIMM) 進(jìn)行連接,從而加快了深度學(xué)習(xí)等功能的工作負(fù)載速度。另外,DDR5 還具有可靠性、可用性和可維護(hù)性 (RAS) 功能,包括內(nèi)聯(lián)或邊帶糾錯(cuò)碼 (ECC)、奇偶校驗(yàn)和數(shù)據(jù)循環(huán)冗余校驗(yàn) (CRC),旨在縮短系統(tǒng)停機(jī)時(shí)間。與 DDR5/4 DRAM 相比,HBM2 是一種高效的解決方案,具有很高的帶寬且每比特?cái)?shù)據(jù)的存取功耗最低。SoC 架構(gòu)師會(huì)針對(duì)高帶寬應(yīng)用選擇 HBM2 存儲(chǔ)器,針對(duì)大容量應(yīng)用選擇 DDR5,或者針對(duì)需要高帶寬 HBM2 和大容量 DDR DRAM 的 AI 加速等應(yīng)用結(jié)合使用這兩種存儲(chǔ)器類型。
簡(jiǎn)化數(shù)據(jù)中心網(wǎng)絡(luò)
傳統(tǒng)的企業(yè)數(shù)據(jù)中心采用基于樹的網(wǎng)絡(luò)拓?fù)浣Y(jié)構(gòu),其中包含交換式以太網(wǎng)和 VLAN 標(biāo)記。這種拓?fù)浣Y(jié)構(gòu)僅定義了一條連接網(wǎng)絡(luò)的路徑,通常用于處理服務(wù)器之間的南北數(shù)據(jù)流量。私有云數(shù)據(jù)中心使用的 CI 和 HCI 系統(tǒng)采用扁平的雙層葉脊架構(gòu),具有25G、50G、100G 或 200G 以太網(wǎng)鏈路,使虛擬化服務(wù)器能夠在許多虛擬機(jī)之間分配工作流。最新 400G 八通道小型可插拔 (OSFP) 多模收發(fā)器(采用 8 條通道 56G PAM-4 PHY IP)通過(guò)提供多個(gè) 56G 葉脊鏈路,助力數(shù)據(jù)中心實(shí)現(xiàn)高達(dá) 400G 的以太網(wǎng)網(wǎng)絡(luò)拓?fù)洹I(yè)界正計(jì)劃向 400G 以太網(wǎng)系統(tǒng)所采用的 112G PAM-4 以太網(wǎng)鏈路過(guò)渡,并且期待能夠過(guò)渡到 800G 以太網(wǎng)應(yīng)用。
CI 和 HCI 系統(tǒng)可以使用軟件定義網(wǎng)絡(luò) (SDN) 輕松管理網(wǎng)絡(luò),將控制流與數(shù)據(jù)路徑分離,從而進(jìn)一步簡(jiǎn)化數(shù)據(jù)中心的網(wǎng)絡(luò)。OpenFlow 等通用軟件棧提供了全行業(yè)一致的軟件環(huán)境來(lái)控制 CI 和 HCI 系統(tǒng)。SoC 設(shè)計(jì)人員并非擁有專利軟件堆棧,而是在整個(gè)私有云數(shù)據(jù)中心內(nèi)運(yùn)行由 OpenFlow 管理的數(shù)據(jù),使用戶可以非常輕松地(虛擬)配置網(wǎng)絡(luò),無(wú)需實(shí)際訪問(wèn)網(wǎng)絡(luò)的硬件設(shè)備。
總結(jié)
CI 和 HCI 系統(tǒng)將超大規(guī)模數(shù)據(jù)中心的三個(gè)核心方面(計(jì)算、存儲(chǔ)和網(wǎng)絡(luò))整合到同一套解決方案當(dāng)中。它們?nèi)〈烁鞣N各樣經(jīng)常斷開連接的系統(tǒng)和管理工具。隨著企業(yè)數(shù)據(jù)中心不斷向私有云過(guò)渡,服務(wù)器和數(shù)據(jù)中心開始利用虛擬化進(jìn)行整合,支持將越來(lái)越多的工作負(fù)載放在數(shù)量更少的物理服務(wù)器上運(yùn)行。利用最新的行業(yè) IP 架構(gòu)和接口協(xié)議進(jìn)行系統(tǒng)融合,從而對(duì)低延遲數(shù)據(jù)庫(kù)查詢和深度學(xué)習(xí)等應(yīng)用加以優(yōu)化。CI 和 HCI 系統(tǒng)的硬件在進(jìn)行集成時(shí)使用全新的一套優(yōu)化處理器、高級(jí)存儲(chǔ)器技術(shù) IP、IP 接口、NVMe SSD 和緩存一致性加速器。
為 CI 和 HCI 系統(tǒng)集成處理器 IP、高級(jí)存儲(chǔ)器 IP、連接 IP、NVMe 存儲(chǔ)以及緩存一致性加速器時(shí),SoC 設(shè)計(jì)人員需要考慮成本、功耗、性能和開發(fā)進(jìn)度等因素的技術(shù)權(quán)衡問(wèn)題。圖 3 展示了一個(gè)高級(jí) AI 服務(wù)器 SoC,其中包含主機(jī)處理器、安全算法、系統(tǒng)內(nèi)存、連接和加速器。
圖 3: AI 加速/服務(wù)器 SoC
Synopsys 提供種類齊全、通過(guò)硅驗(yàn)證的優(yōu)質(zhì) IP 產(chǎn)品組合,幫助設(shè)計(jì)人員開發(fā)出面向云計(jì)算應(yīng)用(支持 CI 和 HCI 系統(tǒng))的 SoC。Synopsys DesignWare? 接口 IP、處理器 IP 和基礎(chǔ) IP 在高性能、低延遲和低功耗方面都進(jìn)行了優(yōu)化,同時(shí)支持 16 nm 至 7 nm FinFET 的先進(jìn)處理技術(shù)。
評(píng)論