Enea Element:高可用性(HA)和嵌入式管理中間件
隨著網(wǎng)絡(luò)系統(tǒng)越來越復(fù)雜,整個(gè)系統(tǒng)的可靠性和可管理性變得越來越重要。
本文引用地址:http://www.ex-cimer.com/article/201609/303642.htm網(wǎng)絡(luò)的高可用性包括軟硬件故障的監(jiān)測(cè)和故障恢復(fù),當(dāng)軟硬件出現(xiàn)異常時(shí)通過冗余和狀態(tài)同步等方式實(shí)現(xiàn)無(wú)縫恢復(fù),保證系統(tǒng)業(yè)務(wù)不間斷。同時(shí)還要承擔(dān)分布式系統(tǒng)的通訊,調(diào)試以及軟件的升級(jí)管理。
可管理性主要是針對(duì)復(fù)雜網(wǎng)絡(luò)節(jié)點(diǎn)環(huán)境(包括基于云端或者NVF的虛擬節(jié)點(diǎn))如何實(shí)現(xiàn)北向接口和南向接口的自動(dòng)通訊,包括配置數(shù)據(jù)和狀態(tài)數(shù)據(jù)的異步更新和通知機(jī)制來實(shí)現(xiàn)對(duì)整個(gè)系統(tǒng)的管理和維護(hù)。
Enea Element主要實(shí)現(xiàn)了HA要求的分布式管理、高可用性管理、CheckPoint、In Service軟件升級(jí)、嵌入式設(shè)備管理、機(jī)架管理、LOG管理等多種功能?;贓lement可以極大地減少用戶部署HA應(yīng)用的開發(fā)維護(hù)工作量。
嵌入式管理是針對(duì)嵌入式設(shè)備而設(shè)計(jì)的標(biāo)準(zhǔn)的、模塊化的管理系統(tǒng)中間件。對(duì)外提供北向接口(Northbound API)和南向接口(Southbound API)分別和運(yùn)營(yíng)管理系統(tǒng)、應(yīng)用程序集成。通過YANG語(yǔ)言進(jìn)行建模,實(shí)現(xiàn)對(duì)嵌入式設(shè)備的配置數(shù)據(jù),運(yùn)行狀態(tài)數(shù)據(jù)進(jìn)行實(shí)時(shí)管理。
Element具有10+年的現(xiàn)場(chǎng)應(yīng)用成功案例,如成功部署到電信設(shè)備、衛(wèi)星控制和國(guó)防軍工等關(guān)鍵領(lǐng)域。
Element系統(tǒng)架構(gòu)
Core Services (核心服務(wù))
l 基于LINX的消息機(jī)制:提供一個(gè)可靠、高速的進(jìn)程間通訊機(jī)制,和消息發(fā)布/訂閱、流控、命名服務(wù)的透明傳輸機(jī)制。
l 調(diào)試框架:提供系統(tǒng)及調(diào)試工具。調(diào)試工具可以提供可定制命令服務(wù),消息trace跟蹤服務(wù)。
l 提供基于網(wǎng)頁(yè)和CLI的命令人機(jī)接口,可以方便的對(duì)整個(gè)系統(tǒng)進(jìn)行配置和監(jiān)測(cè)。
l 系統(tǒng)LOG服務(wù);通用工具:提供通用API框架和數(shù)據(jù)類型轉(zhuǎn)換功能。
High Availability (高可用性)
l 出錯(cuò)管理:提供系統(tǒng)運(yùn)行監(jiān)控、狀態(tài)檢測(cè)、事件驅(qū)動(dòng)策略和故障主動(dòng)通知功能,AMF框架完全符合SAF B.02.01標(biāo)準(zhǔn)。
l 支持AMF要求的2N,N+M,N-Way,N-Way Active和No Redundancy多種冗余模型組合。
l Checkpoint服務(wù):Element提供一個(gè)輕量級(jí)的實(shí)時(shí)數(shù)據(jù)庫(kù)來動(dòng)態(tài)保護(hù)系統(tǒng)狀態(tài)信息。
l 異常狀態(tài)歷史記錄:可以動(dòng)態(tài)記錄系統(tǒng)中各個(gè)組件的異常狀況,并以后續(xù)分析和跟蹤。
Chassis Management (機(jī)架管理)
l 提供符合標(biāo)準(zhǔn)HPI的軟硬件接口,無(wú)縫適配業(yè)界主流ATCA硬件,并可以支持硬件熱插拔功能。
l 節(jié)點(diǎn)管理:提供發(fā)現(xiàn),狀態(tài)監(jiān)控和HPI管理功能。
l 告警服務(wù):提供硬件異常告警功能。
ISU (軟件熱升級(jí)功能)
l 提供完整的在線升級(jí)功能,在升級(jí)過程中避免中斷現(xiàn)有進(jìn)行中的業(yè)務(wù)。
l 對(duì)Element本身和用戶程序提供無(wú)縫的在線升級(jí)功能。
Enea 嵌入式管理 (Embedded Management)
Embedded Management針對(duì)嵌入式設(shè)備而設(shè)計(jì)的標(biāo)準(zhǔn)的、模塊化的管理系統(tǒng)中間件。對(duì)外提供北向接口(Northbound API)和南向接口(Southbound API)分別和運(yùn)營(yíng)管理系統(tǒng)、應(yīng)用程序集成。通過YANG語(yǔ)言進(jìn)行建模,實(shí)現(xiàn)對(duì)嵌入式設(shè)備的配置數(shù)據(jù),運(yùn)行狀態(tài)數(shù)據(jù)進(jìn)行實(shí)時(shí)管理。
北向接口
l CLI:類似于Juniper命令行接口
l XML-RPC:基于http-based XML-RPC
YANG模型
l 基于YANG模型來組織系統(tǒng)配置和數(shù)據(jù)
l 支持RPC directive
l 支持完備的數(shù)據(jù)類型
支持Session和AAA認(rèn)證機(jī)制
l 提供mediation layer,支持Session機(jī)制
l 集成了AAA驗(yàn)證機(jī)制,提供訪問權(quán)限控制
l 提供賬戶審計(jì)信息記錄
ACID Transaction Support
l 支持Transaction回滾Rollback操作
l 配置數(shù)據(jù)冗余存儲(chǔ),保證配置可靠
配置數(shù)據(jù)管理
l 配置數(shù)據(jù)能導(dǎo)出,導(dǎo)入和永久保存
l 支持running和startup兩種配置存儲(chǔ)
南向接口API
l 配置數(shù)據(jù),基于配置對(duì)象級(jí)別的配置更新
l 狀態(tài)數(shù)據(jù),基于狀態(tài)對(duì)象級(jí)別的配置更新
l 配置數(shù)據(jù)改變后,通過異步API接口通知應(yīng)用
Element案例 – uTCA / ATCA / 服務(wù)器數(shù)據(jù)通訊應(yīng)用
Element for uTCA / ATCA 平臺(tái)提供:
l Cluster內(nèi)部有2塊控制板和4塊高速數(shù)據(jù)板卡構(gòu)成6個(gè)Node(節(jié)點(diǎn))
l Node間通過高速以太網(wǎng)卡和光纖互聯(lián),軟件通過Enea LINX互聯(lián)
l Element對(duì)整個(gè)系統(tǒng)內(nèi)組件進(jìn)行高可用性管理,并通過Checkpoint實(shí)現(xiàn)運(yùn)行狀態(tài)備份和恢復(fù)
l 系統(tǒng)運(yùn)行Polyhedra內(nèi)存數(shù)據(jù)庫(kù),用于海量數(shù)據(jù)管理
l Node采用電信級(jí)Enea Linux為整個(gè)Cluster提供操作系統(tǒng)平臺(tái)
l 用戶后臺(tái)可以通過CLI或者Web方式對(duì)系統(tǒng)進(jìn)行配置、管理和狀態(tài)查詢
Element案例 – Cloud 應(yīng)用
Element Cloud 平臺(tái)提供:
l 配置數(shù)據(jù)和操作狀態(tài)數(shù)據(jù)配置管理
l 標(biāo)準(zhǔn)SAF高可用冗余方案
l 基于狀態(tài)備份的HA功能
l 系統(tǒng)的監(jiān)控
l 軟件升級(jí)管理
l 軟件發(fā)布更新
l 基于ACL訪問控制配置操作
基于Cloud的分布式通訊采用LINX over TCP/IP 架構(gòu),并實(shí)現(xiàn)對(duì)OpenStack的集成。
評(píng)論