COM-HPC整合IPMI 提升邊緣服務(wù)器服務(wù)質(zhì)量
PICMG發(fā)表針對嵌入式系統(tǒng)平臺管理的COM-HPC接口規(guī)范,目的為協(xié)助邊緣服務(wù)器工程師遠程管理系統(tǒng)。例如當系統(tǒng)當機時,IT管理員可按下重置按鈕,發(fā)揮與親臨車間或其他場所相同的效果。該規(guī)范專為以COM-HPC嵌入式計算機模塊為基礎(chǔ)的邊緣計算機而設(shè)計,旨在簡化維護及提升服務(wù)質(zhì)量。
對IT管理員來說,其標準功能涵蓋了頻外管理的遠程管理能力,其中包括在無須親臨服務(wù)器機房的情況下,即可監(jiān)控系統(tǒng)功能、安裝更新與修補程序以及故障排除。
大多數(shù)IT服務(wù)提供業(yè)者的標準做法,是遠程訪問客戶本地服務(wù)器或進行云端托管。隨著新的PICMG COM-HPC接口規(guī)范問世,支持這項行之有年做法的遠程管理功能,將延伸至邊緣服務(wù)器與網(wǎng)關(guān)伺服層技術(shù)。邊緣服務(wù)器與網(wǎng)關(guān)伺服層技術(shù)實現(xiàn)了數(shù)字化及工業(yè)物聯(lián)網(wǎng)(IIoT),但需要遠程管理功能彌補商業(yè)級IT與工業(yè)級營運科技(OT)間的落差。
而以嵌入式計算機模塊為基礎(chǔ)去設(shè)計邊緣層平臺的工程師,通常會希望透過客制化滿足特定需求,進而執(zhí)行這些功能。PICMG特別針對這項需求,推出了適用于系統(tǒng)管理的COM-HPC子規(guī)范,且為了不造成重工,部分子規(guī)范將使用智能型平臺管理接口(IPMI)規(guī)格。接下來讓我們更深入探究系統(tǒng)管理接口專用的COM-HPC子規(guī)范,了解其規(guī)范對COM-HPC設(shè)計有何幫助吧。
這項工作之所以以IPMI為基礎(chǔ),是因為IPMI自1998年提出后,經(jīng)過2001年與2004年的陸續(xù)改版后達到穩(wěn)健狀態(tài),而受到廣大使用者接納。PICMG小組委員會也采用了以表現(xiàn)層狀態(tài)轉(zhuǎn)換(RESTful)API為基礎(chǔ)的Redfish規(guī)范,并持續(xù)發(fā)表新功能。
圖1 : COM-HPC標準專為全新邊緣運算層設(shè)計,采用分布式架構(gòu),因此這項全新IT層級服務(wù),提供了業(yè)者需要具備類似分布式本地或云端設(shè)備的全方位遠程管理功能。
長久性與穩(wěn)定性至關(guān)重要
IPMI規(guī)范定義了監(jiān)控管理計算機子系統(tǒng)的協(xié)議、接口與架構(gòu),對描述底層硬件以及從板載管理控制器(BMC)接收和傳送訊息的格式進行了標準化。 IPMI訊息可透過網(wǎng)絡(luò)傳送至遠程系統(tǒng)BMC,或從BMC傳送至電源等本機子系統(tǒng)。這種傳送IPMI訊息的靈活性,使其可將復(fù)雜的管理任務(wù)劃分為數(shù)個子區(qū)域。訊息可查詢硬件當前狀態(tài),或命令BMC行動,如指示提升系統(tǒng)散熱效果、要求系統(tǒng)重開機,或讀取傳感器。將管理任務(wù)卸除至專用實體硬件組件,可減少主機硬件與操作系統(tǒng)負擔。IPMI規(guī)范也將系統(tǒng)管理與主要平臺脫鉤,即使在主要平臺停機時,仍可執(zhí)行系統(tǒng)管理功能。上述功能讓IPMI規(guī)范成為管理服務(wù)器硬件的真實標準。規(guī)范開發(fā)人員刻意將必要的命令簡潔化,以避免誤解的可能性,進而確保規(guī)范的長久可用性。
IPMI規(guī)范的彈性框架可在原有強制及選擇性命令之外,新增新的網(wǎng)絡(luò)功能(NetFn)與指令。這種自由度已讓許多產(chǎn)業(yè)工作團體受益,使其得以定義自身特定網(wǎng)絡(luò)功能及命令,應(yīng)對在制定規(guī)范時未曾想到的技術(shù)與功能。
圖2 : IPMI呼叫可透過網(wǎng)絡(luò)傳送至遠程系統(tǒng)或本機子系統(tǒng)。于大多數(shù)情況下,系統(tǒng)模塊化是為了將IPMI功能延伸至子系統(tǒng)(如嵌入式計算機模塊)。
各種遠程管理選項
對嵌入式計算機模塊系統(tǒng)而言,彈性框架讓新增遠程管理所需的調(diào)整更為簡單。一項關(guān)于COM-HPC嵌入式EEPROM(EEEP)的調(diào)整,EEEP包含供貨商信息、內(nèi)存插槽、連網(wǎng)功能等,這些信息大致與IPMI現(xiàn)場替換單元(FRU)中所儲存的信息相同。為避免復(fù)制本數(shù)據(jù),COM-HPC遠程管理功能也涵蓋了IPMI裝置如何將EEEP裝置中,儲存信息植入FRU的相關(guān)建議。
有鑒于COM-HPC模塊市場龐大,包括遠程數(shù)據(jù)中心、霧端/邊緣服務(wù)器與遠程安裝,擁有彈性的遠程管理選項是相當重要的。此外開發(fā)人員也應(yīng)考慮該規(guī)范對IPMI提供給模塊及載板的支持成熟度的要求是截然不同的;模塊的IPMI成熟度范圍包括未受管理模塊(M.U)、基本管理模塊(M.B),到完全管理模塊(M.F)。載板程度則為未受管理(C.U)到管理載板(C.M)。規(guī)范中詳列各種差異,但本階段最重要的是了解這些模塊與載板的互操作性不受影響。COM-HPC IPMI規(guī)范讓各類載板在各種模塊中正確運作。
關(guān)鍵在于靈活性
PICMG COM-HPC IPMI小組委員會體認到,一體適用的解決方案無法符合各種情況所需的基本管理功能,因此才會有使用于如控制系統(tǒng)開啟/關(guān)閉,或告知系統(tǒng)取得網(wǎng)絡(luò)信息等任務(wù)的若干模塊與載板設(shè)計的結(jié)合。
舉例來說,使用搭載達4個模塊的單一載板工作時,讓個別模塊具備獨立完整的管理功能更能提升效率。不過,載板上完全成熟的IPMI執(zhí)行可對其他情況產(chǎn)生效益,不論模塊是否是在受到管理的條件下,皆能對特定功能進行客制化。當然,一定也會有系統(tǒng)設(shè)計人員不想要管理功能,或是只想要最少的管理功能。因此,最重要的是所有模塊管理層間的互操作性。
圖3 : 盡管模塊及載板的IPMI支持成熟度不盡相同,但仍保留可互操作性,以實現(xiàn)各種系統(tǒng)設(shè)定─從搭載4個管理模塊的單一未受管理載具,到搭載未受管理模塊的管理載具。
靈活管理控制平臺
IPMI可存取越多的系統(tǒng)資源,功能就會越強大。這種存取與電源間的關(guān)系,便是新的COM-HPC規(guī)范具備數(shù)個特定接口,并提供最全方位系統(tǒng)管理功能的原因。首先是智能型平臺管理總線(IPMB)接口,讓載板BMC得以存取模塊管理控制器(MMC)。但規(guī)范不僅限于此總線,專用的獨立PCI Express通道便是特別針對載板BMC的一款新接口,包含了圖型控制器并加以驅(qū)動。IPMI專用的其他接口包括I2C接口、USB端口,以及電源鈕控制。這些專用IPMI通道亦可透過BMC遠程訪問,讓系統(tǒng)管理員幾乎可完全控制平臺行為,實現(xiàn)最佳QoS、最少停機時間,與最高效的遠程維護。以下為數(shù)個范例:
? I2C接口可用于存取模塊上的EEEP數(shù)據(jù)。
? USB端口可用于仿真如鍵盤與鼠標,或DVD光驅(qū)等USB裝置。
? 電源控制可用于遠程啟動/關(guān)閉系統(tǒng)。
? 當BMC執(zhí)行其他平臺初始化時,電源控制可用于延遲系統(tǒng)開機。
新的PICMG COM-HPC子規(guī)范藉此為全方位IPMI平臺管理功能奠定基礎(chǔ),工程師可開始思考建置IPMI的硬件設(shè)計構(gòu)想。于此同時,模塊供貨商與其合作伙伴可建置BMC與MMC,例如使用SP-X及(或)OpenBMC等開源標準韌體。
OpenBMC為Linux發(fā)行版,適用于服務(wù)器、置頂式交換器、RAID設(shè)備與其他裝置中的管理控制器。OpenBMC適用于次世代以COM-HPC為基礎(chǔ)的系統(tǒng),利用Yocto、OpenEmbedded、systemd與D-Bus,讓平臺客制化更為輕松。具備與DCMI的完整IPMI 2.0兼容性,并搭載如電力、冷卻、LED、庫存、活動與監(jiān)視器等主機管理功能。OpenBMC并提供各種接口選項,從遠程KVM、以SSH為基礎(chǔ)的SOL、以網(wǎng)絡(luò)為基礎(chǔ)的用戶接口,到REST以及以D-Bus為基礎(chǔ)的接口。工程師可受益于硬件仿真及自動測試功能,而對各種BMC/BIOS映像的代碼更新支持則讓最近功能集更為完整。
結(jié)論
對系統(tǒng)建置人員來說,PICMG COM-HPC嵌入式計算機模塊規(guī)范的主要優(yōu)勢,是在于盡管此為全新規(guī)范,但卻涵蓋了成熟的IPMI與Redfish管理技術(shù)并加以創(chuàng)新,而這無疑將成為接納PICMG新COM-HPC嵌入式計算機模塊規(guī)范的動力。
(本文作者Aaron Pop為康佳特資深軟件工程師;David Wise為AMI資深軟件工程師;Jessica Isquith為PICMG總裁)
評論