數(shù)據(jù)中心的基礎(chǔ)管理技術(shù)
UPS市電供應(yīng)出現(xiàn)故障時,若在后備電池容量范圍內(nèi)仍不能恢復(fù)市電,系統(tǒng)運行人員須通知有關(guān)人員對運行系統(tǒng)的數(shù)據(jù)進行保存,盡量降低輔助系統(tǒng)、顯示器等非核心設(shè)備的耗電以最大限度地保證核心系統(tǒng)的運行。
本文引用地址:http://www.ex-cimer.com/article/176945.htm1、作業(yè)管理。
①操作實施過程應(yīng)嚴格按照工作步驟執(zhí)行,應(yīng)有監(jiān)護人對操作進行監(jiān)護、監(jiān)督,并逐條落實工作票的安全措施。
②操作過程中應(yīng)開啟日志記錄,并進行歸檔。
③要控制在機房工作的人數(shù),在機房內(nèi)禁止做與工作無關(guān)的事情。
④施工人員用電必須申請,經(jīng)批準后,按照規(guī)定使用電源,不得亂拉電源線、插座。
⑤嚴禁日常作業(yè)使用信息機房內(nèi)ups電源供電。
⑥設(shè)備使用完畢后應(yīng)注銷或鎖定系統(tǒng),以避免不當使用。
⑦工作完成后,應(yīng)立即進行測試檢查,確認是否達到作業(yè)目的,合格后清理工作現(xiàn)場。
2、設(shè)備管理。
①設(shè)備標簽。
·信息機房內(nèi)設(shè)備均應(yīng)貼上標簽,注明設(shè)備名稱、設(shè)備編碼、責任人、投運時間等,對多用途設(shè)備應(yīng)額外標注用途。
·標簽應(yīng)選用不易損壞的材料,必須打印不允許手寫。
②設(shè)備臺賬。在信息機房內(nèi)所有設(shè)備,都必須登記入冊,包括設(shè)備的型號、采購日期、配置等。設(shè)備登記列賬應(yīng)由專人負責,定期盤查,做到設(shè)備臺賬與實物相符、條理清楚。
③設(shè)備調(diào)人和運出。
·設(shè)備進人信息機房前,必須由設(shè)備管理員向運維負責人提出申請,經(jīng)審批同意后,由運維負責人安排設(shè)備位置及安裝時間,并在規(guī)定的時間內(nèi),將設(shè)備放置指定位置。
·設(shè)備如需運出,由設(shè)備管理員向達維負責人申請,經(jīng)運維負責人同意后,方可運出。
④設(shè)備日常維護。
·建立設(shè)備專管責任制,精心維護、精心操作,確保設(shè)備安全可靠運行。
·認真監(jiān)控設(shè)備運行情況,發(fā)現(xiàn)異常應(yīng)及時向設(shè)備管理員和信息部門負責人報告,并做好現(xiàn)場狀態(tài)信息的記錄。
·接到設(shè)備停運通知應(yīng)填寫工作票,根據(jù)設(shè)備停運安排和注意事項,進行數(shù)據(jù)備份、設(shè)備停運并掛上設(shè)備停運標志,還要登記設(shè)備停運時間。
·停運設(shè)備重新投運需經(jīng)信息部門負責人批準方可執(zhí)行,并登記復(fù)運時間。
·設(shè)備發(fā)生故障,啟動相應(yīng)的故障處理應(yīng)急預(yù)案,在得到信息部門負責人通知后方可進行故障處理工作。
·對設(shè)備硬件進行維修作業(yè)時,維修操作必須嚴格按照維修手冊或說明中的操作規(guī)程進行,嚴禁帶電作業(yè),不得在通電情況下進行設(shè)備的更換、拆卸、焊接(熱插拔設(shè)備除外)。
·更換部件或設(shè)備工作變更時,全程工作必須至少有兩人以上參加,工作完成后及時做好維修記錄。
·對不能處理的故障或無把握處理的故障,報相關(guān)領(lǐng)導(dǎo)后再處理。
3、UPS管理。
①做好UPS測試預(yù)案,定期做好UPS系統(tǒng)的測試和電源的切換。
②嚴格按照后備電池的運行方式和壽命,做好后備電池的定期充放電和更換。
③UPS市電供應(yīng)出現(xiàn)故障時,若在后備電池容量范圍內(nèi)仍不能恢復(fù)市電,系統(tǒng)運行人員須通知有關(guān)人員對運行系統(tǒng)的數(shù)據(jù)進行保存,盡量降低輔助系統(tǒng)、顯示器等非核心設(shè)備的耗電以最大限度地保證核心系統(tǒng)的運行。
④UPS本身發(fā)生故障時,應(yīng)采用市電直接供電以保證系統(tǒng)的正常運行。
⑤利用UPS的監(jiān)控管理功能和故障報警功能,保證在UPS故障情況下,發(fā)出告警并及時對設(shè)備進行相關(guān)操作。
4、事件與缺陷管理。
①事件(故障)管理。
·發(fā)生故障后,值班人員應(yīng)立即報告信息部門負責人,同時信息部門組織人員對故障進行處理,并記錄處理過程,故障處理過程要在保障安全性的基礎(chǔ)上,恢復(fù)系統(tǒng)的可用性,必要時,應(yīng)啟動應(yīng)急預(yù)案。
·信息部門應(yīng)對故障影響的范圍和嚴重程度做出判斷,所有故障須通報相關(guān)主管領(lǐng)導(dǎo);對不能立即排除的故障,應(yīng)通知相關(guān)用戶并向相關(guān)領(lǐng)導(dǎo)進行匯報。
·信息部門應(yīng)制定系統(tǒng)關(guān)鍵點故障處理的應(yīng)急預(yù)案,并通過演練完善應(yīng)急預(yù)案。
②缺陷管理。
運維人員發(fā)現(xiàn)缺陷后應(yīng)及時報告運維負責人,對缺陷進行定性并記人缺陷記錄。
·危急缺陷或嚴重缺陷由運維人員15分鐘內(nèi)報告信息部門負責人,并通知設(shè)備管理員和系統(tǒng)管理員。運維人員應(yīng)立即分析缺陷原因,提出解決辦法。30分鐘內(nèi)無法解決的缺陷,應(yīng)及時聯(lián)系相關(guān)設(shè)備廠商協(xié)助解決。
·一般缺陷由運維人員及時處理或添加至缺陷處理計劃中,并填寫運行日志。
·在缺陷沒有得到處理以前,應(yīng)加強監(jiān)視或采取必要措施,防止進一步惡化。已經(jīng)記錄的缺陷,如在監(jiān)視過程中有進一步惡化的趨勢,應(yīng)及時上報。
·缺陷消缺后,由運維負責人對缺陷進行消缺檢查。
·缺陷消除后,運維人員需填寫缺陷處理報告并及時注銷記錄。
·定期對末消除的缺陷進行清理,并對處理完的缺陷匯總、歸檔。■
評論