電力信息化離不開網(wǎng)絡(luò)監(jiān)控
在當(dāng)前電力事業(yè)信息化應(yīng)用中,系統(tǒng)運(yùn)行平臺(tái)的網(wǎng)絡(luò)環(huán)境日漸復(fù)雜,為了充分發(fā)揮IT環(huán)境內(nèi)所有網(wǎng)元(網(wǎng)絡(luò),設(shè)備,計(jì)算機(jī)系統(tǒng),數(shù)據(jù)庫(kù),中間件,存儲(chǔ),企業(yè)核心應(yīng)用等)的作用,企業(yè)需要有一個(gè)好的IT管理工具來對(duì)網(wǎng)絡(luò)和系統(tǒng)進(jìn)行有效的管理,同時(shí)為了形成一套集主機(jī)、網(wǎng)絡(luò)、服務(wù)器以及應(yīng)用(含數(shù)據(jù)庫(kù))運(yùn)行監(jiān)控和管理的、面向業(yè)務(wù)的綜合系統(tǒng),就必須加強(qiáng)信息網(wǎng)絡(luò)管理監(jiān)控系統(tǒng)的建設(shè)。
本文引用地址:http://www.ex-cimer.com/article/201521.htm系統(tǒng)平臺(tái)及開發(fā)技術(shù)
整體來看,管理系統(tǒng)所管理的對(duì)象主要包括:主機(jī)系統(tǒng)、網(wǎng)絡(luò)設(shè)備、數(shù)據(jù)庫(kù)、中間件、存儲(chǔ)設(shè)備、備份設(shè)備、企業(yè)核心應(yīng)用系統(tǒng)等部分。
通過網(wǎng)絡(luò)監(jiān)視管理系統(tǒng)對(duì)上述管理對(duì)象進(jìn)行集中維護(hù)、統(tǒng)一管理。實(shí)現(xiàn)對(duì)整個(gè)業(yè)務(wù)支撐系統(tǒng)的統(tǒng)一整體管理??梢酝ㄟ^監(jiān)視屏幕及時(shí)了解整個(gè)業(yè)務(wù)系統(tǒng)、數(shù)據(jù)庫(kù)、主機(jī)系統(tǒng)、網(wǎng)絡(luò)設(shè)備的運(yùn)行狀況包括各項(xiàng)功能指標(biāo)、性能指標(biāo)等。系統(tǒng)的整個(gè)體系由三大部分構(gòu)成:數(shù)據(jù)和控制層、處理層、展現(xiàn)層。
數(shù)據(jù)和控制層由各個(gè)業(yè)務(wù)系統(tǒng)代理組成:代理層是數(shù)據(jù)采集和動(dòng)作執(zhí)行的核心。Agent是運(yùn)行在被監(jiān)控目標(biāo)計(jì)算機(jī)上的一些小程序,主要功能是負(fù)責(zé)采集該系統(tǒng)運(yùn)行狀況、性能等數(shù)據(jù),并發(fā)送到數(shù)據(jù)采集分發(fā)管理器。
處理層是整個(gè)管理系統(tǒng)的核心,包含了數(shù)據(jù)管理、核心監(jiān)控、報(bào)警、數(shù)據(jù)存儲(chǔ)等部分:數(shù)據(jù)采集分發(fā)管理器的主要功能是從代理收集數(shù)據(jù)、更新和維護(hù)被管理對(duì)象狀態(tài)、命令代理程序?qū)訄?zhí)行相關(guān)指令等。并確保把數(shù)據(jù)分發(fā)到數(shù)據(jù)存儲(chǔ)器;數(shù)據(jù)存儲(chǔ)器接收到數(shù)據(jù)采集分發(fā)管理器的數(shù)據(jù)并進(jìn)行分類,數(shù)據(jù)分割拆分存儲(chǔ)。核心監(jiān)控對(duì)采集到的數(shù)據(jù)進(jìn)行分析處理,分析是否達(dá)到報(bào)警閥值,是否需要采取處理。
展現(xiàn)層是運(yùn)維管理系統(tǒng)的用戶界面層,展示業(yè)務(wù)系統(tǒng)的功能指標(biāo)、性能指標(biāo)。用戶界面把網(wǎng)絡(luò)和系統(tǒng)中各種對(duì)象的關(guān)系、配置、狀態(tài)和故障情況,用圖示化的用戶接口展現(xiàn)出來。報(bào)警手段提供聲光、音樂、短信、Email等等多種有效的手段向用戶發(fā)出警示信息。統(tǒng)計(jì)分析是對(duì)業(yè)務(wù)系統(tǒng)進(jìn)行的業(yè)務(wù)指標(biāo)、性能指標(biāo)進(jìn)行分析,發(fā)現(xiàn)業(yè)務(wù)系統(tǒng)潛在的問題,防范于未然。
系統(tǒng)主要功能
一般企業(yè)對(duì)軟件要求是具有國(guó)內(nèi)先進(jìn)水平的系統(tǒng)管理軟件,對(duì)企業(yè)所有服務(wù)器操作系統(tǒng)、系統(tǒng)數(shù)據(jù)庫(kù)、網(wǎng)絡(luò)交換機(jī)、應(yīng)用系統(tǒng)及應(yīng)用進(jìn)程都能進(jìn)行監(jiān)控。運(yùn)行人員能夠隨時(shí)查看到服務(wù)器的CPU、內(nèi)存、磁盤空間、數(shù)據(jù)庫(kù)、進(jìn)程等方面的詳細(xì)數(shù)據(jù);還可以通過對(duì)網(wǎng)卡、交換機(jī)的監(jiān)控,了解目前網(wǎng)絡(luò)的流量;可以實(shí)時(shí)掌握目前網(wǎng)絡(luò)運(yùn)行的狀況。有全面的服務(wù)器監(jiān)測(cè)器、網(wǎng)絡(luò)監(jiān)測(cè)器、WEB應(yīng)用監(jiān)測(cè)器和企業(yè)應(yīng)用監(jiān)測(cè),可以對(duì)企業(yè)信息網(wǎng)進(jìn)行全面的監(jiān)測(cè)。主要分為幾個(gè)方面:跨操作系統(tǒng),遠(yuǎn)程監(jiān)測(cè)管理;服務(wù)器、網(wǎng)絡(luò)設(shè)備監(jiān)測(cè);應(yīng)用監(jiān)測(cè);方便實(shí)用;遠(yuǎn)程報(bào)警、故障自動(dòng)恢復(fù);豐富的報(bào)告以及方便實(shí)用的用戶管理功能。
然而,系統(tǒng)功能主要有幾個(gè)方面。首先是跨操作系統(tǒng)遠(yuǎn)程監(jiān)測(cè)管理。系統(tǒng)支持Windows、NT、Linux、SunSolaris、AIX、HpUnix、Cobalt、True64、OpenServer、Slackware、Digital等在內(nèi)的所有主流操作系統(tǒng),可以跨路由、跨網(wǎng)段對(duì)遠(yuǎn)程或異地的服務(wù)器機(jī)群進(jìn)行集中監(jiān)測(cè)管理。
其次,服務(wù)器、網(wǎng)絡(luò)設(shè)備監(jiān)測(cè):通過使用系統(tǒng)可以7X24監(jiān)測(cè)服務(wù)器的各種性能參數(shù)(CPU、磁盤空間、內(nèi)存、服務(wù)、進(jìn)程、網(wǎng)卡流量等)和網(wǎng)絡(luò)狀況(Ping、Port、網(wǎng)絡(luò)設(shè)備接口流量等),同時(shí)采用標(biāo)準(zhǔn)的SNMP協(xié)議對(duì)各種網(wǎng)絡(luò)設(shè)備進(jìn)行監(jiān)測(cè),包括網(wǎng)絡(luò)設(shè)備接口狀況、CiscoCPU、Cisco配置文件、F5、CheckPoint、Netscreen防火墻等。通過這些監(jiān)測(cè),用戶可以及時(shí)發(fā)現(xiàn)問題,快速定位查找解決故障,區(qū)分故障發(fā)生的原因,給客戶抱怨一個(gè)合理的解釋;同時(shí)系統(tǒng)可將客戶所要求的各種性能監(jiān)測(cè)報(bào)告自動(dòng)發(fā)送至客戶指定郵箱。
然后是能對(duì)Web網(wǎng)站所有相關(guān)應(yīng)用進(jìn)行監(jiān)測(cè)。需要軟件內(nèi)置各種Web應(yīng)用監(jiān)測(cè)器,如:WebServer、IIS、Apache、Iplanet、DNS、FTP、URL、URLTransaction、Websphere、Port、F5(LoadBalance)等,可以很好地對(duì)Web網(wǎng)站進(jìn)行監(jiān)測(cè)。
同時(shí),實(shí)現(xiàn)遠(yuǎn)程報(bào)警,具有自動(dòng)恢復(fù)功能。系統(tǒng)通過監(jiān)測(cè)器在監(jiān)測(cè)到故障或者故障隱患時(shí),會(huì)通過靈活多樣的報(bào)警方式(語音電話、手機(jī)短信、電子郵件、),將警報(bào)發(fā)送到相關(guān)責(zé)任人,實(shí)現(xiàn)運(yùn)行維護(hù)責(zé)任的明確分工;同時(shí),還可以根據(jù)預(yù)先定義,對(duì)常見故障自動(dòng)進(jìn)行相應(yīng)的故障恢復(fù)。
而且自動(dòng)統(tǒng)計(jì)報(bào)表。系統(tǒng)提供的強(qiáng)大的報(bào)表分析功能和靈活多樣的圖表報(bào)告功能,非常方便生成實(shí)時(shí)的和歷史的報(bào)告,并可以打印、導(dǎo)出,為網(wǎng)絡(luò)管理和規(guī)劃提供可靠的理論數(shù)據(jù)和依據(jù),能夠自動(dòng)組合監(jiān)測(cè)數(shù)據(jù),生成針對(duì)監(jiān)測(cè)對(duì)象實(shí)時(shí)的或歷史的報(bào)告和報(bào)表,幫助管理人員通過歷史數(shù)據(jù)分析設(shè)備的運(yùn)行趨勢(shì),為IT系統(tǒng)管理的長(zhǎng)期規(guī)劃提供依據(jù)。
還有就是方便實(shí)用的用戶管理功能。管理人員可以為每個(gè)用戶設(shè)立一個(gè)管理帳號(hào),并設(shè)置許可規(guī)模、期限以及管理權(quán)限。這樣,用戶就如同自己?jiǎn)为?dú)使用該系統(tǒng),通過它來遠(yuǎn)程管理自己的服務(wù)器及其應(yīng)用。同時(shí)具備完備的安全設(shè)置:數(shù)據(jù)采集、傳輸支持HTTPS和SSH加密協(xié)議。用戶登錄系統(tǒng)除需輸入指定的用戶名和密碼外,還可設(shè)定只允許指定的IP地址進(jìn)行遠(yuǎn)程登錄。
當(dāng)然,軟件具有Web界面、遠(yuǎn)程管理功能。要求能通過軟件,管理員可以在指定的一臺(tái)機(jī)器上瀏覽管理界面并進(jìn)行配置。管理員可以遠(yuǎn)程瀏覽管理系統(tǒng)并進(jìn)行配置,掌握信息網(wǎng)運(yùn)行情況。
另外,構(gòu)建服務(wù)器、應(yīng)用拓?fù)鋱D。系統(tǒng)能自動(dòng)生成拓樸圖,用戶可以調(diào)整定置圖,通過拓?fù)鋱D可以直觀看到整個(gè)信息網(wǎng)設(shè)備的運(yùn)行情況,一旦系統(tǒng)或應(yīng)用出現(xiàn)故障,故障設(shè)備立刻會(huì)變成紅色、發(fā)出報(bào)警,實(shí)時(shí)直觀地反映整個(gè)網(wǎng)絡(luò)設(shè)備的狀況,而且可以直觀地反映服務(wù)器、數(shù)據(jù)庫(kù)、應(yīng)用進(jìn)程等各種應(yīng)用的運(yùn)行情況。
總之,系統(tǒng)特點(diǎn)包括,首先是采用集中非代理式的完全自動(dòng)化監(jiān)測(cè)方式。從一臺(tái)監(jiān)測(cè)主機(jī)可同時(shí)監(jiān)測(cè)不限點(diǎn)數(shù)的服務(wù)器、網(wǎng)絡(luò)設(shè)備及其應(yīng)用的各種關(guān)鍵參數(shù),在被監(jiān)測(cè)對(duì)象上無需安裝任何代理軟件,對(duì)被監(jiān)測(cè)對(duì)象的性能影響甚微,系統(tǒng)的維護(hù)和升級(jí)都十分方便。通過模擬運(yùn)行維護(hù)人員的日常操作行為,實(shí)現(xiàn)對(duì)網(wǎng)絡(luò)狀況的7*24小時(shí)不間斷實(shí)時(shí)監(jiān)測(cè)。
其次方便實(shí)用的設(shè)計(jì)理念。系統(tǒng)被監(jiān)測(cè)客戶端的安裝不到15分種即可使用,功能強(qiáng)大,操作卻十分方便。采用全中文的界面和幫助,提供本土化的技術(shù)支持和服務(wù),只要具備基本網(wǎng)管常識(shí),無需任何專門培訓(xùn),就可輕松管理網(wǎng)絡(luò)。
還有就是開放式的API接口。系統(tǒng)提供的開放式的API接口,可以讓網(wǎng)絡(luò)管理人員十分方便的添加自身系統(tǒng)獨(dú)有的特殊監(jiān)測(cè)器,從而滿足用戶特有的監(jiān)測(cè)需求。
系統(tǒng)的實(shí)施效果
一般企業(yè)的技術(shù)人員可以通過三個(gè)月的時(shí)間開發(fā)適合企業(yè)的網(wǎng)絡(luò)平臺(tái)監(jiān)控系統(tǒng),實(shí)現(xiàn)企業(yè)近200臺(tái)網(wǎng)絡(luò)設(shè)備、20臺(tái)小型機(jī)、70臺(tái)PC服務(wù)器及相關(guān)數(shù)據(jù)庫(kù)、中間件的自動(dòng)化監(jiān)測(cè)管理。針對(duì)企業(yè)集中式系統(tǒng)運(yùn)維的需求,系統(tǒng)可以提供具體的解決方案。通過自動(dòng)生成的拓樸圖全面掌握系統(tǒng)性能。
首先是服務(wù)器及相關(guān)數(shù)據(jù)庫(kù)管理。系統(tǒng)實(shí)時(shí)地對(duì)服務(wù)器進(jìn)行監(jiān)測(cè),定期對(duì)服務(wù)進(jìn)行分析,降低服務(wù)器故障,不斷提高服務(wù)器性能。支持對(duì)Windows、Unix、Solaris、AIX等相關(guān)操作系統(tǒng)的服務(wù)器的CPU使用率、內(nèi)存使用率、磁盤利用率、服務(wù)、進(jìn)程運(yùn)行狀況、目錄、文件、日志等進(jìn)行集中監(jiān)測(cè)管理,同時(shí)也實(shí)時(shí)對(duì)ORACLE、SQL數(shù)據(jù)庫(kù)進(jìn)行運(yùn)行監(jiān)測(cè)。
其次是網(wǎng)絡(luò)設(shè)備管理。通過監(jiān)測(cè)網(wǎng)絡(luò)設(shè)備是否可用、各端口流量、性能如何、CPU、內(nèi)存使用情況、配置文件是否被修改、是否有異常日志及有沒有人非法登陸等,確保網(wǎng)絡(luò)系統(tǒng)的正常運(yùn)行。
還有就是WWW服務(wù)管理。系統(tǒng)通過定期登錄指定的URL,驗(yàn)證這個(gè)URL是否能被正常訪問,同時(shí)可以對(duì)該頁面的內(nèi)容進(jìn)行校驗(yàn),防止頁面被人惡意修改,從而確保不同WWW服務(wù)的質(zhì)量。
通過系統(tǒng)的實(shí)施,不僅能進(jìn)一步提高企業(yè)各個(gè)業(yè)務(wù)信息系統(tǒng)的運(yùn)行質(zhì)量,為企業(yè)日常管理工作能正常持續(xù)運(yùn)行提供有力的保障,同時(shí)也大大降低了系統(tǒng)監(jiān)控的運(yùn)行維人力支持。技術(shù)支持人員有更多的時(shí)間提供應(yīng)用支持,間接提高了各業(yè)務(wù)系統(tǒng)應(yīng)用的滿意度。
隨著電力信息化的發(fā)展和國(guó)網(wǎng)公司“SG186”工程的推進(jìn),電力系統(tǒng)的信息安全也日益被重視,一是信息安全,二是網(wǎng)絡(luò)安全,其中網(wǎng)絡(luò)安全主要從網(wǎng)絡(luò)層面考慮,指的是使信息的傳輸和網(wǎng)絡(luò)的運(yùn)行能夠得到安全的保障,內(nèi)部和外部的非法攻擊得到有效的防范和遏制。信息網(wǎng)絡(luò)和信息系統(tǒng)的硬件、軟件、設(shè)備、數(shù)據(jù)需要受到可靠的保護(hù),通信和訪問等操作要得到有效保障和合理的控制,不受偶然的或者惡意攻擊的原因而遭受到破壞、更改、泄漏,系統(tǒng)連續(xù)可靠正常的運(yùn)行,網(wǎng)絡(luò)服務(wù)不被中斷。在信息系統(tǒng)安全中,人始終是一個(gè)重要的角色,由于信息管理部門的技術(shù)維護(hù)力量遠(yuǎn)不如生產(chǎn)線上人員的配備充足,每個(gè)人維護(hù)的信息設(shè)備數(shù)和需要具備的維護(hù)知識(shí)的要求相對(duì)較高,在傳統(tǒng)模式下可能就會(huì)出現(xiàn)造成信息系統(tǒng)安全的問題。通過網(wǎng)絡(luò)管理監(jiān)控系統(tǒng)的建設(shè),將每個(gè)人運(yùn)行維護(hù)知識(shí)都在系統(tǒng)中得以體現(xiàn)與固化,并通過系統(tǒng)設(shè)置可以交流與確認(rèn)。通過整合、完善、改建和新建的監(jiān)控方法,統(tǒng)一并規(guī)范的實(shí)現(xiàn)各系統(tǒng)及設(shè)備監(jiān)控的自動(dòng)化,也實(shí)現(xiàn)了監(jiān)控?cái)?shù)據(jù)共享與交流,也極大提高信息運(yùn)維工作的質(zhì)量與效率。將使企業(yè)的信息管理水平在信息系統(tǒng)統(tǒng)一監(jiān)控實(shí)現(xiàn)自動(dòng)化的推動(dòng)下上了一個(gè)新的臺(tái)階。
評(píng)論