<meter id="pryje"><nav id="pryje"><delect id="pryje"></delect></nav></meter>
          <label id="pryje"></label>

          新聞中心

          EEPW首頁 > 嵌入式系統(tǒng) > 設(shè)計應(yīng)用 > 高性能的Linux集群監(jiān)控之道

          高性能的Linux集群監(jiān)控之道

          作者: 時間:2016-09-12 來源:網(wǎng)絡(luò) 收藏

          監(jiān)控是集群管理的核心任務(wù)監(jiān)控數(shù)據(jù)可用于調(diào)度任務(wù)負載平衡向管理員報告軟硬件故障并廣泛地控制系統(tǒng)使用情況監(jiān)控信息必須在不影響集群性能的情況下獲得本文將討論使用/proc文件系統(tǒng)和Java來獲得監(jiān)控數(shù)據(jù)的方法

          本文引用地址:http://www.ex-cimer.com/article/201609/303759.htm

          Java在集群中的應(yīng)用

          Java技術(shù)為集群管理開發(fā)者提供了許多解決問題的辦法Java是動態(tài)靈活可移植的這些不尋常的特征使得它成為了在異構(gòu)網(wǎng)絡(luò)及平臺上構(gòu)造集群管理的理想基礎(chǔ)

          Java具有廣泛的例程庫很容易處理IP協(xié)議如TCPUDP并可在multihomed主機上進行網(wǎng)絡(luò)程序設(shè)計用它創(chuàng)建網(wǎng)絡(luò)連接比用C或C++更容易通過Java本地接口(JNI)運行在Java 虛擬機(JVM)內(nèi)的Java代碼能夠與用其它語言編寫的應(yīng)用及庫文件相互操作并匯編

          在構(gòu)造和管理時Java早已是一個可選的語言然而Java語言通常只被用于系統(tǒng)的前端或集群主機部分而將用C 語言編寫的守護進程安裝在集群結(jié)點上盡管Java程序設(shè)計語言提供了許多優(yōu)點但是對于高性能Java能夠有效地替換運行在每個結(jié)點上的C 語言守護進程嗎?這將是本文討論的重點

          高性能監(jiān)控

          監(jiān)控集群工具傳統(tǒng)上以秒為測量頻率來提供有限量的數(shù)據(jù)而高性能被定義為“以intrasecond為測量頻率從結(jié)點有效地采集數(shù)據(jù)的能力”當(dāng)涉及較大集群時監(jiān)控軟件的低效率問題就變得更加嚴重這是因為所運行的應(yīng)用軟件必須互相協(xié)調(diào)或共享全局資源

          在一個結(jié)點上的阻隔沖突(Interference)能影響其它結(jié)點上作業(yè)的運行例如一個MPI作用需要與所有參與的結(jié)點同步一種解決辦法是收集少量的數(shù)據(jù)并以小頻率傳輸然而如果是高性能監(jiān)控這種解決辦法是不可接受的因為有較重利用率的集群應(yīng)該被頻繁持續(xù)地監(jiān)控本地作業(yè)調(diào)度器必須能夠基于資源使用情況做快速決策管理員經(jīng)常希望收到緊急事件的立即通知并希望觀察到歷史趨勢數(shù)據(jù)如果集群不能被頻繁持續(xù)地監(jiān)控那么這些要求是不可能實現(xiàn)的因此必須采取一些措施如使用更有效的算法增加傳輸?shù)牟⑿行蕴岣邆鬏攨f(xié)議及數(shù)據(jù)格式的效率減少冗余等

          在跟蹤運行中的資源使用情況時壓縮Profiling應(yīng)用有助于調(diào)試程序或優(yōu)化程序?qū)σ粋€給定的應(yīng)用而言像存儲器網(wǎng)絡(luò)CPU這樣動態(tài)資源的使用可能快速地改變著為了能夠觀察應(yīng)用是怎樣使用這些資源的一種可能的辦法是使用高頻率的監(jiān)控

          即使用戶對高頻率監(jiān)控沒有興趣如果算法是有效的不管監(jiān)控頻率是多少它也將消費很少的資源在異構(gòu)集群中這種效率將更重要用戶的作業(yè)可以被分散到較快的及較慢的結(jié)點上慢的結(jié)點需要全部CPU來跟上較快的結(jié)點并與之同步一個監(jiān)控程序花費在較慢結(jié)點上的CPU時間是作業(yè)的關(guān)鍵路徑

          監(jiān)控階段

          集群監(jiān)控主要消耗CPU周期與網(wǎng)絡(luò)帶寬這兩個重要資源然而資源消費問題與這兩個資源是根本不同的CPU利用問題對結(jié)點而言是完全本地化的問題可通過創(chuàng)建有效的收集與合并算法來解決網(wǎng)絡(luò)帶寬是共享資源是規(guī)模問題可以通過最小化網(wǎng)絡(luò)上傳輸?shù)臄?shù)據(jù)量來解決

          為了解決這兩個問題我們將集群監(jiān)控分為三個階段收集合并傳輸收集階段負責(zé)從操作系統(tǒng)裝載數(shù)據(jù)分析數(shù)據(jù)值并存儲數(shù)據(jù)合并階段負責(zé)將來自多個數(shù)據(jù)源的數(shù)據(jù)合在一起決定數(shù)據(jù)值是否改變并過濾它們傳輸階段負責(zé)壓縮并傳輸數(shù)據(jù)本文集中討論集群監(jiān)控的收集階段

          收集階段

          Linux有幾種方法來進行系統(tǒng)統(tǒng)計每種方法都各有其優(yōu)缺點

          ◆ 使用現(xiàn)有的工具

          標(biāo)準(zhǔn)及非標(biāo)準(zhǔn)工具能執(zhí)行一個或多個收集合并及傳輸階段如rstatd或SNMP工具然而標(biāo)準(zhǔn)的rstat后臺程序提供的信息是有限的速度慢而且效率低

          ◆ 內(nèi)核模塊

          幾個系統(tǒng)監(jiān)控工程利用內(nèi)核模塊來存取監(jiān)控數(shù)據(jù)一般情況下這是很有效的收集系統(tǒng)數(shù)據(jù)的方法然而這種方法存在的問題是當(dāng)主內(nèi)核源內(nèi)有其它改變時必須保持代碼一致性一個內(nèi)核模塊可能與用戶想使用的其它內(nèi)核模塊相沖突此外在使用監(jiān)控系統(tǒng)之前用戶必須獲得或申請模塊

          ◆ /proc虛擬文件系統(tǒng)

          /proc 虛擬文件系統(tǒng)是一個較快的高效率執(zhí)行系統(tǒng)監(jiān)控的方法使用/proc的主要缺點是必須保持代碼分析與/proc 文件格式改變的同步事實表明Linux內(nèi)核的改變比/proc 文件格式的改變要更頻繁所以用/proc虛擬文件系統(tǒng)比用內(nèi)核模塊存在的問題要少

          ◆ 混合系統(tǒng)

          某些監(jiān)控系統(tǒng)采用混合方式用內(nèi)核模塊收集數(shù)據(jù)用/proc虛擬文件系統(tǒng)作為數(shù)據(jù)接口

          合并階段

          合并階段的實現(xiàn)可以在結(jié)點上集群管理的主機上或者分布在兩者上考慮到效率我們只采用在結(jié)點上的合并原因在于結(jié)點是監(jiān)控數(shù)據(jù)的收集器與提供者兩個或多個同時的數(shù)據(jù)請求不會引起兩次操作系統(tǒng)調(diào)用來收集數(shù)據(jù)而是將第一次請求獲得的數(shù)據(jù)緩存并可以提供給第二次請求調(diào)用這種方法減少了操作系統(tǒng)的負擔(dān)提高了監(jiān)控系統(tǒng)的響應(yīng)性合并階段也可以用于將多個數(shù)據(jù)源的數(shù)據(jù)以相互獨立的收集速率結(jié)合因為并不是所有的數(shù)據(jù)都以同樣的速度改變或者需要以同樣的速率收集

          使用在結(jié)點層上合并的另一個原因是減少了包括傳輸在內(nèi)的信息量許多/proc文件既包含動態(tài)數(shù)據(jù)也包含靜態(tài)數(shù)據(jù)刪除最近一次傳輸后沒有改變的值一個結(jié)點發(fā)送的數(shù)據(jù)量可以大大地減少合并不僅除去了不經(jīng)常改變的動態(tài)值的傳輸也解決了從不改變的靜態(tài)值的傳輸

          傳輸階段

          監(jiān)控數(shù)據(jù)幾乎總是按一個層次結(jié)構(gòu)組織起來傳輸階段的任務(wù)就是將層次數(shù)據(jù)進行有效的編碼形成一種能高效傳輸?shù)臄?shù)據(jù)格式Java擁有的文件格式是存儲層次數(shù)據(jù)的有效方法并且用提供的Java APIs很容易完成SExpressions已經(jīng)被認為是傳輸這種數(shù)據(jù)的另一個有效的方法

          關(guān)于傳輸監(jiān)控數(shù)據(jù)普遍討論的問題是數(shù)據(jù)應(yīng)該按二進制編碼還是按文本格式編碼二進制數(shù)據(jù)更容易壓縮因此也能更有效地傳輸?shù)钱?dāng)采用/proc文件系統(tǒng)時監(jiān)控數(shù)據(jù)通常以人們易讀的格式存儲在傳輸之前將數(shù)據(jù)轉(zhuǎn)換為二進制格式將需要更多的處理資源與時間以文本格式保留收集的數(shù)據(jù)結(jié)點資源能被用于更多非監(jiān)控性的相關(guān)工作

          采用文本格式的數(shù)據(jù)將提供如下額外的益處

          ◆ 平臺獨立性

          當(dāng)監(jiān)控異構(gòu)集群時機器之間數(shù)據(jù)字節(jié)指令的配置不是永遠相同的文本格式的使用在代碼方面解決了這個問題而且體系結(jié)構(gòu)獨立不會影響更多的處理需求

          ◆ 易讀的格式

          文本數(shù)據(jù)能以人們易讀的格式進行組織如果需要的話這種特征能容易地進行程序調(diào)試或允許用戶觀看數(shù)據(jù)流


          上一頁 1 2 下一頁

          關(guān)鍵詞: Linux 集群監(jiān)控

          評論


          相關(guān)推薦

          技術(shù)專區(qū)

          關(guān)閉
          看屁屁www成人影院,亚洲人妻成人图片,亚洲精品成人午夜在线,日韩在线 欧美成人 (function(){ var bp = document.createElement('script'); var curProtocol = window.location.protocol.split(':')[0]; if (curProtocol === 'https') { bp.src = 'https://zz.bdstatic.com/linksubmit/push.js'; } else { bp.src = 'http://push.zhanzhang.baidu.com/push.js'; } var s = document.getElementsByTagName("script")[0]; s.parentNode.insertBefore(bp, s); })();