數(shù)據(jù)中心供電系統(tǒng)故障誘因分析
那我們?nèi)绾斡行ПU蠑?shù)據(jù)中心的電源動力呢?我們需要一個能可以保障計算機(jī)系統(tǒng)在停電之后繼續(xù)工作一段時間以使用戶能夠緊急存盤,使您不致因停電而影響工作或丟失數(shù)據(jù),為計算機(jī)系統(tǒng)提供高質(zhì)量的電源。他就是我們常說的UPS系統(tǒng)。
UPS—不間斷電源系統(tǒng),是一種含有儲能裝置、以逆變器為主要元件、穩(wěn)壓穩(wěn)頻輸出的電源保護(hù)設(shè)備。在計算機(jī)和網(wǎng)絡(luò)系統(tǒng)應(yīng)用中,主要起兩個作用:一是應(yīng)急使用,防止電網(wǎng)突然斷電而影響正常工作,給計算機(jī)系統(tǒng)造成損害;二是消除市電網(wǎng)上的電涌、瞬間高電壓、瞬間低電壓、暫態(tài)過電壓、電線噪聲和頻率偏移等“電源污染”,改善電源質(zhì)量,為計算機(jī)系統(tǒng)提供高質(zhì)量的電源。在實際的應(yīng)用中,各種原因引起的UP故障給用戶帶來了意想不到的經(jīng)濟(jì)損失。因此,如何建立一個合理的、安全的UPS供電系統(tǒng)成為大家關(guān)注的問題。本文將從UPS供電系統(tǒng)故障的誘因進(jìn)行探討。
一、數(shù)據(jù)中心供電故障原因1:UPS選型不當(dāng)導(dǎo)致的故障
有的用戶認(rèn)為UPS都一樣,所以就追求低價格,結(jié)果導(dǎo)致故障。比如某高速公路指揮部貪圖便宜,第一天裝機(jī),第二天就起火;某人壽保險公司低價格購進(jìn)的機(jī)器,不到半年因UPS故障而燒毀幾乎所有IT設(shè)備的輸入電路,導(dǎo)致系統(tǒng)癱瘓;又如某多臺UPS并聯(lián)的兆瓦級數(shù)據(jù)中心,裝機(jī)沒有幾個月因其中一臺UPS中的一個逆變器功率管擊穿而導(dǎo)致所有UPS跳閘…
二、數(shù)據(jù)中心供電故障2:使用環(huán)境不當(dāng)故障導(dǎo)致的故障
不按說明書上對環(huán)境的要求放置機(jī)器,甚至有的將UPS放在隨便穿行的走廊、滴水的地下室。比如幾臺200kVA的UPS放在了屋頂只有一層預(yù)制板的平房,空調(diào)只是兩臺5P的舒適空調(diào)機(jī),又如一個玻璃廠竟將UPS放在粉末飛揚(yáng)的廠房內(nèi),等等。導(dǎo)致了頻繁故障。
三、數(shù)據(jù)中心供電故障3:制度不健全導(dǎo)致的故障
比如有的值班人員隨便將電爐子、電飯煲和吸塵器接在UPS上,導(dǎo)致過載跳閘;有的值班人員的食物引來老鼠鉆入機(jī)器而導(dǎo)致起火。
四、數(shù)據(jù)中心供電故障4:交接故障
這類故障主要是由于管理人員的前后不是一撥人或配合不好造成。比如某火車站售票系統(tǒng),前面值機(jī)人員由于移動機(jī)器位置而將UPS的外接電池組斷開,事后又未向后來者交代,結(jié)果造成了市電和UPS同時停電的故障…
五、數(shù)據(jù)中心供電故障5:經(jīng)驗故障
經(jīng)驗是不可缺少的,是不可多得的財富。但經(jīng)驗有其相對性,即在某種UPS上得到的經(jīng)驗不一定完全適合另一種UPS,否則就會導(dǎo)致故障。某電信局由于不看說明書而用同樣的方法啟動另一品牌機(jī)器導(dǎo)致逆變器燒毀。
六、數(shù)據(jù)中心供電故障6:失察故障
一些器件在運(yùn)行中會出現(xiàn)老化或早期失效,如不及時檢查發(fā)現(xiàn)就會導(dǎo)致故障。這些在自動監(jiān)控中是無法發(fā)現(xiàn)的。比如因老化而開始彎曲的保險絲,電池結(jié)構(gòu)螺絲的松動,電池長時間放點后使電池殼有微細(xì)的裂縫等,如不及時發(fā)現(xiàn)或發(fā)現(xiàn)后沒有及時處理都可造成故障。
七、數(shù)據(jù)中心供電故障7:倉促上陣導(dǎo)致的故障
搞維修保養(yǎng)來不得半點急躁,要考慮周全后再動手。某公司工程師要對一用戶正在運(yùn)行的UPS進(jìn)行檢修,按照規(guī)定要用維修旁路開關(guān)將UPS退出后再檢修,但按照程序需先啟動自動旁路,而后再合維修旁路的閘刀。也許該工程是還有其他急事要辦,進(jìn)機(jī)房后未經(jīng)考慮就閉合了維修旁路閘刀,結(jié)果造成逆變器功率管爆炸。
八、數(shù)據(jù)中心供電故障8:維護(hù)不當(dāng)導(dǎo)致的二次故障
對UPS的定期維護(hù)是必要的,但應(yīng)有一套嚴(yán)格的管理程序。那些不負(fù)責(zé)任、不按規(guī)定要進(jìn)行定期或不定期保養(yǎng)是導(dǎo)致機(jī)器故障的重要原因。另外,在維護(hù)保養(yǎng)時也可導(dǎo)致故障,比如用萬用表探針測量電路板電位時,探針將兩點短路導(dǎo)致故障。一用戶作電池放電時,將電池從UPS上摘下,放電后將電池接回時機(jī)型解放,導(dǎo)致電流爆炸。又如一工程師在更換離心風(fēng)機(jī)時不小心活動扳手一打滑打在了控制板上,當(dāng)時沒有在意,風(fēng)機(jī)換好后不能開機(jī),檢查發(fā)現(xiàn)一條器件退被打斷了…
九、數(shù)據(jù)中心供電故障9:靜電導(dǎo)致的故障
某機(jī)房按例停機(jī)保養(yǎng),但保養(yǎng)后卻無法開機(jī)。檢查后發(fā)現(xiàn)一個組件電壓擊穿,回憶為保過程發(fā)現(xiàn)該控制板用塑料牙刷掃過灰塵。塑料在干燥器件的表面可產(chǎn)生幾千伏的摩擦靜電電壓,由于機(jī)器內(nèi)小信號電路使用了一些MOS器件,這些器件耐壓很低而且最怕靜電。經(jīng)測量一個普通塑料袋,用電路板摩擦以下就可產(chǎn)生3000V的靜電電壓。所以在檢查這些電路板時最好手腕上要討一個接地環(huán)。
十、數(shù)據(jù)中心供電故障10:過分自信導(dǎo)致的故障
做事情自信是成功的基礎(chǔ),但過分自信有時就會出錯。比如某國際銀行在UPS運(yùn)行了8年后就應(yīng)該更新設(shè)備,廠家也多次提醒。由于該UPS8年來很少出問題,所以用戶負(fù)責(zé)人屢次回答“不用更新”,結(jié)構(gòu)幾個月后該UPS因老化故障而停止供電兩小時,導(dǎo)致全球業(yè)務(wù)也斷兩小時,損失很大。根據(jù)國際上的統(tǒng)計資料,5年標(biāo)稱的電池服務(wù)壽命最多不超過3年。在平時不保養(yǎng)的情況下,一般2年就應(yīng)該更換。某飛機(jī)場候機(jī)廳電池原配4h,3年后人不更換,一次外電網(wǎng)停電,UPS后備時間只剩4h,由于停電造成了損失。像類似的人為故障現(xiàn)象還有很多,就不一一例舉了。
歸根到底,電源系統(tǒng)的選型是第一關(guān),這一道關(guān)把不住首先就種下了隱患的種子。電源系統(tǒng)的連接是第二關(guān),有了好的設(shè)備,如果沒有好的連接方案,也會埋下隱患。某電視臺由于連接方案被廠家誤導(dǎo)。十幾套節(jié)目的供電UPS故障接連不斷,而且大都是有驚無險,一連幾年都是這樣,使維保人員提心吊膽、傷透了腦筋。連接方案是一個工程,不是維保人員左右的了的。無奈只好在重大活動和節(jié)日令廠家工程師前來值班。這又有什么用呢!廠家的工程師到此也只能是給用戶心理上以安慰。該告警的時候照樣告警,只求上帝保佑不要停電!
所以UPS的選購就相當(dāng)重要了!關(guān)于UPS的選購我們總結(jié)了以下幾點,希望對大家有所幫助。
(1)確認(rèn)所需UPS的類型對于金融、證券、電信、交通等重要行業(yè),應(yīng)選擇性能優(yōu)異、安全性高的在線式UPS;對于網(wǎng)絡(luò)用戶,除考慮選擇在線式UPS外,還可選擇在線互動式UPS;對于家庭用戶,可選擇后備式UPS。
(2)確定所需UPS的功率計算UPS功率的方法是:UPS功率=實際設(shè)備功率×安全系數(shù)。其中,安全系數(shù)是指大設(shè)備的啟動功率,一般選1.5。
(3)考慮發(fā)展余量除考慮實際負(fù)載以外,還要考慮今后設(shè)備的增加所帶來的增容問題,因此UPS的功率應(yīng)在現(xiàn)有負(fù)載的基礎(chǔ)上再增加15%的余量。
(4)選擇品牌和售后服務(wù)最好選擇保修期長,售后服務(wù)及時周到的UPS。這樣,產(chǎn)品供應(yīng)商可以方便地對其產(chǎn)品及時進(jìn)行維護(hù)和維修,從而保證用戶的正常使用。
UPS高端用戶選擇的大都是進(jìn)口品牌的UPS電源產(chǎn)品,國外的很多產(chǎn)品在技術(shù)上五花八門,大都是成熟產(chǎn)品,國內(nèi)的很多用戶也都選擇有很好運(yùn)行業(yè)績的產(chǎn)品,但畢竟是國外的產(chǎn)品,在技術(shù)支持和服務(wù)上想必許多客戶都有不愉快的經(jīng)歷,尤其是在中方技術(shù)人員無法處理的時候,往往給終端用戶造成損失。當(dāng)然許多事情可以防范于未然,提前做好一定的準(zhǔn)備可以把損失減少?!?/P>
評論