在系統(tǒng)設(shè)計(jì)中添加“黑盒子”故障記錄儀
摘要:本文介紹了一種在網(wǎng)絡(luò)、通信、工業(yè)和醫(yī)療設(shè)備中增添“黑盒子”功能的方案。綜合介紹了記錄故障數(shù)據(jù)的優(yōu)勢,包括能夠快速、準(zhǔn)確地定位故障,進(jìn)行失效分析。
本文引用地址:http://www.ex-cimer.com/article/130633.htm引言
相信每個(gè)人都了解“黑盒子”的用途,用于記錄飛機(jī)飛行過程中發(fā)生意外瞬間的數(shù)據(jù)。飛機(jī)的“黑盒子”能夠收集大量飛行操作數(shù)據(jù),包括:高度、速度、襟翼和航向位置;記錄飛行員在事故發(fā)生之前進(jìn)行的操作和對話。這些數(shù)據(jù)對于最終分析事故的根本原因起著重要作用。
“黑盒子”并非名副其實(shí),飛機(jī)上的黑盒子從不是黑色的,而是采用橙色,以便容易被發(fā)現(xiàn)。所以,該設(shè)備的正確名稱應(yīng)該是“事件數(shù)據(jù)記錄儀”。
當(dāng)然,在工程師眼里,“黑盒子”代表一個(gè)已知輸入、輸出,但內(nèi)部操作未知的設(shè)備。本文并不討論這種設(shè)備。在電子設(shè)備(而不是飛機(jī))中增加數(shù)據(jù)記錄功能——“黑盒子”,將為系統(tǒng)提供非常有價(jià)值的信息。電子設(shè)備中所謂的復(fù)雜系統(tǒng)管理器——黑盒子,用于記錄網(wǎng)絡(luò)、通訊、工業(yè)、醫(yī)療設(shè)備的故障數(shù)據(jù)。記錄故障所帶來的最大好處是快速、有效地進(jìn)行失效分析。本文介紹了實(shí)現(xiàn)這個(gè)功能的方案以及利用非易失故障記錄的便利條件。
電源管理機(jī)制
從電源管理的角度看,大多數(shù)系統(tǒng)架構(gòu)看起來非常接近。無論系統(tǒng)是路由器、服務(wù)器、基站、光纖交換機(jī)、可編程控制器,還是磁共振成像儀,它們都包含開關(guān)電源和線性穩(wěn)壓器,而且都需要監(jiān)測電壓、電流、溫度或風(fēng)扇速度,如圖1所示。
非易失故障記錄
無論是大規(guī)模系統(tǒng),還是一個(gè)“比薩”盒子大小的系統(tǒng),其系統(tǒng)管理器的主要功能是控制、監(jiān)測大量的電源和風(fēng)扇,其中包括:系統(tǒng)故障查詢,例如:過壓/欠壓、過流、溫度是否超出工作范圍,或者是風(fēng)扇速度是否正常。將故障監(jiān)測轉(zhuǎn)化成檢測參數(shù)是否超出閥值這類簡單操作。系統(tǒng)運(yùn)行過程中實(shí)時(shí)采集數(shù)據(jù),并在發(fā)生故障時(shí)將數(shù)據(jù)存儲到非易失存儲器,由此創(chuàng)建事件數(shù)據(jù)記錄器,圖2顯示了一個(gè)系統(tǒng)方案。
圖2中,復(fù)雜系統(tǒng)管理器連續(xù)收集系統(tǒng)電壓、電流、溫度和風(fēng)扇速度等數(shù)據(jù)。類似于飛機(jī)上的“黑盒子”,記錄儀將滾動(dòng)收集大量的最新數(shù)據(jù)(比如,500ms到1s的最新數(shù)據(jù))。發(fā)生故障時(shí),系統(tǒng)的瞬間信息將被永久記錄下來。能夠檢查故障發(fā)生前500ms - 1s期間的系統(tǒng)操作,對排查系統(tǒng)故障的原因和系統(tǒng)分析非常重要。通過核查數(shù)據(jù),可以重新組織時(shí)間段,確定系統(tǒng)的相互依賴關(guān)系。理想情況下,復(fù)雜系統(tǒng)管理器應(yīng)記錄多種故障,便于建立系統(tǒng)之間的相互依賴性,發(fā)生一個(gè)故障后,可能會(huì)引發(fā)更多的后續(xù)故障。為了找到故障的根本原因,需要記錄盡可能完備的數(shù)據(jù)。而且,大容量非易失數(shù)據(jù)存儲允許系統(tǒng)記錄并非關(guān)鍵的故障,只是表示系統(tǒng)的某些參數(shù)超出了工作范圍,這對提高整體系統(tǒng)的安全性非常重要。
評論