一種高可靠MCU系統(tǒng)監(jiān)控方案
對(duì)于單片機(jī)系統(tǒng),一般都需要監(jiān)控電路來(lái)提高系統(tǒng)的可靠性。包括用電壓比較器對(duì)電源的監(jiān)控和看門狗對(duì)程序的監(jiān)控。為防止系統(tǒng)程序受干擾“飛掉”,常用看門狗定時(shí)器,這種方式對(duì)于系統(tǒng)進(jìn)入死循環(huán)時(shí)很有效,而程序“飛掉”時(shí)極有可能跳過(guò)一段程序,正好進(jìn)入另一條指令的開(kāi)頭。尤其在risc系統(tǒng)中,絕大部分是單周期指令,容易遇到這種情況,此時(shí)程序會(huì)繼續(xù)運(yùn)行下去,使看門狗失效。跳過(guò)的這段程序,可能包括一些接口控制執(zhí)行指令,或某些數(shù)據(jù)的輸入輸出,或條件判斷,整個(gè)系統(tǒng)會(huì)因此而運(yùn)行紊亂,或直接產(chǎn)生故障。系統(tǒng)出現(xiàn)這類故障時(shí)很難立即察覺(jué)。 1. 在運(yùn)用極其廣泛的一類mcu系統(tǒng),如分段定時(shí)控制系統(tǒng)中,象家用電器的電腦控制微波爐、洗衣機(jī)、電飯煲;電力行業(yè)的發(fā)電機(jī)轉(zhuǎn)速控制;冶金行業(yè)的連鑄、焊管及流水線系統(tǒng)等,都可能會(huì)在系統(tǒng)運(yùn)行中遇到分段定時(shí)控制或某一區(qū)域內(nèi)運(yùn)行狀態(tài)與前段運(yùn)行狀態(tài)密切相關(guān)的情況。此時(shí)簡(jiǎn)單地用看門狗電路作系統(tǒng)監(jiān)控,一旦出現(xiàn)系統(tǒng)死鎖而復(fù)位,將會(huì)使啟動(dòng)以后的整個(gè)運(yùn)行過(guò)程失效,這種方法顯然是行不通的。
2. 對(duì)于分時(shí)多任務(wù)系統(tǒng),其中的某個(gè)或幾個(gè)任務(wù)出現(xiàn)死鎖,而又有一個(gè)或多個(gè)任務(wù)仍正常運(yùn)行的情況下,看門狗定時(shí)器可能會(huì)被“蒙蔽”而失去監(jiān)控作用。
3. 在一個(gè)程序運(yùn)行周期很短,或系統(tǒng)根據(jù)不同運(yùn)行狀況的程序處理時(shí)間相差很大的情況下,看門狗定時(shí)周期難以定得合適,此時(shí)若出現(xiàn)干擾死機(jī)可能因難于及時(shí)發(fā)現(xiàn)并解決而造成故障。
如果有一種方法,使系統(tǒng)在運(yùn)行過(guò)程中能夠自行感知程序運(yùn)行狀況,出現(xiàn)問(wèn)題能夠隨時(shí)察覺(jué);發(fā)現(xiàn)故障立即報(bào)警、停止運(yùn)行或復(fù)位,甚至可以自動(dòng)糾錯(cuò),使程序恢復(fù)正確的運(yùn)行,以實(shí)現(xiàn)對(duì)程序的最佳監(jiān)控,那將是比較理想的。
2 系統(tǒng)在線自行跟蹤基本方法
系統(tǒng)在線運(yùn)行過(guò)程中,如果能夠隨時(shí)將系統(tǒng)運(yùn)行的過(guò)程即系統(tǒng)當(dāng)前程序的實(shí)際流程路線自動(dòng)記錄下來(lái),就有辦法將預(yù)期的運(yùn)行路線與之比較,從而避免程序出現(xiàn)不可預(yù)測(cè)的死鎖。打個(gè)比方,設(shè)想有一輛在公路上行駛的汽車,只要知道該汽車在各個(gè)岔路口的走向,就可以描繪出這輛汽車整個(gè)的行駛路線,但是難以保證汽車可能會(huì)在一條單一路線上行駛時(shí)拋錨。如果每隔一定距離以及重要路段設(shè)上“哨卡”,就能更加細(xì)致地了解到汽車的行駛情況,一旦出現(xiàn)問(wèn)題就能立即知道事故出現(xiàn)的具體路段。同理,在程序運(yùn)行過(guò)程中也可以通過(guò)人為設(shè)置的“哨卡”來(lái)記錄程序當(dāng)前的運(yùn)行路線。在多數(shù)情況下,這些“哨卡”對(duì)系統(tǒng)運(yùn)行并沒(méi)有太大的影響。 實(shí)際上,這些“哨卡”就是可以任意插入流程中的簡(jiǎn)短程序段,每一個(gè)“哨卡”有一個(gè)特定的“標(biāo)志碼”以使我們能夠知道程序到底運(yùn)行到何處。將這些標(biāo)記按出現(xiàn)的順序記錄在存儲(chǔ)器中,就能依此知道cpu“行駛”的具體路線。當(dāng)然,對(duì)系統(tǒng)的運(yùn)行狀態(tài)了解得越細(xì)致,程序的運(yùn)行時(shí)間會(huì)越長(zhǎng)。應(yīng)將它們?cè)O(shè)置在重要的數(shù)據(jù)讀寫或接口操作處,各分支路口和相對(duì)獨(dú)立的程序塊入口處,盡量減小對(duì)系統(tǒng)的影響。
下面以gms97c51單片機(jī)構(gòu)成的mcu系統(tǒng)為例說(shuō)明系統(tǒng)對(duì)自身運(yùn)行路線的跟蹤記錄方法。
如圖1所示,設(shè)系統(tǒng)cpu為97c51,外接一片sram 6116來(lái)作運(yùn)行記錄,為防止掉電和死機(jī)的影響,將ram用后備電池保護(hù)起來(lái)(系統(tǒng)上電初始化程序應(yīng)包括將6116清零,清零程序在此略去)。
在系統(tǒng)原來(lái)程序段中需要設(shè)“哨卡”的地方插入語(yǔ)句:
mov
sign, #mark
;#mark為標(biāo)志號(hào),sign定義
lcall
guide
;為存放標(biāo)志號(hào)的寄存器地址
這樣,僅插入6個(gè)字節(jié)對(duì)原來(lái)程序的存儲(chǔ)空間并無(wú)多大影響,所有的“哨卡”共用一個(gè)子程序。
guide:
push psw
; 保護(hù)原來(lái)程序可能用到的寄存器,如有必要也可
push acc
;將dptr壓棧保護(hù)
inc addr
;addr為標(biāo)志號(hào)存放單元, 上電后需清零
mov a,addr
;假設(shè)只用ram中的256個(gè)單元來(lái)做記錄
jz out
;若存儲(chǔ)空間用完則停止存儲(chǔ)記錄
mov dpl,addr
;設(shè)6116存儲(chǔ)地址為7f
評(píng)論