Linux看門狗管理及在DM8168芯片上的應(yīng)用
⑤初始化本階段使用的硬件設(shè)備。
⑥檢測系統(tǒng)內(nèi)存映射。
⑦將內(nèi)核從Flash讀取到RAM中。
⑧設(shè)置內(nèi)核啟動參數(shù),然后啟動硬件看門狗,通過訪問控制寄存器來實(shí)現(xiàn)。該階段可以設(shè)置看門狗超時(shí)溢出時(shí)間為120 s。以DM8168芯片為例(后面的代碼都是基于該芯片實(shí)現(xiàn)),相關(guān)代碼為:
__raw_writel(0xBBBB,WDT_WSPR);
__raw_writel(0x4444,WDT_WSPR);
__raw_writel(wdt_trgr_time,WDT_WTGR);
這樣如果后續(xù)的內(nèi)核解壓及啟動出錯(cuò),看門狗超時(shí)可以復(fù)位開發(fā)板以重啟,重新加載內(nèi)核并試圖修復(fù)。
⑨完成系統(tǒng)初始化工作,U—Boot進(jìn)入主循環(huán)程序,處理用戶輸入的命令。在abortboot中,關(guān)閉看門狗,向控制寄存器依次寫入:
__raw_writel(0xAAAA,WDT_WSPR);
__raw_writel(0x5555,WDT_WSPR);
若收到用戶中斷,U—Boot自動啟動的命令后,關(guān)閉看門狗,以方便用戶調(diào)試U—Boot、設(shè)置內(nèi)核相關(guān)參數(shù)等信息。
⑩如果沒有收到用戶中斷命令,U—Boot會拷貝內(nèi)核鏡像并解壓內(nèi)核,開始啟動內(nèi)核調(diào)用。
4.2 內(nèi)核啟動階段
在U—Boot加載了內(nèi)核之后,系統(tǒng)就進(jìn)入內(nèi)核啟動階段,此時(shí),看門狗的管理控制也要由內(nèi)核來接管。內(nèi)核啟動主要包括內(nèi)核自解壓、注冊及加載硬件驅(qū)動程序、Flash分區(qū)等。
在內(nèi)核啟動時(shí),內(nèi)核程序會注冊硬件看門狗的驅(qū)動程序,并執(zhí)行probe探針函數(shù),此時(shí),內(nèi)核接管U—Boot階段的看門狗,即先關(guān)閉看門狗,然后再重新打開看門狗,并加載新的超時(shí)時(shí)長,此處設(shè)置wdt_trgr_time=120 s。
__raw_writel(0xAAAA,WDT_WSPR);
__raw_writel(0x5555,WDT_WSPR);
__raw_writel(0xBBBB,WDT_WSPR);
__raw_writel(0x4444,WDT_WSPR);
__raw_writel(wdt_trgr_time,WDT_WTGR);
這樣可以保證文件系統(tǒng)在掛載或解壓出錯(cuò)時(shí),看門狗沒有進(jìn)行喂狗操作,從而導(dǎo)致120 s超時(shí)后重啟。
在注冊完硬件驅(qū)動程序之后,內(nèi)核會掛載根文件系統(tǒng)并進(jìn)行解壓。
4.3 應(yīng)用程序啟動階段
文件系統(tǒng)啟動后,用戶的應(yīng)用進(jìn)程也會開始啟動。在這個(gè)階段,通常會創(chuàng)建一個(gè)獨(dú)立的守護(hù)進(jìn)程,來接管看門狗。守護(hù)進(jìn)程啟動時(shí),首先關(guān)閉內(nèi)核階段啟動的看門狗,并重新啟動看門狗設(shè)置超時(shí)時(shí)長,實(shí)現(xiàn)接管內(nèi)核階段看門狗的功能。在看門狗啟動后,守護(hù)進(jìn)程可以周期性地進(jìn)行喂狗操作,并通過心跳的方式同用戶進(jìn)程通信,在收不到用戶進(jìn)程的心跳包消息時(shí),即停止喂狗操作,這樣看門狗會超時(shí)溢出導(dǎo)致系統(tǒng)重啟,以進(jìn)行故障修復(fù)。
守護(hù)進(jìn)程通過看門狗中斷響應(yīng)函數(shù),實(shí)現(xiàn)重啟系統(tǒng)等操作,以恢復(fù)系統(tǒng)可用性。
至此,Linux從U—Boot啟動直到應(yīng)用程序完成過程中,看門狗都有相應(yīng)的啟動及管理。
4.4 看門狗管理小結(jié)
Linux系統(tǒng)下,U—Boot啟動后打開硬件看門狗,保證內(nèi)核解壓及啟動出現(xiàn)異常時(shí)重啟;內(nèi)核啟動階段,接管U—Boot下的看門狗并設(shè)置時(shí)間,可以保證文件系統(tǒng)掛載、解壓及啟動出現(xiàn)異常時(shí)重啟系統(tǒng);在進(jìn)入文件系統(tǒng)后,守護(hù)進(jìn)程接管內(nèi)核階段的看門狗,并定期地執(zhí)行喂狗操作,這樣在用戶進(jìn)程出現(xiàn)異常(退出)時(shí),守護(hù)進(jìn)程可以監(jiān)測到異常,停止喂狗操作,看門狗超時(shí)復(fù)位系統(tǒng)。嵌入式系統(tǒng)中,重啟是從故障中修復(fù)的最簡單有效的方法,通過在啟動的不同階段啟用硬件看門狗,可以有效保障系統(tǒng)異常時(shí)重啟。
5 DM8168看門狗的管理
除了前文提到的Linux系統(tǒng)下看門狗的基礎(chǔ)管理,DM8168芯片的硬件看門狗外圍輸出引腳,可以同時(shí)支持Reset和Interrupt信號,功能更加強(qiáng)大。
如果只是期望看門狗超時(shí)后能重啟復(fù)位板卡,參考前節(jié)提到的方法,依次在Linux啟動的各個(gè)階段啟用及管理看門狗即可,因?yàn)榭撮T狗的溢出引腳直接連接電源及復(fù)位管理模塊。
此外,如果想在看門狗超時(shí)溢出時(shí)增加一些額外的處理,可以采用捕獲中斷信號的方法。具體流程如下:
①注冊硬件看門狗中斷處理函數(shù),實(shí)現(xiàn)程序?yàn)閛map_irq=platform_get_resource(pdev,IORESOURCE_IRQ,0); //獲得中斷標(biāo)號
ret=request_irq(omap_irq,omap_wdt_irqhdl,0,pdev->name,wdev); //注冊中斷
其中omap_wdt_irqhdl為看門狗的中斷處理函數(shù)。
②在硬件看門狗中斷處理函數(shù)中可以增加一些附加的處理,需要注意的是,此時(shí)需要設(shè)置另外一組寄存器WDT_WDLY,以保證在復(fù)位前捕獲到中斷信號。
中斷處理函數(shù)omap_wdt_irqhdl的關(guān)鍵實(shí)現(xiàn)程序?yàn)椋?p>
采用此方法后,看門狗超時(shí)產(chǎn)生中斷信號,系統(tǒng)捕獲到中斷信號后自動觸發(fā)中斷響應(yīng)函數(shù),可以更靈活地處理(比如不復(fù)位系統(tǒng),保留現(xiàn)場以便定位問題)。
結(jié)語
本文以TI公司的TMS320DM8168芯片為例,詳細(xì)介紹了Linux系統(tǒng)從U—Boot啟動、內(nèi)核啟動到文件系統(tǒng)加載及用戶程序啟動過程中看門狗的啟用及管理,通過不同階段管理看門狗,可以保證系統(tǒng)在任何一個(gè)可能出現(xiàn)問題的階段,自動重啟以修復(fù)故障,從而有效提高系統(tǒng)的可靠性。在嵌入式設(shè)備越來越普及的今天,設(shè)備自恢復(fù)功能會具有極大的競爭力。
評論