準時的重要性:為嵌入式列車控制系統(tǒng)選擇操作系統(tǒng)
為確保安全和效率,鐵路和運輸系統(tǒng)正在實施各種保護系統(tǒng),如列車自動保護(ATP)、積極列車控制(PTC)和基于通信的列車控制(CBTC)等。地鐵和其他軌道交通系統(tǒng)正在采用自動列車操作(ATO)系統(tǒng)并運行“無人駕駛”列車(沒有駕駛員或駕駛員只用來處理緊急情況的列車)。
這些控制系統(tǒng)與安全息息相關(guān)。它們必須滿足IEC 61508和EN 5012x標準中所設(shè)定的嚴格可靠性要求。本文側(cè)重于介紹操作系統(tǒng)中對系統(tǒng)可靠性帶來最直接影響的一些特點:確保實時性的架構(gòu)特性、故障分離和故障恢復(fù)等功能。
圖1 新西蘭的ONTRACK安裝了一個四頻道RoIP裝置,命名為ORC,作為IP網(wǎng)絡(luò)和傳統(tǒng)的VHF/IHF無線電網(wǎng)絡(luò)之間的橋梁,用于促進列車安全運行和追蹤軌道工人的位置。
標準
二十年前,歐洲電工標準化委員會頒發(fā)了鐵路應(yīng)用標準EN 50126,它定義了可靠性、可用性、可維護性和安全性的規(guī)范,同時頒布了用于鐵路控制和保護系統(tǒng)軟件的標準EN50128和用于發(fā)送信號的安全相關(guān)的電子系統(tǒng)的標準EN 50129。
EN 50128:強調(diào)了軟件架構(gòu)的重要性:“軟件架構(gòu)是軟件和軟件安全完整性等級開發(fā)的基本安全策略。”規(guī)定如果要求SIL 3 或SIL 4的系統(tǒng)部署COTS(商用現(xiàn)成)軟件,“應(yīng)定義一個策略以檢測COTS軟件的故障并保護系統(tǒng)免于故障”。
可靠性和隔離性
在一個軟件系統(tǒng)中,可靠性是可用性和可靠性的組合。這些品質(zhì)主要取決于操作系統(tǒng)審計架構(gòu)。
操作系統(tǒng)架構(gòu)是整個系統(tǒng)可靠性的基礎(chǔ),它決定了將組件與不同的SIL要求進行分離的難度和成本。
例如,一個ATO系統(tǒng)可能包含了一個顯示非關(guān)鍵信息的多媒體組件。該組件只需要達到SIL1或甚至SIL 0(EN標準為非安全相關(guān)的軟件定義了SIL 0)就可以了,而關(guān)鍵組件(處理與軌旁基礎(chǔ)設(shè)施相關(guān)的通信、管理減速和制動,報警等)則需要SIL 3或更高的認證。一個有利于SIL 0組件分離的架構(gòu)不能在系統(tǒng)的安全關(guān)鍵部分上妥協(xié):
a) 簡化設(shè)計,允許以最少的集成工作為SIL 0組件使用COTS軟件
b) eli消除了為滿足SIL 3要求而產(chǎn)生的設(shè)計、構(gòu)建和驗證非關(guān)鍵組件的成本。
c) 由于它減少了安全關(guān)鍵系統(tǒng)的范圍,側(cè)重于關(guān)鍵系統(tǒng)組件的開發(fā)和驗證,使得整體系統(tǒng)更為安全。
架構(gòu)
支持可靠性保證的操作系統(tǒng)通常被稱為實時操作系統(tǒng)(RTOS)。實時操作系統(tǒng)的架構(gòu)是不同的。最常見的架構(gòu)是實時執(zhí)行、單片式和微內(nèi)核。
實時執(zhí)行
盡管已有50年歷史,實時執(zhí)行模式依然是許多實時操作系統(tǒng)的基礎(chǔ)。在此模式中,所有軟件組件—內(nèi)核、網(wǎng)絡(luò)協(xié)議棧、文件系統(tǒng)、設(shè)備驅(qū)動程序和應(yīng)用程序均在單一的內(nèi)存地址空間里運行。
雖然有效,但該架構(gòu)有兩大弱點。首先,任何模塊中的單一指針錯誤均能破壞內(nèi)核或任何其它模塊所使用的內(nèi)存,從而可能導(dǎo)致系統(tǒng)范圍內(nèi)的故障。其次,系統(tǒng)崩潰也許沒有留下幫助識別錯誤的診斷信息。
宏內(nèi)核
宏內(nèi)核實時操作系統(tǒng)通過使用一個架構(gòu)解決了內(nèi)存錯誤所引起的系統(tǒng)崩潰的問題,在該架構(gòu)里,用戶應(yīng)用程序作為內(nèi)存保護進程而運行。
該架構(gòu)保護了內(nèi)核免于錯誤的用戶代碼,但內(nèi)核組件仍舊與文件系統(tǒng)、協(xié)議棧和驅(qū)動程序共享地址空間。因此,這些服務(wù)中的任何一個錯誤都能讓系統(tǒng)崩潰。例如,在一個Linux操作系統(tǒng)中,驅(qū)動程序組成75%的代碼,每一行顯示能達到內(nèi)核的潛在錯誤。與實時執(zhí)行操作系統(tǒng)一樣,單片式操作系統(tǒng)架構(gòu)的系統(tǒng)也許難于滿足可靠性的要求。
微內(nèi)核
在一個微內(nèi)核實時操作系統(tǒng)中,應(yīng)用程序、設(shè)備驅(qū)動程序、文件系統(tǒng)和網(wǎng)絡(luò)協(xié)議棧存在于內(nèi)核之外的一個獨立的地址空間;它們即與內(nèi)核分離而且彼此分離。某一個組件中的故障不會波及系統(tǒng)。此外,由于它同樣以可預(yù)見的方式運行,因此系統(tǒng)能重啟故障組件。
圖2 微內(nèi)核:組件彼此分離,一個組件的故障不會波及整個系統(tǒng)
對于安全相關(guān)的系統(tǒng),內(nèi)核與其它組件彼此分離是有利的。不是所有的組件都需要實現(xiàn)系統(tǒng)的安全關(guān)鍵部分所需的SIL。所要求的是較低級別的SIL組件能與安全關(guān)鍵組件分離。
這種分離也能通過虛擬機實現(xiàn)(管理程序),但這種策略通常需要更強大的處理器,這限制了合適的處理器的選擇并增加了成本。它也增加了系統(tǒng)的復(fù)雜程度,并可能影響實時性能。
實時操作系統(tǒng)的關(guān)鍵特點
微內(nèi)核架構(gòu)只是實現(xiàn)操作系統(tǒng)可靠性的一個特點。其它關(guān)鍵特點包括:
• 通過搶占低優(yōu)先級的內(nèi)核調(diào)用來滿足實時性的承諾
• 由于優(yōu)先級反轉(zhuǎn),防止不可預(yù)知的行為和系統(tǒng)故障
• 保證CPU資源調(diào)度的可用性以防止關(guān)鍵進程饑餓
• 利用軟件看門狗監(jiān)視進程,并在組件發(fā)生故障時采取糾正行動
評論