CAN消極報錯發(fā)送節(jié)點(diǎn)變?yōu)殡x線狀態(tài)的故障
摘要 處于消極報錯狀態(tài)的CAN節(jié)點(diǎn)在一次本地錯之后,由于標(biāo)準(zhǔn)考慮不周,會產(chǎn)生該節(jié)點(diǎn)與其他節(jié)點(diǎn)在幀啟停上的不同步,造成錯誤的不斷延續(xù),在接收節(jié)點(diǎn)中產(chǎn)生等同離線狀態(tài)。本文討論了在發(fā)送節(jié)點(diǎn)中產(chǎn)生真正離線的原因,并提出了解決方案。
關(guān)鍵詞 CAN報錯幀分界符 優(yōu)先級逆轉(zhuǎn) 離線
CAN是應(yīng)用非常廣泛的現(xiàn)場總線。它已經(jīng)被大部分汽車廠商用作車內(nèi)控制器交換信息的通信干線,是分布式嵌入式系統(tǒng)的關(guān)鍵部分。但是它有一種以前未討論過的與安全有關(guān)的故障,當(dāng)某一處于消極報錯狀態(tài)的節(jié)點(diǎn)由于干擾而產(chǎn)生一個本地錯后,因標(biāo)準(zhǔn)考慮欠周,該節(jié)點(diǎn)會與其他節(jié)點(diǎn)幀啟停失去同步,在其他掛起待發(fā)的消息發(fā)送時不斷出錯,形成等同于離線的狀態(tài),無法提供服務(wù),從而危及安全。本文討論處于消極報錯狀態(tài)的發(fā)送節(jié)點(diǎn),由于同樣的原因失去同步后的演變過程。這里不同的是,因?yàn)闃?biāo)準(zhǔn)中的另一個規(guī)定,它可能經(jīng)歷一個真正的離線狀態(tài)。
1 CAN標(biāo)準(zhǔn)的安全漏洞
在討論該問題時假定讀者對CAN的標(biāo)準(zhǔn)已有充分的了解,由于中文譯法的差別,本文采用的術(shù)語可能有所不同,相信不會影響讀者的理解。在Bosch CAN2.O規(guī)范3.1.3款中說:“為了使報錯幀正確結(jié)束,消極報錯節(jié)點(diǎn)可能需要處于空閑狀態(tài)至少有3bit時間(如果消極報錯接收節(jié)點(diǎn)發(fā)生本地錯),因此總線不應(yīng)滿負(fù)荷運(yùn)行?!报D―這是引起應(yīng)用出故障的原因。因?yàn)楣?jié)點(diǎn)問并無時間同步,即便總線有空閑時間,也不能保證像上述要求那樣的分布。掛起待發(fā)的消息將在服務(wù)間隔(intermission,圖中縮寫為I.M.)后立即發(fā)送。這在規(guī)范中也有規(guī)定:“在另一條消息發(fā)送過程中掛起待發(fā)的消息在服務(wù)間隔后的第一位啟動(發(fā)送)”。ISO11898標(biāo)準(zhǔn)沒有提到3位空閑問題,但是CAN一致性測試標(biāo)準(zhǔn)ISO16845的具體條文會有這種要求(雖然該空閑要求還是不充分的)。CAN規(guī)定處于消極報錯狀態(tài)的節(jié)點(diǎn)在發(fā)現(xiàn)錯之后發(fā)出6位隱位的消極報錯標(biāo)志(Passive error flag),如讀回6個連續(xù)的相同位時,就確認(rèn)報錯標(biāo)志發(fā)完,如沒發(fā)現(xiàn)6個連續(xù)的相同位,就繼續(xù)發(fā)隱位,直到得到確認(rèn),然后開始消極報錯幀分界符的發(fā)送。分界符從發(fā)出隱位讀回也是隱位時開始計(jì)算,總共為8個連續(xù)的隱位。在CAN一致性測試標(biāo)準(zhǔn)ISO16845的7.5.6款與8.5.13款中,規(guī)定了接收節(jié)點(diǎn)與發(fā)送節(jié)點(diǎn)在發(fā)消極報錯幀分界符時的格式錯檢查辦法。它規(guī)定,在消極報錯幀分界符開始后的8位中不得有顯位;如有顯位,就視為出錯,開始新的報錯幀。
如果一個處于消極報錯狀態(tài)的節(jié)點(diǎn)發(fā)現(xiàn)一個本地錯(即有一種誤判或漏判),由于其他節(jié)點(diǎn)不發(fā)主動報錯幀,那么它發(fā)的消極報錯幀標(biāo)志就不會及時得到確認(rèn),往往要到圖1所示的數(shù)據(jù)幀或遠(yuǎn)程幀的EOF第5位才會得到確認(rèn);而它的消極報錯幀分界符將延續(xù)到幀的服務(wù)間隔之后,它就和其他節(jié)點(diǎn)的幀啟停失去了同步。其他節(jié)點(diǎn)開始新幀的SOF將被它視為格式錯,而開始發(fā)新的消極報錯幀。當(dāng)其他節(jié)點(diǎn)有掛起待發(fā)的幀不斷發(fā)送時,這個處于消極報錯狀態(tài)的節(jié)點(diǎn)一直處于不斷出錯的狀態(tài),不能發(fā)送也不能接收,即等同于離線狀態(tài)。
這種源自標(biāo)準(zhǔn)考慮不周的故障會使CAN的優(yōu)先級逆轉(zhuǎn)(在處于消極報錯狀態(tài)的節(jié)點(diǎn)中的高優(yōu)先級消息無法發(fā)送);同時,基于優(yōu)先級進(jìn)行的調(diào)度分析失靈。以此為算法設(shè)計(jì)得到的消息最壞送達(dá)時間將是不可靠的,車的安全會受影響。在參考文獻(xiàn)[1]中,討論了修改消極報錯幀分界符長度來解決該故障的方法。
2 處于消極報錯狀態(tài)發(fā)送節(jié)點(diǎn)本地錯的后果
處于消極報錯狀態(tài)的發(fā)送節(jié)點(diǎn)在有本地錯時,其行為傾向更差。標(biāo)準(zhǔn)ISO16845的8.6.9款對發(fā)送節(jié)點(diǎn)在消極報錯幀分界符內(nèi)的格式錯規(guī)定了發(fā)送錯計(jì)數(shù)器TEC+8,第7.6.12款對處于消極報錯狀態(tài)的接收節(jié)點(diǎn)在消極報錯幀分界符內(nèi)的格式錯規(guī)定了接收錯計(jì)數(shù)器REC+1。而且標(biāo)準(zhǔn)規(guī)定REC是有上限的,它不會導(dǎo)致節(jié)點(diǎn)成為離線狀態(tài);但TEC會一直加上去,當(dāng)TEC=256時節(jié)點(diǎn)就成為離線狀態(tài),直到在總線上讀到128個連續(xù)的11個隱位,然后它
評論