空間信息系統(tǒng)COTS技術下的抗輻射設計
關鍵詞 空間信息處理系統(tǒng) 太空輻射環(huán)境COTS SEL雙機系統(tǒng)
引 言
空間信息處理系統(tǒng)作為小衛(wèi)星上的核心部件,它主要用于衛(wèi)星控制、星務管理、數(shù)據(jù)處理等,空間信息處理系統(tǒng)工作在一個相對地面更加惡劣的環(huán)境中,給研究人員提出了更高的要求。
一個自然的辦法是進行屏蔽和加固,相關數(shù)據(jù)表明:鋁板越厚,輻射作用越小,且宇航級加固的CMOS器件抗輻射能力大大強于常規(guī)CMOS。目前宇航級抗輻射加固的微處理器以及其他計算機器件落后最先進的商用產品數(shù)年,如圖1所示。
COTS(Commercial Off-The-Shelf)技術的引入,即用商用器件代替宇航級的抗輻射加固器件,是當前設計空間信息處理系統(tǒng)的一個趨勢。如何保證系統(tǒng)的可靠性,如何在采用更廉價的商用器件,充分利用其運算速度快、軟什編程平臺完善、應用軟件多、系統(tǒng)組成靈活等特點的同時,對商用現(xiàn)貨器件采取措施使之對空間環(huán)境具有抗輻射的功能,是一個具有挑戰(zhàn)性的課題。
1 空間輻射環(huán)境及效應分析
1.1 空間輻射效應
太空輻射環(huán)境對電子設備的效應主要分為兩類。
①輻射總劑量TID(Total Ionizing Dbse):描述的是電子器件在輻射環(huán)境下的一組特性,指器件在發(fā)生重大改變(永久故障)前所能承受的總吸收能量級。它的單位為Rad,即存積在一克硅中的能量。
②單粒子效應SEE(Single-Event Effect):指單個高能粒子撞擊引起的電子器件狀態(tài)的瞬時擾動,或是永久性的損傷。太空中的高能粒子包括重粒子、質子、α粒子、中子等。單粒子效應又分為兩類。
◆單粒子翻轉SEU(Single-Event Upset):引起電路中的觸發(fā)器和存儲單元的翻轉,出現(xiàn)了邏輯錯誤、存儲器錯誤或丟失同步信號等。SEU常被視為軟錯誤(softerror)。
◆單粒子閉鎖SEL(Single-Evcnt Latchup):輻射環(huán)境下造成的門擊、燒毀或閉鎖(1atch up),表現(xiàn)為CMOS電路短路、閉鎖熱應力過載等。SEL常被視為硬錯誤(harderror)。
1.2 對策研究綜述
由于小衛(wèi)星的空間位置和使用年限不同,而空間信息處理系統(tǒng)的輻射總劑量和單粒子效應隨不同太空環(huán)境(軌道高度、傾角)和不同任務時間差別很大(輻射環(huán)境參數(shù)甚至會有幾個數(shù)量級的變化),所以,其抗輻射的程度和措施也不盡相同。
目前,完全在硬件上屏蔽和避免輻射是很難實現(xiàn)且沒有必要的。而在COTS技術的應用中,在采取適當?shù)钠帘魏图庸檀胧┖螅詿o法完全達到系統(tǒng)抗輻避錯的情況下,容許系統(tǒng)出現(xiàn)輻射效應;但通過冗余(如烈機系統(tǒng))和容錯計算使系統(tǒng)正常進行工作,并設計使用一些應對輻射效應的保護電路,就成為了解決問題的辦法。
CMOS技術不斷發(fā)展,目前典型的CMOS技術下設備在物理損壞前能夠承受的TID大約為5 KRad;而根據(jù)美國國家航空和宇宙航行局(NAsA)提供的輻射模型分析顯示,其具有代表意義的小衛(wèi)星ION-F的計算機應用信息處理模塊CDH(Command and Data Handling)子系統(tǒng)的TID為25 Rad。由此可以得出結論:僅就小衛(wèi)星中的空間信息處理系統(tǒng)而言,在典型的任務周期和環(huán)境下,TID的影響可以忽略。我國的“實踐五號”衛(wèi)星分析也得出了類似的結論??紤]到小衛(wèi)星任務年限和環(huán)境的多變性,一般性的加固和適當厚度的鋁屏蔽應該足以滿足擾TID的要求。
隨著技術的發(fā)展。伴隨著器件電壓的降低和位密度的增加,SEE的發(fā)牛頻率呈上升趨勢,而屏蔽對高能粒子的作用也是十分有限的。因此,相當長的時間內,SEE相對而言是設計中更值得注意且潛伏危險性更高的問題。SEU對存儲器件影響最大,COTS技術下處理器內部可利用冗余技術(如雙機系統(tǒng))并采用合適的體系結構組織,存儲器用ECC或其他校驗碼檢測及自行校正錯誤,另外還可以使用看門狗(watch dog)技術。
屏蔽和加固技術不在本文的研究范圍內;比較成熟的雙機系統(tǒng)結構、校驗碼和看門狗技術則解決了SEU輻射效應的問題。
2 SEL解決方案設計
SEL是體效應技術CMOS(Bulk CMOS technologies)(非絕緣硅)的寄生雙極晶體管被局部沉積的電荷所觸發(fā)而引起在電源供給和接地之間的一種短路。CMOS的加工工藝在正常的操作情況下防止了這種情況的出現(xiàn)。但是在宇宙中,由穿越高能粒子引起的局部電荷沉積仍可能觸發(fā)這種效應。SEL可能局限在一個很小的本地區(qū)域內.也可能傳播影響至芯片的大部分。如果不采取保護措施,則由短路引起的大電流就可能使器件造成永久損壞。
2.1 SEL解決關鍵
與SEU相比,SEL是純粹的硬錯誤。如前文所述,SEL將引起器件中產生大電流。這個電流甚至可能會比器件典型的操作電流大幾個量級,并在其內部產生相當高的溫度。如果不及時補救.那么將造成器件永久性的損害。因此,雖然SEL發(fā)生的次數(shù)很少,但是卻是設計中最有挑戰(zhàn)性的問題。
目前,COTS下消除SEL的可行辦法只能是在大電流發(fā)生后重啟電源,因此設計的關鍵就在于系統(tǒng)中有:
◇能夠監(jiān)測大電流的過流監(jiān)視器裝置;
◇自動斷電和恢復的開關電路(即重啟電源)。
2.2 SEL保護電路原理
過流監(jiān)視器采用Maxim公司的芯片MAX4373/4374/4375系列。它是一種低成本、微功耗的高端電流檢測放大器+比較器+電壓基準IC。
重啟電源的開關可由P溝道增強型MOS管(P-channel MOSFET)來構造。選擇Vishay公司的Si4465DY,高質量的MOSFET自身對輻射環(huán)境就有很好的免疫能力。
SEL的保護電路原理圖如圖2所示。
如圖2所示,Vin是負載電路的電源,同時也是MAX4373的電源。上電后,經電流檢測電阻Rsense后向負載Load供電。負載電流Iload經Rsense,在其兩端產生一個電壓降Vsense。它作為電流檢測信號輸入MAX4373中的電流檢測放大器,其固定增益為Av,則放大后的電壓信號由0UT端輸出,Uout=VsenseAv。R1、R2組成電壓分壓器,它將Vout經分壓后輸入內部的電壓比較器同相端CINl,與反相端(接內部O.6 V基準電壓)相比較。若流入負載電路的電流未超過設定的閾值電流,則電流檢測放大器輸出的電壓Vout經R1、R2分壓后Voutin小于0.6V,內部電壓比較器輸出低電平(從COUTl),P溝道MOSFET導通,即負載的供電電路連通;若流入負載電路的電流超過了設定的閾值電流,則由Rsense檢測的電壓經電流檢測放大器放大后,使輸出電壓Vout經R1、R2分壓后Voutin大于0.6 V,內部電壓比較器翻轉,COUTl輸出高電平,使P淘道MOSFET截止,于是負載的供電電路被切斷。內部電壓比較器為輸出鎖存型,一旦翻轉,則輸出高電平鎖存,電路斷開狀態(tài)保持,即負載保持斷電。大電流消失后,按一下復位按鈕(>2μs),內部電壓比較器復位,COUTl輸出低電平,MOSFET導通,負載加電重新工作。圖2中的R3即為COUTl輸出上拉電阻,同時也提供了P淘道MOSFET的VGS電壓.抑制流經MOSFET的電流。
2.3 在雙機系統(tǒng)中的應用設計
根據(jù)以上原理,考慮SEL保護電路在雙機系統(tǒng)結構中的應用,給出空間信息處理系統(tǒng)SEL解決方案,如圖3所示。
圖3中CPUO板和CPUl板是冗余雙機,接口板負責雙機中主機和備機的通信與切換??梢钥吹剑琒EL解決措施分為3個步驟(電源系統(tǒng)設計不在本文論述范圍內):
①SEL保護電路對系統(tǒng)中各需要監(jiān)測的器件進行SEL監(jiān)測;
②當監(jiān)測出過流時,即發(fā)生了SEL,保護電路迅速實現(xiàn)對局部器件的斷電保護;
③SEL保護電路同時給出信號,控制電源板對本板供電部分的斷電和重啟。
3 在雙機系統(tǒng)中的實現(xiàn)
應用上述SEL解決方案設計,在某航天器雙機系統(tǒng)的原型結構中實現(xiàn)了該方案。這里給出的應用是雙機溫備系統(tǒng).同理可適用于雙機冷備或者熱備系統(tǒng)中。顯然:
◆當CPU板中有器件發(fā)牛SEL時,單純斷電該器件是不夠的,因為整個CPU板此時缺少此器件,很可能已不能正常工作了,因此還需將整個CPU板斷電并重啟。CPU板重啟時速度慢,所蹦此時必須由另一塊CPU板接管作為主機,這就涉及了雙機切換的問題。
◆在接口板中有器件發(fā)生SEL時,同理單純斷電該器件是不夠的,必須斷電并重啟接口板。接口板沒有冗余,但接口板的重啟速度快,所以僅需要將整個接口板斷電再重啟。
◆電源系統(tǒng)必須能夠提供關斷的電源管理功能,這也給電源系統(tǒng)的設計提出了要求。
3.1 CPU上的SEL方案實現(xiàn)
實現(xiàn)結構如圖4所示。
每塊CPU板上每一個需要監(jiān)測的器件供電引腳和供電電壓之間,都加上如圖4所示的由MAX4373和Si4465DY構成的SEL保護宅路;CPU板上不同器件的供電電壓有4種不同的電壓值(5V,3.3V,1.8V,1.5V)。這里的SEL保護電路其實就是對2.2小節(jié)中SEL保護電路原理的改進,即監(jiān)測芯片MAX4373和要監(jiān)測的器件使用的是不同的電源。當器件發(fā)生SEL大電流時,COUTl為高,且MAX4373工作保持鎖存該高電平,于是一方面迅速切斷該器件的供電電路以避免損壞,另一方面通過“或”門控制該CPU電源。可以看到,“或”門使得CPU板上任何被監(jiān)測的器件發(fā)生SEL時,CPU電源舶Ctrl為高,其上的Si4465DY同樣實現(xiàn)了開關功能,則CPU電源上MOSFET斷,電源的ON/OFF為低使得整個該CPU板的供電斷掉,此時便解決了此次的SEL問題。其后接口板上的Wacch dog能感知到該CPU發(fā)生故障,并控制雙機邏輯切換到另一臺CPU使之作為主機,即實現(xiàn)雙機切換。可以看到,當故障CPU斷電后,Ctrl變低,則該CPU電源上MOSFET導通,ON/OFF為高使得整個CPU的供電恢復,該CPU重新通電加載作為備機,從而實現(xiàn)溫備。
3.2 接口板上的抗SEL方案
實現(xiàn)結構如圖5所示。
接口板中每一個需要監(jiān)測的器件供電引腳和供電電壓之間,都加上如圖5所示的由MAX4373和Si4465DY構成的SEL保護電路;接口板上不同器件的供電電壓有3種不同的電壓值(5V,3.3V,1.5V)。這里的SEL保護電路其實就足對2.2小節(jié)中SEL保護電路原理的改進,即監(jiān)測芯片MAX4373和要監(jiān)測的器件使用的是不列的電源。當器件發(fā)生SEL大電流時,COUTl為高,且MAX4373工作保持鎖存該高電平,于是一方而迅速切斷該器件的供電電路以避免損壞,另一方面通過“或”門去控制接口板電源。
可以看到,“或”門使得接口板上任何被監(jiān)測的器件發(fā)生SEL時,接口板電源的Ctrl為高,其上的Si4465DY同樣實現(xiàn)了開關功能,則接口板電源上MOSFET斷開,ON/OFF為低使得整個接口板的供電斷掉,此時便解決了此次的SEL問題。當接口板斷電后,Ctrl變低,則該接口板電源上MOSFET導通,ON/OFF為高使得整個接口板的供電恢復,接口板迅速重新通電,極短時間內不會影響到雙機工作。
3.3 部分PCB原理圖
根據(jù)以上設計制板實現(xiàn),部分PCB原理圖如圖6所示。
結語
本文對太空輻射環(huán)境進行了分析,研究了COTS技術下空間信息處理系統(tǒng)的抗輻射設計,給出了基于SEL輻射效應的解決方案,并在某航天器雙機系統(tǒng)(溫備)上進行了原型實現(xiàn)??紤]到高能粒子輻射不僅存在于太空,還廣泛存在于核爆環(huán)境下甚至大氣中,因此,該實現(xiàn)方案也能夠移植應用于人為輻射(如敵方核爆)、機載(航空)和車載等領域。
評論