基于FPGA的TMR方法改進(jìn)策略
因?yàn)?a class="contentlabel" href="http://www.ex-cimer.com/news/listbylabel/label/TMR">TMR資源消耗較大,一般方法中由于布線(xiàn)以及表決器的實(shí)現(xiàn),當(dāng)粒度越小耗費(fèi)的資源更多。文獻(xiàn)提出了一種比較新穎的小粒度的方法,它對(duì)基于SRAM的FPGA的結(jié)構(gòu)進(jìn)行了一些改變(LUT及CLB結(jié)構(gòu)),以小粒度來(lái)實(shí)現(xiàn)TMR但資源消耗卻得到降低。
文中選用Xilinx Virtex-5系列芯片。其基本結(jié)構(gòu)是由兩個(gè)5輸入的LUT實(shí)現(xiàn)的一個(gè)6輸入的LUT。如圖3所示。如果低五位輸入數(shù)據(jù)相同那么可以實(shí)現(xiàn)兩個(gè)5輸入的LUT。在有些情況下,只需要5輸入的LUT,此時(shí)另一個(gè)LUT沒(méi)有被使用。如果在布局時(shí)使其總滿(mǎn)足這種情況,那么可以用留下的資源來(lái)實(shí)現(xiàn)TMR。
一個(gè)TMR需要兩個(gè)LUT,而兩個(gè)TMR只需要三個(gè)LUT,需要在LUT內(nèi)部實(shí)現(xiàn)表決器、報(bào)錯(cuò)電路以及其他的一些控制線(xiàn),這增加了LUT內(nèi)部的布線(xiàn)和延遲。
這種方法的優(yōu)點(diǎn)是粒度減小,可靠性增加,資源消耗少,可通過(guò)檢錯(cuò)和定位進(jìn)行有條件的重構(gòu),減少了功耗和配置時(shí)間。實(shí)驗(yàn)結(jié)過(guò)表明,相比于傳統(tǒng)的小粒度的TMR,這種方法額外資源消耗只為76.5%,而傳統(tǒng)的則達(dá)到242%。
2.4 基于空間搜索方法的TMR技術(shù)
由于部分以及小粒度TMR的出現(xiàn),在FPGA和設(shè)計(jì)約束的情況下,對(duì)粒度以及電路模塊的選擇是一個(gè)關(guān)鍵的問(wèn)題,而往往只知道資源、功耗及可靠性等要求,實(shí)際的布局與實(shí)現(xiàn)是一個(gè)棘手的問(wèn)題。文獻(xiàn)都提出了基于空間搜索的方法。這種方法是提供資源、功耗與可靠性等參數(shù),在各種可能的解決方法中進(jìn)行搜索而得到最優(yōu)的結(jié)果。
2.5 基于時(shí)間的TMR技術(shù)
基于時(shí)間的基本思想是通過(guò)多次計(jì)算進(jìn)行故障屏蔽,是對(duì)相同的計(jì)算重復(fù)進(jìn)行兩次或者多次并比較結(jié)果以檢測(cè)和克服錯(cuò)誤。當(dāng)對(duì)某一部分的電路得到一個(gè)結(jié)果后,暫時(shí)將其存儲(chǔ)起來(lái),延遲一定時(shí)間后再進(jìn)行一次計(jì)算并輸出存儲(chǔ),若比較結(jié)果不一致則出現(xiàn)了錯(cuò)誤,此時(shí)再延遲相同的時(shí)間,將其輸出作為正確的結(jié)果輸出。
這種方法對(duì)于檢測(cè)瞬時(shí)故障很有效,但其容錯(cuò)效果與延遲時(shí)間有關(guān)系。此方法實(shí)際上使用時(shí)間的延長(zhǎng)換取了資源的節(jié)省,對(duì)于實(shí)時(shí)性較高的系統(tǒng)使用性較差。
2.6 基于軟、硬件冗余的TMR技術(shù)
對(duì)于在硬件上出現(xiàn)的不可修復(fù)的損壞,上面的方法將都會(huì)失效。此時(shí)對(duì)每個(gè)模塊中采用三個(gè)不同的版本的文件(一個(gè)使用,兩個(gè)備份)且每個(gè)模塊還有1/4的硬件冗余資源。如果出現(xiàn)了硬件故障,則首先用其他版本對(duì)其進(jìn)行重新配置,如果這樣問(wèn)題還得不到解決,那么通過(guò)使用額外的冗余資源重新布局以繞過(guò)出錯(cuò)的部分。但是由于對(duì)冗余資源及存儲(chǔ)單元的要求,這種方法進(jìn)一步增加了資源的消耗。
3 TMR技術(shù)發(fā)展展望
基于以上的分析,用圖4所示的框圖來(lái)描述TMR技術(shù)出現(xiàn)的問(wèn)題與改進(jìn)方法之間的關(guān)系。由于硬件存在故障積累的問(wèn)題,所以在系統(tǒng)可靠性的要求下產(chǎn)生出了多種新的基于TMR的解決辦法,不過(guò)這些技術(shù)都只是針對(duì)某些問(wèn)題而提出的,它只解決了部分問(wèn)題同時(shí)也帶來(lái)了一些新的問(wèn)題,所以基于TMR的容錯(cuò)技術(shù)仍然不夠成熟。
不過(guò)其中小粒度的TMR技術(shù)是一種靈活性很大的方法,它結(jié)合其他的一些方法可以在節(jié)約資源的基礎(chǔ)上達(dá)到較好的性能,基于小粒度的TMR的技術(shù)將會(huì)是TMR技術(shù)的一個(gè)主要發(fā)展方向,需要進(jìn)一步解決由于布線(xiàn)資源相對(duì)增多而對(duì)系統(tǒng)可靠性的影響。另外,由于小粒度TMR的實(shí)現(xiàn)需要對(duì)系統(tǒng)的各部分電路進(jìn)行選擇并進(jìn)行布局,所以TMR實(shí)現(xiàn)的自動(dòng)化也是一個(gè)需要研究的方向。
4 結(jié)語(yǔ)
總結(jié)了TMR技術(shù)存在的突出問(wèn)題,研究了這些新方法,分析了其優(yōu)勢(shì)以及存在的問(wèn)題并指出了相應(yīng)的解決辦法。TMR技術(shù)的發(fā)展應(yīng)該以高效的實(shí)現(xiàn)方法及可靠性為方向,以穩(wěn)健的評(píng)估策略為基礎(chǔ),根據(jù)所要達(dá)到的參數(shù)要求,以較高的自動(dòng)化的方式在不同的粒度和布局上進(jìn)行權(quán)衡而得到最終的TMR解決方案。
評(píng)論