硬件可靠性測試方法詳解
以行業(yè)標(biāo)準(zhǔn)或者國家標(biāo)準(zhǔn)為基礎(chǔ)的可靠性測試。比如電磁兼容試驗、氣候類環(huán)境試驗、機(jī)械類環(huán)境試驗和安規(guī)試驗等。
企業(yè)自身根據(jù)其產(chǎn)品特點(diǎn)和對質(zhì)量的認(rèn)識所開發(fā)的測試項目。比如一些故障模擬測試、電壓拉偏測試、快速上下電測試等。
下面分別介紹這兩類可靠性測試。
1 基于行業(yè)標(biāo)準(zhǔn)、國家標(biāo)準(zhǔn)的可靠性測試方法
產(chǎn)品在生命周期內(nèi)必然承受很多外界應(yīng)力,常見的應(yīng)力有業(yè)務(wù)負(fù)荷、溫度、濕度、粉塵、氣壓、機(jī)械應(yīng)力等。各種行業(yè)標(biāo)準(zhǔn)、國家標(biāo)準(zhǔn)制定者給出了某類產(chǎn)品在何種應(yīng)用環(huán)境下會存在多大的應(yīng)力等級,而標(biāo)準(zhǔn)使用者要根據(jù)產(chǎn)品的應(yīng)用環(huán)境和對質(zhì)量的要求選定相應(yīng)的測試條件即應(yīng)力等級,這個選定的應(yīng)力等級實質(zhì)上就是產(chǎn)品測試規(guī)格。
在產(chǎn)品的測試階段,我們必須在實驗室環(huán)境下對足夠的測試樣本一一施加相應(yīng)的應(yīng)力類型和應(yīng)力等級,考察產(chǎn)品的工作穩(wěn)定性。對于通信設(shè)備而言,常見的測試項目至少包括電磁兼容試驗、安規(guī)試驗、氣候類環(huán)境試驗和機(jī)械環(huán)境試驗,而上述四類測試項目還包含很多測試子項,比如氣候類環(huán)境試驗還包括高溫工作試驗、低溫工作試驗、濕熱試驗、溫度循環(huán)試驗等。此類測試項目還有很多,這里就不做詳細(xì)介紹??偟亩?,所有的測試項目都屬于規(guī)格符合性測試(即PASS或者FAIL測試),試驗的目的都是模擬產(chǎn)品在生命周期內(nèi)承受應(yīng)力類型和應(yīng)力等級,考察其工作穩(wěn)定性。
2 企業(yè)設(shè)計的可靠性測試方法
由于網(wǎng)絡(luò)產(chǎn)品的功能千差萬別,應(yīng)用場合可能是各種各樣的,而與可靠性測試相關(guān)的行業(yè)標(biāo)準(zhǔn)、國家標(biāo)準(zhǔn),一般情況下只給出了某類產(chǎn)品的測試應(yīng)力條件,并沒有指明被測設(shè)備在何種工作狀態(tài)或配置組合下接受測試,因此在測試設(shè)計時可能會遺漏某些測試組合。比如機(jī)框式產(chǎn)品,線卡種類、線卡安裝位置、報文類型、系統(tǒng)電源配置均可靈活搭配,這涉及到的測試組合會較多,這測試組合中必然會存在比較極端的測試組合。再如驗證該機(jī)框的系統(tǒng)散熱性能,最差的測試組合是在散熱條件機(jī)框上滿配最大功率的線卡板;如果考慮其某線卡板低溫工作性能,比較極端的組合時是在散熱條件最好的機(jī)框上配置最少的單板且配置的單板功耗最小,并且把單板放置在散熱最好的槽位上。
總之,在做測試設(shè)計時,需要跳出傳統(tǒng)測試規(guī)格和測試標(biāo)準(zhǔn)的限制,以產(chǎn)品應(yīng)用的角度進(jìn)行測試設(shè)計,保證產(chǎn)品的典型應(yīng)用組合、滿配置組合或者極端測試組合下的每一個硬件特性、硬件功能都充分暴露在各種測試應(yīng)力下,這個環(huán)節(jié)的測試保證了,產(chǎn)品的可靠性才得到保證。
以下舉兩個例子來說明如何根據(jù)產(chǎn)品特點(diǎn)設(shè)計出可靠性測試方法。
2.1 實例一:包處理器外掛緩存(Buffer)的并行總線測試
為了應(yīng)對網(wǎng)絡(luò)的突發(fā)流量和進(jìn)行流量管理,網(wǎng)絡(luò)設(shè)備內(nèi)部的包處理器通常都外掛了各種隨機(jī)訪問存儲器(即RAM)用來緩存包。由于包處理和RAM之間通過高速并行總線互連,一般該并行總線的工作時鐘頻率可能高達(dá)800Mhz,并且信號數(shù)量眾多,拓?fù)浣Y(jié)構(gòu)復(fù)雜,在產(chǎn)品器件密度越來越高的情況下,產(chǎn)品很可能遇到串?dāng)_、開關(guān)同步噪音(SSN)等嚴(yán)重的信號質(zhì)量問題,針對上述可能遇到的問題,我們需進(jìn)行仔細(xì)的業(yè)務(wù)設(shè)計,讓相應(yīng)硬件電路的充分暴露在不利的物理條件下,看其工作是否穩(wěn)定。
串?dāng)_,簡單的來說是一種干擾,由于ASIC內(nèi)部、外部走線的原因,一根信號線上的跳動會對其他信號產(chǎn)生不期望的電壓噪聲干擾。為了提高電路工作速率和減少低功耗,信號的幅度往往很低,一個很小的信號干擾可能導(dǎo)致數(shù)字0或者1電平識別錯誤,這會對系統(tǒng)的可靠性帶來很大影響。在測試設(shè)計時,需要對被測設(shè)備施加一種特殊的業(yè)務(wù)負(fù)荷,讓被測試總線出現(xiàn)大量的特定的信號跳變,即讓總線暴露在盡可能大的串?dāng)_條件下,并用示波器觀察個總線信號質(zhì)量是否可接受、監(jiān)控業(yè)務(wù)是否正常。以16位并行總線為例,為了將這種串?dāng)_影響極端化,設(shè)計測試報文時將16根信號中有15根線(即攻擊信號線Agressor)的跳變方向一致,即15根信號線都同時從0跳變到1,同時讓另一根被干擾的信號線(即Victim)從1下跳到0,讓16根線都要遍歷這個情況。
評論