電子產(chǎn)品偶發(fā)故障很尷尬,工程師該咋辦?
工作中,不少朋友,幾乎每位工程師,都遇到過電子產(chǎn)品在用戶現(xiàn)場(chǎng)偶爾發(fā)生故障,如死機(jī)、復(fù)位、數(shù)據(jù)傳輸錯(cuò)誤等。維修工程師在現(xiàn)場(chǎng)跟蹤排查時(shí),故障又不會(huì)再現(xiàn),拿回實(shí)驗(yàn)室,怎么試驗(yàn)又都是好的。使人陷入一種無從下手的窘境。找到通用方法作為此類問題的解決思路,成了電子設(shè)計(jì)行業(yè)共同的問題。
本文引用地址:http://www.ex-cimer.com/article/201708/362971.htm自然科學(xué)領(lǐng)域的題目不容易解開的時(shí)候,束縛住了的思維難以突破,不妨跳出來,進(jìn)入到社會(huì)科學(xué)領(lǐng)域,通過哲學(xué)、通過思維方法論來找到突破口。朱清時(shí)說過“我通過化學(xué)科學(xué)的方法好不容易解決了一個(gè)問題,卻發(fā)現(xiàn)佛學(xué)早就在那個(gè)科學(xué)的頂峰等著我了”(本句話文責(zé)由朱清時(shí)老師負(fù)責(zé))。
那面對(duì)偶發(fā)故障的問題,一個(gè)解決它的方法論或許就是類聚原理。
在日常生活中,有一種說法叫“物以類聚,人以群分”,意指不是一類人不進(jìn)一家門。如果一個(gè)人很上進(jìn),跟他朋友圈里的親密朋友基本也差不多都是上進(jìn)類型的。因此推斷一個(gè)陌生人是否上進(jìn),看他周圍的朋友的狀態(tài)就可以了。如果他周圍的親密朋友都很成功了,那他即使現(xiàn)在不成功,離成功也不遠(yuǎn)了,起碼他的成功潛質(zhì)很大了。絕對(duì)的潛力股。如果是這樣一個(gè)相親對(duì)象,趕緊抓住他,絕對(duì)的低價(jià)原始股。
當(dāng)然,根據(jù)他的歷史推斷他的將來,也是有跡可循的,古人不是說“三歲看大,七歲看老”嘛,從他的現(xiàn)在看過去,從他的現(xiàn)在看未來,都是有一定道理的。雖然不敢肯定100%全對(duì),但基本差不到哪里去的。關(guān)鍵是您也不是暫時(shí)沒有別的辦法了解他更多嘛。也只好死馬當(dāng)活馬醫(yī)嘍,更何況這批馬沒死停當(dāng)呢,還有得救。
同理,一個(gè)電子產(chǎn)品,它偶爾才發(fā)生故障,那您以為它不發(fā)生故障的時(shí)候,就會(huì)完全正常嗎?表面裝得再若無其事,測(cè)謊器根據(jù)其生理狀態(tài)的波動(dòng),也是能發(fā)現(xiàn)蛛絲馬跡的異常的。測(cè)謊儀的測(cè)量指標(biāo)是人的生理參數(shù),那針對(duì)一臺(tái)曾經(jīng)發(fā)生過故障但現(xiàn)在正常的設(shè)備,測(cè)謊的指標(biāo)則是——波形。一是這臺(tái)設(shè)備正常工作時(shí)的波形質(zhì)量,就會(huì)有信號(hào)隱患的特征;二是同類設(shè)備也很可能會(huì)有信號(hào)波形或數(shù)據(jù)隱患能被測(cè)和分析出來。
有隱患的機(jī)器,即使從性能上看暫時(shí)都沒事,但其波形,也一定會(huì)有所偏差或波動(dòng)或異常,只不過波形變異暫未超出導(dǎo)致設(shè)備工作異常的參數(shù)范圍而已。我們?nèi)y(cè)隱患機(jī)器未發(fā)生故障時(shí)的工作波形,分析波形里隱藏的信息密碼,就可發(fā)現(xiàn)問題的隱患和緣由。如下列舉部分波形異?,F(xiàn)象及其所對(duì)應(yīng)的潛在隱患問題。
在講波形異常及隱患分析之前,得先說清楚一個(gè)專業(yè)名詞——電壓容限。這是信號(hào)異常與否的關(guān)鍵。
對(duì)于數(shù)字電路(如圖1),輸出器件的信號(hào)分別為高電平(用VoH表示)和低電平(用VoL表示),這兩個(gè)電平的電壓都是一個(gè)允許的電壓范圍,只要在VoH范圍內(nèi)的輸出電平,都認(rèn)為是合理可接受的高電平,只要是VoL范圍內(nèi)的輸出電平,都認(rèn)為是合理可接受的低電平。同理,接收端能接受的高、低電平也是一個(gè)范圍,分別為VIH和VIL,不同的是,VoH和VIH、VoL和VIL并不是相等的電平,而是有一個(gè)電位差Δ,這里的Δ就是電壓容限。
數(shù)字電路里,我們所研究的器件參數(shù)選型計(jì)算、EMC、SI等技術(shù)措施,都是為了讓從輸出端發(fā)送出的電平信號(hào),經(jīng)歷一系列的傳輸線纜衰減、空間輻射干擾耦合疊加、傳輸線信號(hào)反射、外界環(huán)境導(dǎo)致器件參數(shù)漂移、電源地線波動(dòng)引起相對(duì)電平變化等等問題后,接收端所接到的信號(hào)電平,相對(duì)于輸出端電平,都沒超過Δ的允許波動(dòng)范圍。滿足了這點(diǎn),即便是有些外來干擾破壞,電路仍能照常工作。
圖1 數(shù)字電路電壓容限示意圖
對(duì)于模擬電路,也有一個(gè)電路精度要求,即電壓容限值±Δ%(圖2),設(shè)計(jì)中所要控制的,就是在任何的波動(dòng)干擾下,模擬輸出量都不能超出±Δ%的范圍。
圖2 模擬電路電壓容限示意圖
基于以上的理論基礎(chǔ),下面列舉的就是常見的幾種波動(dòng)和作用機(jī)理了。
1、電源或地線的電平波動(dòng)厲害
VCC波動(dòng)低了,大部分時(shí)候并沒超出Vcc的允差范圍Vccmin,但在現(xiàn)場(chǎng)條件組合應(yīng)力嚴(yán)重的時(shí)候,一下子給弄超了就可能造成誤觸發(fā),刷寄存器或觸發(fā)不期望的功能。這時(shí)通過測(cè)量Vcc波形,就可能發(fā)現(xiàn)(如圖3)的波形,即使沒低到足以觸發(fā)問題的地步,但只要有類似癥狀,就有隱患,就必須在電源的穩(wěn)定上做文章了。必須確保電源的最大波動(dòng)范圍距離臨界值很遠(yuǎn)才把握。
圖3
地線波動(dòng)同理,可以通過測(cè)量地線上任意兩點(diǎn)之間的波形,正常情況應(yīng)該是一條基本接近于0V的平直線(如圖4中紅線),如果出現(xiàn)了向上的尖峰(圖4紅圈),則可能帶來風(fēng)險(xiǎn),因?yàn)榈鼐€上升,帶來的就是片選信號(hào)、reset信號(hào)等敏感信號(hào)的電位差下降,Vreset-Vgnd小于了某個(gè)臨界值,芯片就會(huì)當(dāng)成一個(gè)復(fù)位低電平輸入信號(hào)了。較常見的是給設(shè)備打+6000V靜電接觸放電時(shí),地電平上被耦合或傳導(dǎo)進(jìn)去,極易引起復(fù)位就是類似道理。
圖4
2、數(shù)據(jù)傳輸速率與傳輸線器件特性參數(shù)匹配不良導(dǎo)致波形變異
正常情況下,因?yàn)閿?shù)據(jù)線過長(zhǎng)、線間電容、接收端輸入電容較大、導(dǎo)線上串入電阻較大、接收端輸入端口防護(hù)器件結(jié)電容等的影響,會(huì)導(dǎo)致形成(圖5)里的上圖黑色波形。在速率比較低的時(shí)候,數(shù)據(jù)傳輸?shù)恼_率是能保證的。但當(dāng)軟件工程師不管不顧地加快數(shù)據(jù)傳輸速率時(shí),會(huì)導(dǎo)致上升沿還未沖到接收端的電壓容限值下端VHmin時(shí),就不得不因?yàn)橹芷趩栴}而走下坡路了,形成圖5上圖中的紅色波形部分,最高點(diǎn)低于了VHmin值,接收端自然就讀不到數(shù)據(jù)了。如果就是所有的都不正常了倒還好查找了,最擔(dān)心的是處于導(dǎo)致波形在正常與非正常之間的傳輸速率臨界點(diǎn),就可能在現(xiàn)場(chǎng)偶發(fā)傳輸數(shù)據(jù)錯(cuò)誤了??赡艿默F(xiàn)象是把導(dǎo)線剪短點(diǎn)、或換個(gè)小點(diǎn)的電阻值、或者拆掉個(gè)電容、或減少個(gè)終端,數(shù)據(jù)就會(huì)好了。
圖5
3、波形出現(xiàn)回勾
回勾的波形如(圖6),它的形成是因?yàn)閷?dǎo)線有高頻特性,可理解為小電感和小電阻的串聯(lián),而數(shù)字電路輸入端口,又可以理解成一個(gè)Pin-Gnd的對(duì)地電容,以及一個(gè)輸入跟隨器特性,走線的特性和器件的輸入等效特性合并在一起,就有了如圖6的電路特性圖。V4給出10MHz方波信號(hào),右圖上5點(diǎn)就可以測(cè)得接收左圖回勾變異波形。
本實(shí)例雖然有回勾,好在回勾部分在上升沿時(shí)并未穿越VHmin限值,下降沿時(shí)也未觸發(fā)VLmax限值,因此不至于引起信號(hào)質(zhì)量問題。但如果導(dǎo)線特性參數(shù)和器件輸入特征參數(shù)有變,導(dǎo)致回勾特性的上升沿上移了,或下降沿的回勾下降了,危險(xiǎn)豈不大哉?
圖6
按說寫到這里,這個(gè)類聚原理的道理應(yīng)該能說明白了。但是還有好幾個(gè)常見的類似波形質(zhì)量隱患問題,所以還是捺著性子寫下去吧…
4、波形出現(xiàn)臺(tái)階(圖7)
有時(shí),我們會(huì)測(cè)量到(圖7)或(圖8中間圖)中間平臺(tái)形狀的波形,這種是由容性負(fù)載與布線聯(lián)合作用引起的。這種波形的危害在于,有的接收器件,接收到信號(hào)后,判別上升沿的方式是通過對(duì)上升沿作微分,然后根據(jù)微分后的尖峰閾值判讀是否為上升沿。如果中間出現(xiàn)了平臺(tái),微分電路則會(huì)導(dǎo)致出現(xiàn)兩個(gè)有一點(diǎn)時(shí)間間隔的尖峰。如果兩個(gè)尖峰都很高,則會(huì)導(dǎo)致重復(fù)誤觸發(fā);如果都低,則會(huì)無觸發(fā);這兩種情況都導(dǎo)致錯(cuò)誤。
(圖8上圖)為源端輸出波形,是標(biāo)準(zhǔn)的方波;(圖8下圖)為導(dǎo)致(圖8中圖)平臺(tái)波形的電路結(jié)構(gòu)。該圖為仿真效果。
圖7
圖8
5、波形有過沖
波形里常有過沖現(xiàn)象,如(圖9)。如果振蕩幅度不夠大,不會(huì)經(jīng)過VHmin和VLmax的限值,則萬(wàn)事皆無。但如果振蕩的幅度超出了VHmin和VLmax的臨界值,則可能會(huì)產(chǎn)生誤觸發(fā),因?yàn)楹芏嘈酒且陨仙刂羞^VHmin的電平躍變做為上升沿觸發(fā)信號(hào),如果越界了,則有造成2次上升沿觸發(fā)的風(fēng)險(xiǎn)。
導(dǎo)致這條曲線特征的是信號(hào)線或地線的走線感性特性與線間電容、器件輸入電容、PN結(jié)電容等相互作用的結(jié)果。地線上的類似衰減性振蕩波動(dòng)術(shù)語(yǔ)叫“地彈”。
圖9
6、電壓跌落
電源線上有串電感或電容了,電源啟動(dòng)、負(fù)載啟停的瞬間,因?yàn)殡姼械姆聪螂妱?dòng)勢(shì)、容性負(fù)載大電流導(dǎo)致的電源瞬間塌陷,都會(huì)有電源瞬間跌落的風(fēng)險(xiǎn)。如(圖10)。這個(gè)波形在負(fù)載突然啟動(dòng)或突然掉點(diǎn)馬上又上電的時(shí)候可能會(huì)發(fā)生。如果幅度大了,掉電的時(shí)間長(zhǎng)了,極可能就有復(fù)位、刷E2存儲(chǔ)器、誤觸發(fā)等風(fēng)險(xiǎn)了。
圖10
以上描述了幾種常見的可能導(dǎo)致電路工作異常的變異波形,其故障作用機(jī)理理解了僅僅是改善的第一步,下一步還需要理解是什么設(shè)計(jì)問題導(dǎo)致了這些波形的產(chǎn)生,是哪些特性參數(shù)影響到了變異波形的哪個(gè)參數(shù)?通過設(shè)計(jì)改善哪一點(diǎn)才能使這些變異不再發(fā)生或不至于導(dǎo)致問題成為顯性故障?這些都是未來的文章里要討論的問題。
簡(jiǎn)單總結(jié):就是遇到偶發(fā)故障問題產(chǎn)品了,即使手頭沒有該故障產(chǎn)品,或者有也激發(fā)不出問題來的時(shí)候,您就找完全相同設(shè)計(jì)的產(chǎn)品,查找懷疑器件的信號(hào)波形,如果都是特標(biāo)準(zhǔn)的波形,那就先暫時(shí)放過,如果稍有異常,就把它記錄下來,隨后仔細(xì)分析這些異常如果再大一點(diǎn)的話,有沒有可能觸發(fā)現(xiàn)場(chǎng)的偶發(fā)故障,如果是,那就針對(duì)這個(gè)異常波形改進(jìn)設(shè)計(jì),改進(jìn)好了,讓它遠(yuǎn)離激發(fā)故障的電平臨界值了,偶發(fā)故障基本就很可能被根除了。這種原理就是類聚原理。由“一個(gè)大壞蛋的同伙至少一定也是個(gè)小壞蛋”的道理推演而來。
也許會(huì)有人問了,這么個(gè)有用的方法,這么有實(shí)際指導(dǎo)意義的原理,誰(shuí)發(fā)現(xiàn)的呢?告訴您吧,是我!那名字為什么起類聚原理而不是群分原理或其它的名字呢?嘿嘿,瞎起的!希望對(duì)您有用就好。
評(píng)論