超越“降額” 值得現(xiàn)代工程師參考的可靠性概念
超越“降額” 值得現(xiàn)代工程師參考的可靠性概念
“可靠性”這個詞匯對于不同的人士來說可能有著不同意義,但廣泛來講,底線往往在于成本。可靠性能夠滿足人的期望,它可能基于廣告宣傳、技術(shù)規(guī)格或合同,也可能與工程師以外的很多人士息息相關(guān)。例如在社會經(jīng)濟學的層面上,我們的生態(tài)系統(tǒng)以道德及倫理為基礎(chǔ)。雖然工程師必須遵守雇主定下的行為標準,但是從個人品德的立場而言,道德規(guī)范可能比經(jīng)濟效益更加重要。歷史常常告訴我們,任何文明都不能單憑經(jīng)濟基礎(chǔ)而持久。完整的可靠性概念才是關(guān)鍵所在。
隨著人們逐漸關(guān)注到產(chǎn)品制造和棄置對環(huán)境帶來的影響,消費者的目光也由最低采購成本轉(zhuǎn)移到最低擁有成本。無金錢或環(huán)境處罰而頻繁更換低質(zhì)量產(chǎn)品的年代已經(jīng)一去不復(fù)返。相反,講求可靠性的設(shè)計在今天的價值生態(tài)系統(tǒng)中變得尤為重要。
故障模式與機制
要達到令人滿意的可靠性,便需要對故障模式與機制有充分的理解。故障模式說明了一個零件如何失效,也就是造成故障的“應(yīng)力”。故障機制反映了零件的強度如何在不同的應(yīng)力下被減弱。透過故障模式分析,我們可以歸納出故障的成因,從而改善產(chǎn)品的可靠性;明白了故障的機制后,我們又懂得選擇合適的鑒定試驗去驗證某項應(yīng)用的可靠性。
故障模式的分類如下:
* 電氣性
* 災(zāi)難性(破壞性)
* 功能性 – 元件不能夠提供正確的輸出數(shù)據(jù)或信號
* 參量性 – 電流或電壓超出允許誤差
* 編程 – 非揮發(fā)性記憶體元件不能夠做出正常響應(yīng)
* 時序 – 例如由于傳播延遲、讀/寫時間、升降時間及建立時間不符合規(guī)格而造成故障
* 機械性 – 例如引線受損、封裝破裂、污染
* 外觀 – 例如標記難以辨認
* 行政管理 – 例如產(chǎn)品、數(shù)量、封裝、方向、日期和代碼出現(xiàn)錯誤
故障機制的分類如下:
* 物理故障
* 與時間有關(guān)的介質(zhì)擊穿
* 負偏壓溫度不穩(wěn)定
* 電子漂移
* 熱載流子注入
* 輻射故障 (反應(yīng)器、空間)
* 中子
* Beta粒子
* 伽馬
分析和預(yù)測
可用信息能夠估算出故障概率,卻無法提供實際故障數(shù)據(jù),這是實施可靠性工程的一大挑戰(zhàn)。一般來說,用上幾千小時去測試一個裝置的做法是不切實際的,所以我們通常無法得到一個元件或系統(tǒng)在實際壽命中的測試數(shù)據(jù)。新產(chǎn)品的可靠性數(shù)據(jù)往往等于零,然而這并不代表有關(guān)產(chǎn)品永遠不會出現(xiàn)故障。雖然以更高溫度加快壽命測試或許能提供恰如其分的實驗數(shù)據(jù),不過該實驗前提包括了活化能量恒久不變的假設(shè),而在實際情況下,它是電壓和溫度的一個函數(shù) (圖1)。這限制了加快的壽命測試在預(yù)測可靠性方面的準確度。因此,現(xiàn)場故障的監(jiān)察及反饋對提高產(chǎn)品可靠性的預(yù)測能力十分重要。
圖1
圖2
圖2顯示了在某時段內(nèi)的累積故障。這個概念在常用的產(chǎn)品故障曲線 (又稱浴盆曲線) 中得到進一步的展示 (圖3)。有關(guān)曲線包含3個清晰的區(qū)段,每個區(qū)段都包含了若干有可能造成故障的因素,也牽涉某些人士。他們可以因為某些行動而影響了客戶對可靠性的理解。
第1個區(qū)段描述了裝置的失敗率。只要在生產(chǎn)裝置中進行若干測試,就可以把故障率降低到一個在實際運行中可以接受的水平。第2個區(qū)段描述了實際工作壽命中有可能出現(xiàn)的隨機故障。它們與時間無關(guān),有關(guān)裝置也不會預(yù)先替換,一般都會在發(fā)生故障時才會被替換。第3個區(qū)段顯示了裝置的壽命接近終結(jié)而開始出現(xiàn)損耗。假如不加以替換,有一半產(chǎn)品都會在壽命中期開始失效。
圖3
可靠性組合
故障率 (可靠性的一種指標) 已不單單與電氣或熱應(yīng)力有關(guān),同時也與硬件、軟件/邏輯及傳輸媒體相互影響。降額是指在制造廠商針對環(huán)境或使用情況而定出的最大限制下對元件施加應(yīng)力的做法,而該做法已不再是加強可靠性的良方妙法。它只是在最廣泛的程度上有條不紊控制產(chǎn)品質(zhì)量的一種要素。
這方面的最大挑戰(zhàn),是只能夠在同一段時間內(nèi)一個元件降額;而且由于制造廠商的數(shù)據(jù)冊逐漸變成了只提供“最低定義”的責任文件,設(shè)計員必須在元件中內(nèi)置額外的緩沖 – 這不但增加了成本,還有可能降低產(chǎn)品的性能表現(xiàn)。
高可靠性產(chǎn)品 (軍事及宇航) 一般都會使用獨立鑒定的零件。不過,這樣不但增加了成本,也拖長了產(chǎn)品推出市場的時間。假如基于可靠性和質(zhì)量來設(shè)計產(chǎn)品,無疑是更經(jīng)濟實惠的方法。針對可靠性的設(shè)計必須對故障模式有充分了解,同時選擇成本最少的硬件冗余、軟件控制及傳輸媒體組合,從而達到甚至超越可靠性目標。產(chǎn)品鑒定包括了解故障機制,并且設(shè)計出一套完善的鑒定計劃,務(wù)求在限定的成本和時間內(nèi),對有關(guān)可靠性的預(yù)測作出精確的驗證。
針對可靠性的設(shè)計
可靠性設(shè)計是指通過平衡硬件、固件和軟件分配,務(wù)求以最低成本實現(xiàn)理想的可靠性表現(xiàn)。工程師應(yīng)該緊記,硬件的可靠性是在元件壽命終結(jié)時的一個時間函數(shù),軟件的可靠性則是一個成本函數(shù)。軟件一般都沒有耗損機制。
假如要以最少成本、在最短時間內(nèi)達到預(yù)期的可靠性目標,就必須充分利用設(shè)計分析、故障模擬和工程判斷的重要資料。強大的設(shè)計技術(shù)包括為易受損元件提供冗余,同時意識到每個元件的可靠性都與整體可靠性密不可分。合適的話,可以利用硬件或軟件把監(jiān)察與控制功能加入元件設(shè)計中,為元件提供周全的應(yīng)力保護。
靈巧的工程設(shè)計還會考慮到終端應(yīng)用環(huán)境的設(shè)計決定。比方說,一枚導(dǎo)彈與一臺洗衣機的設(shè)計需求顯然有著天壤之別。導(dǎo)彈要在短時間內(nèi)發(fā)揮強大的性能;相反,洗衣機卻需要針對數(shù)以百計的運行周期提供最完美的耐久性。兩者的需求在根本上截然不同。
可靠性的增長
圖4
如圖4所示,每個產(chǎn)品壽命周期都包含不同階段的轉(zhuǎn)變,由原型到開發(fā),再由開發(fā)到生產(chǎn),過程中的可靠性會不斷增長。換句話說,每項設(shè)計在其壽命周期中,可靠性都會增加,而成本則會下降。這反映了可靠性的增長不單是設(shè)計工程師的責任而已。
事實上,隨著可靠性在價值生態(tài)系統(tǒng)中的角色日趨重要,不論是從事技術(shù)、管理、物流或面向客戶的人員,都有責任讓可靠性持續(xù)增長 (圖5)。
圖5
評論