情境
產品開發完成,客戶問:「這個設備的 MTBF 是多少?」
你查了 MIL-HDBK-217,把所有元件的失效率加起來,算出 MTBF = 50,000 小時。
問題:這個數字用的是 1991 年的元件失效率數據,假設 55°C 操作溫度,而你的產品實際操作在 25°C 室內環境。這個 MTBF 預測值低估了你的真實可靠度。
可靠度預測需要理解方法,不是盲目查手冊。
系統可靠度的基本計算
串聯系統(Series)
所有元件都必須正常,系統才正常:
R_system = R1 × R2 × R3 × ... × Rn
例子:三個元件,各別可靠度 99%、98%、97%:
R_system = 0.99 × 0.98 × 0.97 = 0.941 = 94.1%
串聯系統的教訓: 元件越多,系統可靠度越低。每增加一個必要元件,系統可靠度就下降。
並聯系統(Parallel / 冗餘)
至少一個元件正常,系統就正常:
R_system = 1 - (1-R1)(1-R2)
例子:兩個同樣 90% 可靠度的電源供應器並聯:
R_system = 1 - (1-0.9)(1-0.9) = 1 - 0.01 = 0.99 = 99%
單個 90% 的元件,並聯後系統可靠度提升到 99%。冗餘設計的威力。
降額設計(Derating)
元件在低於額定規格的條件下運行,失效率大幅下降。
原則:
| 降額比例 | 可靠度提升 |
|---|---|
| 電壓降額 50% | 失效率可降低 10 倍以上 |
| 溫度每降低 10°C | 失效率約減半(Arrhenius 方程) |
| 功率降額 50% | 失效率降低 5-8 倍 |
實務上:在設計時留 30-50% 的降額空間,是提升可靠度最便宜的方法。
HALT:找到真實的失效模式
HALT(Highly Accelerated Life Testing,高度加速壽命測試)
用遠超過正常操作條件的應力(溫度衝擊、振動、電壓等)快速暴露潛在失效模式。
HALT 不是用來預測 MTBF,而是:
- 找到產品的「操作極限」和「破壞極限」
- 在量產前發現設計弱點
- 確認設計裕度是否足夠
HALT 測試後發現的失效,在工程樣品階段修正,成本是量產後召回的 1/100。
可靠度預測的正確姿態
預測是估計,不是保證:
- MIL-HDBK-217 等手冊的數據有時效性和適用範圍限制
- 元件品質、製造工藝、應用環境都會影響實際可靠度
- 現場數據(Demonstrated MTBF)永遠比預測值更可信
可靠度預測的主要用途:
- 設計方案比較(A 設計 vs B 設計哪個更可靠?)
- 找出系統最脆弱的環節(可靠度瓶頸)
- 給客戶的估計值(必須說明假設條件和不確定性)
金句
「可靠度預測給你一個起點,不是終點。真實世界裡,你的設計裕度、製程品質和客戶使用方式,才是決定實際可靠度的因素。把預測值當保證,是工程師最容易犯的誠信錯誤。」