InsightFab
知識庫/可靠度基礎:失效率、MTBF、可靠度函數的關係
可靠度6 分鐘閱讀

可靠度基礎:失效率、MTBF、可靠度函數的關係

嘿,這篇文章超實用!作者分享他被客戶問「產品能用多久」時的窘境,才發現可靠度不只是良率,更關乎產品在客戶手上能「活」多久。裡面用很生活化的例子,幫你搞懂失效率、MTBF 跟可靠度函數這些專有名詞,不再只會講 Cpk。讀完你會知道,客戶要的不是你的良率有多高,而是你的產品能穩定運作多久,不會在市場上被抱怨,真的受益良多!

那天,客戶問我的產品能活多久,我愣住了

還記得幾年前,我剛從製程轉做可靠度,第一次跟客戶開會。客戶是個老外,直接問我:「So, your chip, how long can it last in my device?」我當場傻眼,腦袋裡只剩下 Cpk 1.08、DPMO 6210 這些數字,但就是說不出一個「壽命」。那次會議後,我才意識到,可靠度不只是良率,它關乎你的產品在客戶手上能「活」多久。說穿了,客戶要的不是你的良率多高,而是你的產品能穩定運作多久,不會讓他在市場上被抱怨。

問題出在哪?失效率、MTBF 跟可靠度函數,你搞懂了嗎?

說到可靠度,很多人會直接想到「失效率」(Failure Rate),這沒錯,失效率就是產品在特定時間內壞掉的機率。打個比方,你買了一批新燈泡,如果這批燈泡在第一個小時內,有 1000 顆裡面壞了 1 顆,那它的失效率就是 1/1000 = 0.001 次/小時。這很直觀吧?

但光看失效率還不夠。很多時候,你會聽到 MTBF,也就是「平均失效間隔時間」(Mean Time Between Failures)。MTBF 其實就是失效率的倒數。如果你的失效率是 0.001 次/小時,那 MTBF 就是 1/0.001 = 1000 小時。所以重點是,MTBF 值越高,代表產品越耐用,壞掉的頻率越低。

那可靠度函數(Reliability Function)又是什麼?這就有趣了。它描述的是產品在「特定時間點之前」還能正常運作的機率。舉例來說,如果一個產品的可靠度函數在 1000 小時是 80%,就代表有 80% 的產品能活超過 1000 小時。所以,失效率告訴你「多常壞」,MTBF 告訴你「平均多久壞一次」,而可靠度函數則是直接告訴你「活多久的機率有多高」。這三者其實是一體兩面,互相有關聯。

實際上怎麼做?看懂浴缸曲線就對了

坦白講,要理解這些,最簡單就是看「浴缸曲線」(Bathtub Curve)。這曲線把產品壽命分成三個階段:

  1. 早期失效期(Infant Mortality Period): 產品剛出廠,有些批次會因為製程瑕疵或設計不良,很快就壞掉。這時候失效率高,但會隨著時間快速下降。就像剛出生的嬰兒,生病機率高,但度過危險期就好了。所以重點是,這階段的失效率,我們通常靠「燒機」(Burn-in)來篩選掉。
  2. 正常運作期(Useful Life Period): 產品進入穩定階段,失效率趨於平穩且低。這時候的失效率,就是你產品的「本質」失效率,也是我們最常用來計算 MTBF 的階段。例如,我們的晶片在正常操作下,DPMO 可以壓到 100 以下,這就是這個階段的表現。
  3. 耗損失效期(Wear-out Period): 產品用久了,零組件開始老化、磨損,失效率會漸漸上升。這就像人老了,身體機能會退化。所以重點是,這階段的失效率,主要受材料老化、疲勞等因素影響。

所以,當客戶問你產品能活多久,你不能只看一個數字。你要知道你的產品目前在哪個階段,以及那個階段的失效率是多少。

最常見的坑:拿錯失效率算 MTBF

我遇過最扯的,就是有人把早期失效的失效率,拿去套用在正常運作期的 MTBF 上。結果算出來的 MTBF 高到嚇死人,客戶聽了當然很高興,結果沒多久就收到一堆客訴,因為初期不良率太高了。說穿了,你不能把燒機階段篩掉的次品也算進去,然後說你的產品很耐用。

還有一個坑,就是只給一個 MTBF 值,卻沒有說明是在什麼環境條件下測的。產品在室溫下測得的 MTBF,跟在攝氏 85 度高濕環境下的 MTBF,絕對是天差地遠。這就像你不能只說一輛車很省油,卻不說是在市區還是高速公路開。

今天能做的一件事

回去看看你手上的產品規格書,有沒有明確定義失效率是在哪個壽命階段、什麼環境條件下測得的。

想試試看?

文章裡提到的分析工具在 InsightFab 都可以直接用,上傳 CSV 即可分析。

前往工具頁面