那天設備一直跳機,老闆卻問我 MTBF 怎麼算
你們有沒有遇過這種鳥事?產線上一台新機台,剛裝機沒多久,就開始三天兩頭給我跳機。每次設備一停,產線就開始靠北,PM 也來問說到底什麼時候好。我被釘到爆,只好跟老闆報告說,看來 MTBF 表現不佳,可能要考慮退貨。結果老闆眉頭一皺,問我:「你說 MTBF 表現不佳,那這個 MTBF 是怎麼算出來的?用指數分配還是 Weibull 分配?這兩種差在哪?」媽的,我心想,老子被機台搞到焦頭爛額,你卻問我這個?但說實話,這問題問得好,因為這兩種分配,真的會影響你對機台「壽命」的判斷。
問題出在哪:指數分配 vs. Weibull 分配,差在哪?
說穿了,這兩種分配都在幫我們預測機台什麼時候會壞,也就是「可靠度」的數學模型。
- 指數分配 (Exponential Distribution):這個最簡單,假設機台的「故障率」是常數,不隨時間改變。換句話說,它今天壞跟明天壞的機率是一樣的,不會因為用久了就比較容易壞。這種通常適用於那些「隨機故障」的零件,像是電子元件,突然就燒掉了,跟你用了多久沒關係。所以,如果你算出來的 MTBF 是 1000 小時,代表這台機台每 1000 小時會壞一次,而且每次壞掉後,下一次壞掉的機率還是一樣。
- Weibull 分配 (Weibull Distribution):這個就比較高竿了,它考慮到故障率會隨時間改變。有些機台是「磨損型」的,用越久越容易壞;有些則有「早期失效」問題,剛開始容易壞,度過磨合期後反而穩定。Weibull 分配就是用一個叫做「形狀參數 (Beta)」的東西來描述這種變化。
* 如果 Beta = 1,恭喜你,它跟指數分配一樣,故障率是常數。
* 如果 Beta > 1,這才是我們最常遇到的,機台會隨時間老化磨損,用越久越容易壞。
所以重點是,指數分配只能描述「隨機故障」,Weibull 分配則能描述「早期失效、隨機故障、磨損老化」這三種狀況。
實際上怎麼做:怎麼選擇?
坦白講,選哪種分配,要看你的機台「實際故障模式」是什麼。
- 先跑 Weibull 分配,看 Beta 值:通常我會建議你先用收集到的故障時間數據,去跑一下 Weibull 分析。很多統計軟體都有這個功能,你只要把每次機台故障到修復(或更換)的時間點記錄下來,丟進去跑一下。
* 但如果 Beta 值明顯偏離 1.0,例如 0.6 或是 2.5,那你就非用 Weibull 分配不可了。這表示你的機台有特殊的故障模式,用指數分配會誤導你。
- 舉個例子:假設你有一批新機台,試運轉 1000 小時,壞了 5 次。如果你直接用指數分配,MTBF 大概是 1000/5 = 200 小時。但如果你去跑 Weibull,發現 Beta 值是 0.7(早期失效),那表示你這批機台在初期故障率很高,但撐過去之後,故障率會下降。如果只看那個 200 小時,你可能會錯過優化的機會。反之,如果 Beta 值是 2.0(磨損老化),那代表機台會越用越容易壞,這個 200 小時的 MTBF 在後期會越來越不準,你會需要提早規劃預防性維護。
最常見的坑:數字會說謊
我以前剛出社會的時候,有次老闆叫我評估一台機台的可靠度。我收集了數據,直接用 Excel 算平均值,然後跟老闆說 MTBF 是 500 小時。結果老闆拿去跟供應商談,供應商一臉疑惑,說他們內部用 Weibull 算出來的 MTBF 根本不是這個數字。後來我才知道,那台機台的關鍵零件是個耗材,Beta 值高達 2.5,典型的磨損老化型。我用指數分配去算,根本沒考慮到它越用越容易壞的特性,給出的數字自然就不準。那次老闆雖然沒罵我,但我也學到了一課:如果你對機台的故障模式沒有基本認知,只單純套用公式,很容易踩到這種坑,讓你的數據報告失去說服力。
今天能做的一件事
把你手邊的故障數據,用 Weibull 分配跑跑看 Beta 值。