那天 CPK 報告出來,全場沉默了三秒,老闆的臉綠了
還記得嗎?大概是五年前,我們廠裡那個新導入的氮化鎵功率元件專案,剛量產沒多久。某天下午,Reliability Manager 突然衝進會議室,臉色發白,手上拿著一份報告。他把報告往桌上一丟,上面斗大的紅字寫著:系統級 MTBF 只有 5 萬小時。全場靜默了三秒,接著老闆的臉直接綠掉,因為當初跟客戶承諾的是 10 萬小時。會議室裡立刻吵成一團,每個人都開始說:「我的模組沒問題啊!」「我這邊的良率 Cpk 1.08 耶!」但問題是,系統整體就是不達標,那到底要找誰負責?
問題出在哪?不是單一元件的問題,是「整體」的問題
說穿了,這個情境就是典型的「可靠度分配(Reliability Apportionment)」問題。坦白講,很多時候我們工程師只顧著把自己的元件或模組做到最好,覺得我的 Cpk 有 1.33、我的 DPMO 只有 50,那就天下太平。但你知道嗎?一個複雜的系統,是由成千上萬個元件組成的。就算每個元件的可靠度都「還不錯」,加在一起,系統的整體可靠度可能就會讓你大跌眼鏡。
所以重點是,可靠度分配就是一套方法,讓你把一個「系統級」的可靠度目標,合理地拆解、分配到每一個「子系統」或「元件」上。這樣大家才知道,自己部門的目標到底是多少,而不是盲目地說「我盡力就好」。這就像是公司訂下全年營收目標,然後再拆解到每個事業單位、每個產品線一樣。
實際上怎麼做?從系統目標倒推回去
實際操作上,我們通常是從客戶或市場給的「系統目標」開始倒推。比如說,客戶要求你的電源供應器系統 MTBF 至少要 10 萬小時。這時候,你不能直接跟所有部門說「大家把 MTBF 都做到 10 萬小時」,這不切實際,而且有些元件天生就比較容易壞。
你可以這樣做:
- 畫出系統架構圖: 把你的整個系統拆解成幾個主要子系統,然後再往下拆到關鍵元件。這個圖要清楚,像方塊圖那樣。
- 設定每個元件的重要性與複雜度: 有些元件是核心功能,壞了系統直接掛掉;有些只是輔助,影響不大。有些元件複雜度高,成本也高,維修困難。這些都要考慮進去。
- 選擇分配方法: 常用的有「等比分配」、「加權分配」或「Mendel-Grodsky 法」等等。說實話,我們廠裡最常用的是修改過的加權分配法,根據元件的故障率、複雜度、維修成本等因素,給予不同的權重。
* 主控板可能因為元件數量多、訊號複雜,風險權重設定 0.4。
* 功率模組因為承受高電壓、高電流,是故障熱點,權重設定 0.5。
* 散熱模組相對單純,權重設定 0.1。
* 這時候,主控板的目標 MTBF 就會比散熱模組嚴苛很多,可能要達到 25 萬小時,而散熱模組只要 100 萬小時(這只是舉例,實際計算會更複雜)。
換句話說,你必須讓那些「更容易壞」或「影響更大」的元件,承擔更嚴格的可靠度要求。
最常見的坑:數字「拍腦袋」跟「沒人認領」
我們踩過最大的坑,就是分配數字用「拍腦袋」的。有時候為了趕時間,或者根本沒人懂可靠度分配,就隨便抓幾個數字給各部門。結果就是,有些部門覺得目標太高,根本做不到;有些部門覺得太低,輕鬆達標,但其實還有提升空間,反而拖累了整體。
另一個大坑就是「沒人認領」。Reliability Manager 把數字分下去,但各部門主管覺得這不是我的事,或者覺得這個目標不合理,直接不甩。結果就是,等到系統測試出來不及格,大家才又開始推卸責任。可靠度分配不是 Reliabilty 部門自己的事,是需要全員參與的。
今天能做的一件事
回去看看你手邊的產品,先試著畫出一個簡單的系統架構圖。