那天 CPK 報告出來,全場沉默了三秒,然後老闆的臉就綠了
「X!怎麼又給我掛機?上次不是說換過零件了?!」凌晨兩點,我盯著產線傳來的警報,頭都快炸了。週末難得不用值班,結果一個緊急電話把我從夢鄉中拉回現實。原來是剛上線的某台新設備,它的關鍵製程參數又雙叒叕飄了,導致一批貨報廢。製程工程師氣到想砸機台,設備工程師臉色鐵青,而我,身為當初設備評估的「資深」代表,只能默默承受來自各方的壓力。會議上,老闆看著那慘不忍睹的 Cpk 1.08 報告,臉色比機台當機還難看。我知道,又到了要檢討「當初是怎麼評估設備」的時候了。
問題到底出在哪?FMEA 說穿了就是「超前部署」
說穿了,你我都知道,這種鳥事十之八九是因為「規劃不周」。我們常常在採購設備時,只看規格、看價格,卻忽略了「潛在的風險」。「FMEA」這個東西,全名是「失效模式與效應分析」,聽起來很學術,坦白講,它就是一份「超前部署清單」。想像一下,你買新車會不會考慮它未來可能會在哪裡壞掉?會不會擔心煞車失靈?引擎顧路?FMEA 做的就是這件事,它要你在設備還沒進廠前,甚至設計階段,就先預想所有可能出包的地方,然後想想看怎麼預防,怎麼降低這些風險。
所以重點是,FMEA 不是出事後拿來檢討的文件,而是讓你「先知先覺,避免後患」的工具。
實際上怎麼做?給它個數字,讓風險現形
我們半導體廠常用的 FMEA,通常會分成 DFMEA(設計 FMEA)和 PFMEA(製程 FMEA)。設備規劃時,我們會更著重在 DFMEA。
- 找出失效模式 (Failure Mode): 這台設備,它哪裡可能會壞?怎麼壞?會產生什麼不好的結果?例如:真空幫浦密封件老化導致漏氣、幫浦馬達過熱燒毀、腔體刮傷導致顆粒污染。
- 評估嚴重度 (Severity, S): 壞了之後,影響有多大?會不會導致報廢?停機?傷害人員?我們通常會給 1-10 分,10 分是災難級,比如「百萬級晶圓報廢」。
- 評估發生頻率 (Occurrence, O): 這件事發生的機率高不高?是三天兩頭出包,還是五年難得一見?一樣給 1-10 分,10 分是「高頻率發生」。
- 評估偵測度 (Detection, D): 如果真的發生了,我們能多快發現?有沒有即時警報?還是要等產品出問題才發現?1-10 分,10 分是「很難被發現」。
然後,把這三個分數乘起來,得到一個「風險優先係數 (RPN) = S x O x D」。我們的目標,就是找出 RPN 最高的那些點,然後想辦法降低它們。舉例來說,某個腔體刮傷導致顆粒污染,如果 S=9(高報廢風險)、O=7(發生機率高)、D=8(難以偵測),那 RPN 就是 9 x 7 x 8 = 504。看到這種數字,你就知道這絕對是要優先處理的鳥事了。
換句話說,RPN 就是把抽象的「風險」變成具體的數字,讓你一眼看出哪些地方最危險。
最常見的坑:把 FMEA 當成報告交差了事
我遇過最常見的坑,就是把 FMEA 當成一份「應付文件」。供應商為了交貨,隨便寫一寫,我們也隨便瞄一眼就簽字。結果呢?設備進來後,那些 FMEA 上面寫得好好的「預防措施」,根本沒落實。比如 FMEA 說「建議每半年更換一次關鍵耗材」,結果設備進廠後,為了省錢或怕停機,變成一年才換。然後,就等著掛機、報廢、老闆臉綠。
另一個坑是,FMEA 寫完就丟著,沒有定期檢討。產線環境、製程條件都在變,新的失效模式可能會出現,舊的風險也可能因為改進而降低。FMEA 是個活的文件,不是一次性的功課。
今天能做的一件事
打開你手邊的設備 FMEA,看看 RPN 最高的五個點,它們的預防措施真的有落實嗎?