那天,量產線 CPK 掉到 1.08,全場都靜了三秒
還記得好幾年前,我們產線剛從試產轉量產不久,有次我盯著 SPC 報表,突然看到一個機台的關鍵尺寸 CPK 值從原本的 1.3 左右,掉到剩 1.08。你知道的,量產初期,這數字一出來,全場都靜了三秒。PM 臉都綠了,老闆娘的奪命連環叩也在路上了。當下我只覺得頭皮發麻,心想:「完了,這下鐵定要進追貨模式了。」但仔細一看,SPC 管制圖上點位明明都在管制線內,沒有任何失控的訊號啊!怎麼會這樣?後來才發現,原來是我們把 Phase I 跟 Phase II 的 SPC 概念搞混了。
問題出在哪?你的產品目標到底是什麼?
說穿了,SPC 其實有兩個階段,Phase I 跟 Phase II,它們的目標完全不一樣。坦白講,很多人會誤把 Phase II 的管制界線拿來套用在 Phase I 的資料上,就很容易發生我上面說的狀況。
Phase I 簡單來說,就是「驗明正身」的階段。這時候你的產品可能還在 R&D、試產階段,甚至只是個 prototype。你的目的是找出製程的最佳參數、最穩定的條件,讓產品能達到設計規格。所以這時候的管制界線,通常是用「設計目標」去設定,或是用一批「最好的資料」來建立。你關心的是製程有沒有能力達到你的設計要求。舉個例子,如果你的目標是 DPMO 要低於 5000,那 Phase I 的 SPC 就是要幫你確認,在目前這個製程條件下,你能否真的做到。
而 Phase II 呢,就是「看家顧門」的階段。這時候產品已經量產了,製程參數也都固定了。你的目的變成監控製程,確保它沒有偏離你 Phase I 時「驗明正身」的最佳狀態。這時候的管制界線,是用「歷史資料」或「已建立的製程能力」去算的。你關心的是製程有沒有異常變動,會不會偏離已經確認的好狀態。
所以重點是,Phase I 在建立「能力」,Phase II 在監控「穩定」。
實際上怎麼做?
我們一般在公司常用的,其實大部分是 Phase II 的 SPC。也就是說,當你拿到一份新的製程數據,你要判斷它有沒有異常,通常是拿去跟「過去穩定表現」的管制界線去比較。
舉個例,如果我們過去在 Phase I 階段,花了三個月把一個關鍵製程的平均值穩定在 50.0 um,標準差是 0.5 um。那麼 Phase II 的管制界線,就會用這個平均值和標準差去計算。比如說,上下管制界線可能是 50.0 ± 3*0.5 = 48.5 um 到 51.5 um。這時候,只要新的量測數據點落在 48.5 到 51.5 之間,我們就認為製程是「在管制內」的。
但如果你還在 Phase I,你可能根本沒有穩定的歷史數據。這時候,你可能會直接拿設計規格的上下限去建立初步的管制界線,或是用一批「最理想的試跑數據」來建立。比如說,設計規格要求 50.0 ± 2 um,那麼你的 Phase I 管制界線可能就是 48.0 um 到 52.0 um。你是在嘗試讓製程穩定落入這個範圍。
所以,判斷自己現在是用哪個階段的 SPC,最簡單就是問自己:「我現在是在『找出最佳製程』,還是『維持最佳製程』?」
最常見的坑:拿 Phase I 的資料去套 Phase II 的管制界線
我前面那個 CPK 掉到 1.08 的鳥事,就是最好的例子。那時候我們是用 Phase I 階段,也就是試產階段的數據,去算出管制界線。結果量產後,因為機台、材料、操作員等等變數都還在磨合,製程的穩定度其實比 Phase I 時差一點點,導致平均值和標準差稍微有點漂移。
雖然漂移的幅度不大,數據點都還在我們 Phase I 時「算出來」的管制界線內,所以 SPC 管制圖上看起來很正常,沒有失控。但是當我們拿這些「稍微漂移」的數據去算 CPK 時,就發現 CPK 已經掉到 1.08 了。這時候才警覺,Phase I 的管制界線已經不適用了!因為製程能力已經變了,我們需要重新計算 Phase II 的管制界線,才能真正監控到製程的異常。
換句話說,如果你的製程能力已經提升了,你還用舊的管制界線,那你的管制圖就會變得「太寬鬆」,很多異常你根本抓不到。反之,如果你的製程能力變差了,你卻還用以前「很完美」的管制界線,那你的管制圖就會「太敏感」,常常誤判為異常,讓你疲於奔命。這兩種情況都是在自己找麻煩。
今天能做的一件事
回去檢查你手上的 SPC 管制圖,問問自己:「這張圖的管制界線,是用什麼階段的資料算出來的?」