那天 CPK 報告出來,全場沉默了三秒
還記得好幾年前,我們新製程剛導進產線,大家信心滿滿。結果第一次 CPK 報告出來,慘不忍睹,只有 1.08,DPMO 竟然飆到 6210。整個會議室瞬間安靜,連掉根針都聽得到。課長臉都綠了,直接問:「哪個站出問題?是平均值跑掉,還是變異數爆了?」大家面面相覷,因為那時候的統計工具,老實說,就那麼幾招,很多眉角都還沒摸清楚。
問題到底出在哪?
說白了,很多時候我們看數據,第一個想到的都是平均值有沒有飄。像我們量測 Wafer 厚度,幾百片量下來,平均值是 775um,你一看覺得沒問題,都在規格內。但如果有些機台的 Wafer 厚度很集中在 770um,有些卻散落在 760um 到 780um 之間,雖然平均值一樣,但後者的變異就大很多,不良品就容易跑出來。所以重點是,我們不只要看平均值,更要看變異數!
變異數就是資料分散程度的指標。兩個製程,就算平均值一樣,但如果其中一個製程的良率像雲霄飛車,忽高忽低,另一個像高速公路一樣平穩,你當然會選平穩的那個。那要怎麼知道不同組數據的變異數是不是「差不多」呢?這時候,我們就需要 Levene 檢定這個好幫手了。
實際上怎麼做?
Levene 檢定說穿了,就是在幫你回答一個問題:「這幾組數據的變異數是不是真的來自同一個母體?」或者說,「它們的變異數有沒有顯著差異?」
舉個例子,我們有三台機台 (A, B, C) 在做同樣的製程。我們想知道這三台機台產出的產品,厚度變異數是不是都一樣。
- 收集數據: 從每台機台隨機取樣 30 片 Wafer,測量厚度。
- 計算檢定統計量: 這部分通常是軟體幫你做。你只要把三組數據丟進 Minitab 或 R 裡面,選擇 Levene 檢定,它就會跑出一個 P 值 (p-value)。
- 判斷結果:
* 如果 P 值 小於 0.05,那麼我們就「拒絕虛無假設」。意思就是,至少有一台機台的變異數跟其他台有顯著差異。這時候,你就要進一步去找出是哪一台在搞鬼。
所以重點是,Levene 檢定會給你一個 P 值,你只要看它有沒有小於 0.05,就能判斷變異數是不是「齊性」的。
最常見的坑
我遇過最常見的坑,就是大家做完 Levene 檢定,發現 P 值很小,就急著衝去調機台參數。結果一調下去,問題沒解決,反而把原本正常的機台也搞亂了。
坦白講,Levene 檢定告訴你的是「有問題」,但沒告訴你「問題出在哪」。P 值小於 0.05,只代表變異數之間有差異,不代表變異數大的那個就一定是「壞的」。有時候,A 機台的變異數小到不行,B 機台雖然變異數比較大,但其實還在容許範圍內。結果你只看到差異,卻沒搞清楚是不是真的需要處理。
所以換句話說,當你發現變異數不齊性時,下一步應該是視覺化數據,例如畫個盒鬚圖 (Box Plot),看看哪組的散佈最廣,然後才針對那組數據進行更深入的分析,找出根本原因。不要一看到 P 值小就亂動!
今天能做的一件事
把你手邊的數據,用 Levene 檢定跑一下變異數齊性,看看 P 值是不是都乖乖的。