Levene 檢定：穩健的變異數齊性測試

那天 CPK 報告出來，全場沉默了三秒

還記得好幾年前，我們新製程剛導進產線，大家信心滿滿。結果第一次 CPK 報告出來，慘不忍睹，只有 1.08，DPMO 竟然飆到 6210。整個會議室瞬間安靜，連掉根針都聽得到。課長臉都綠了，直接問：「哪個站出問題？是平均值跑掉，還是變異數爆了？」大家面面相覷，因為那時候的統計工具，老實說，就那麼幾招，很多眉角都還沒摸清楚。

問題到底出在哪？

說白了，很多時候我們看數據，第一個想到的都是平均值有沒有飄。像我們量測 Wafer 厚度，幾百片量下來，平均值是 775um，你一看覺得沒問題，都在規格內。但如果有些機台的 Wafer 厚度很集中在 770um，有些卻散落在 760um 到 780um 之間，雖然平均值一樣，但後者的變異就大很多，不良品就容易跑出來。所以重點是，我們不只要看平均值，更要看變異數！

變異數就是資料分散程度的指標。兩個製程，就算平均值一樣，但如果其中一個製程的良率像雲霄飛車，忽高忽低，另一個像高速公路一樣平穩，你當然會選平穩的那個。那要怎麼知道不同組數據的變異數是不是「差不多」呢？這時候，我們就需要 Levene 檢定這個好幫手了。

實際上怎麼做？

Levene 檢定說穿了，就是在幫你回答一個問題：「這幾組數據的變異數是不是真的來自同一個母體？」或者說，「它們的變異數有沒有顯著差異？」

舉個例子，我們有三台機台 (A, B, C) 在做同樣的製程。我們想知道這三台機台產出的產品，厚度變異數是不是都一樣。

收集數據： 從每台機台隨機取樣 30 片 Wafer，測量厚度。
計算檢定統計量： 這部分通常是軟體幫你做。你只要把三組數據丟進 Minitab 或 R 裡面，選擇 Levene 檢定，它就會跑出一個 P 值 (p-value)。
判斷結果：

* 如果 P 值大於 0.05 (這是一般常用的顯著水準 alpha)，那麼我們就「無法拒絕虛無假設」。換句話說，我們認為這三台機台的變異數沒有顯著差異。大家都是好夥伴。

* 如果 P 值小於 0.05，那麼我們就「拒絕虛無假設」。意思就是，至少有一台機台的變異數跟其他台有顯著差異。這時候，你就要進一步去找出是哪一台在搞鬼。

所以重點是，Levene 檢定會給你一個 P 值，你只要看它有沒有小於 0.05，就能判斷變異數是不是「齊性」的。

最常見的坑

我遇過最常見的坑，就是大家做完 Levene 檢定，發現 P 值很小，就急著衝去調機台參數。結果一調下去，問題沒解決，反而把原本正常的機台也搞亂了。

坦白講，Levene 檢定告訴你的是「有問題」，但沒告訴你「問題出在哪」。P 值小於 0.05，只代表變異數之間有差異，不代表變異數大的那個就一定是「壞的」。有時候，A 機台的變異數小到不行，B 機台雖然變異數比較大，但其實還在容許範圍內。結果你只看到差異，卻沒搞清楚是不是真的需要處理。

所以換句話說，當你發現變異數不齊性時，下一步應該是視覺化數據，例如畫個盒鬚圖 (Box Plot)，看看哪組的散佈最廣，然後才針對那組數據進行更深入的分析，找出根本原因。不要一看到 P 值小就亂動！

今天能做的一件事

把你手邊的數據，用 Levene 檢定跑一下變異數齊性，看看 P 值是不是都乖乖的。