InsightFab
知識庫/Levene 檢定:穩健的變異數齊性測試
統計分析6 分鐘閱讀

Levene 檢定:穩健的變異數齊性測試

嘿,跟你說!這篇文章超實用,它在講我們面對數據時,常常只看平均值,卻忽略了更重要的「變異數」!作者用他當年新製程 CPK 報告慘不忍睹的經驗開場,CPK 低到嚇人,大家嚇傻了。讀完你會知道,為什麼只看平均值會讓你錯失真正問題,以及變異數到底有多關鍵。下次遇到數據分析,就不會只傻傻盯著平均值啦!

那天 CPK 報告出來,全場沉默了三秒

還記得好幾年前,我們新製程剛導進產線,大家信心滿滿。結果第一次 CPK 報告出來,慘不忍睹,只有 1.08,DPMO 竟然飆到 6210。整個會議室瞬間安靜,連掉根針都聽得到。課長臉都綠了,直接問:「哪個站出問題?是平均值跑掉,還是變異數爆了?」大家面面相覷,因為那時候的統計工具,老實說,就那麼幾招,很多眉角都還沒摸清楚。

問題到底出在哪?

說白了,很多時候我們看數據,第一個想到的都是平均值有沒有飄。像我們量測 Wafer 厚度,幾百片量下來,平均值是 775um,你一看覺得沒問題,都在規格內。但如果有些機台的 Wafer 厚度很集中在 770um,有些卻散落在 760um 到 780um 之間,雖然平均值一樣,但後者的變異就大很多,不良品就容易跑出來。所以重點是,我們不只要看平均值,更要看變異數!

變異數就是資料分散程度的指標。兩個製程,就算平均值一樣,但如果其中一個製程的良率像雲霄飛車,忽高忽低,另一個像高速公路一樣平穩,你當然會選平穩的那個。那要怎麼知道不同組數據的變異數是不是「差不多」呢?這時候,我們就需要 Levene 檢定這個好幫手了。

實際上怎麼做?

Levene 檢定說穿了,就是在幫你回答一個問題:「這幾組數據的變異數是不是真的來自同一個母體?」或者說,「它們的變異數有沒有顯著差異?」

舉個例子,我們有三台機台 (A, B, C) 在做同樣的製程。我們想知道這三台機台產出的產品,厚度變異數是不是都一樣。

  1. 收集數據: 從每台機台隨機取樣 30 片 Wafer,測量厚度。
  2. 計算檢定統計量: 這部分通常是軟體幫你做。你只要把三組數據丟進 Minitab 或 R 裡面,選擇 Levene 檢定,它就會跑出一個 P 值 (p-value)。
  3. 判斷結果:
* 如果 P 值 大於 0.05 (這是一般常用的顯著水準 alpha),那麼我們就「無法拒絕虛無假設」。換句話說,我們認為這三台機台的變異數沒有顯著差異。大家都是好夥伴。

* 如果 P 值 小於 0.05,那麼我們就「拒絕虛無假設」。意思就是,至少有一台機台的變異數跟其他台有顯著差異。這時候,你就要進一步去找出是哪一台在搞鬼。

所以重點是,Levene 檢定會給你一個 P 值,你只要看它有沒有小於 0.05,就能判斷變異數是不是「齊性」的。

最常見的坑

我遇過最常見的坑,就是大家做完 Levene 檢定,發現 P 值很小,就急著衝去調機台參數。結果一調下去,問題沒解決,反而把原本正常的機台也搞亂了。

坦白講,Levene 檢定告訴你的是「有問題」,但沒告訴你「問題出在哪」。P 值小於 0.05,只代表變異數之間有差異,不代表變異數大的那個就一定是「壞的」。有時候,A 機台的變異數小到不行,B 機台雖然變異數比較大,但其實還在容許範圍內。結果你只看到差異,卻沒搞清楚是不是真的需要處理。

所以換句話說,當你發現變異數不齊性時,下一步應該是視覺化數據,例如畫個盒鬚圖 (Box Plot),看看哪組的散佈最廣,然後才針對那組數據進行更深入的分析,找出根本原因。不要一看到 P 值小就亂動!

今天能做的一件事

把你手邊的數據,用 Levene 檢定跑一下變異數齊性,看看 P 值是不是都乖乖的。

想試試看?

文章裡提到的分析工具在 InsightFab 都可以直接用,上傳 CSV 即可分析。

前往工具頁面

同類別文章

常態分配假設的檢定:Shapiro-Wilk vs Anderson-Darling

欸,跟你說,最近看到一篇超實用的文章!它在講以前工廠良率很差,結果 CPK 報告出來,數據根本對不上 DPMO,全場傻眼。讀完你會知道,原來很多統計指標像 CPK 都有個大前提,就是你的數據得符合「常態分配」才準。如果數據不是常態,那些算出來的數字根本是白搭!所以啊,下次做分析前,記得先用 Shapiro-Wilk 檢定一下,才不會鬧出烏龍喔!

統計檢定力(Power):如何確保結論有意義

嘿,跟你分享一篇很有趣的文章!作者那天興高采烈拿著CPK從1.08進步到1.25的數據給老闆看,結果老闆一句「你確定這樣有差?」讓他瞬間語塞。 這篇文章超實用,它點出我們工程師常犯的錯誤——光看數據有變就急著下結論,卻沒考慮到那可能是隨機波動或樣本不足。裡面會教你怎麼用「統計檢定力」來證明你的結論夠不夠穩,讓你下次報告時,面對老闆的質疑也能自信滿滿!讀完你會知道怎麼讓你的數據說服力更強喔!

信賴區間的正確解讀:95% CI 不是你想的那樣

嘿,最近看到一篇超實用的文章!它從一個大家在開會時都可能遇過的尷尬情境說起:CPK 報告出來,PM 盯著 1.08 的數據和旁邊的「95% CI: 0.95-1.21」,問這到底是好是壞?然後大家就靜默了。讀完你會知道,我們平常對信賴區間的理解,尤其那個「95% 的機率落在這個區間」根本是錯的!這篇文會教你信賴區間的正確解讀方式,讓你以後看報表不再一頭霧水,超推!