InsightFab
知識庫/事後比較(Post-hoc Test):Tukey vs Bonferroni 的選擇
統計分析6 分鐘閱讀

事後比較(Post-hoc Test):Tukey vs Bonferroni 的選擇

嘿,哥們!最近看到一篇超實用的文章,完全是解決你在產線會遇到的那種「到底是哪台機台出問題」的窘境。它講到當 CPK 報告出來,發現目標沒達到,老闆問是哪台機台出包時,如果你只會說「有差」,那就GG了。這時候你就需要學會「事後比較」(Post-hoc Test),讓你一眼看出到底是哪兩台機台有顯著差異,幫你精準抓出問題,讓產線能立刻處理!趕快讀這篇,以後保證不再被老闆問倒!

那天 CPK 報告出來,全場沉默了三秒,然後老闆問:「所以是哪台機台出包?」

那天下午,產線的 CPK 報告出來,全場都靜了三秒。報告顯示,我們某個關鍵製程的 CPK 值是 1.08,剛好壓線,但跟目標 1.33 差了一大截。老闆臉色一沉,直接問:「所以是哪台機台出包?是 A 機台、B 機台、還是 C 機台?」這時候,如果你只知道 ANOVA 的 P 值小於 0.05,然後就說「有差」,那根本是白搭。你得告訴老闆,到底哪兩台機台之間有顯著差異,才能讓產線去追問題。這時候,事後比較(Post-hoc Test)就派上用場了。

問題出在哪?不是有差就好,要抓出「是誰」有差

說穿了,ANOVA 只能告訴你「這些組別裡面,至少有一組跟其他組不同」。但它不會告訴你「是哪一組」或「哪幾組」不同。就像我們家裡有一堆小孩,你只知道其中一個考試不及格,但不知道是小明、小華還是小胖。事後比較,就是要把這些組別兩兩拿出來比對,找出真正有差異的組合。

所以重點是,你不能因為 ANOVA 跑出來 P 值小於 0.05,就直接去說 A 機台跟 B 機台有差,B 機台跟 C 機台有差。這樣做犯了「重複檢定」的問題。每次檢定都有型一錯誤(Alpha Error)的風險。你比的次數越多,這個犯錯的累積機率就越高,很容易把沒差異的說成有差異。

實際上怎麼做?Tukey 跟 Bonferroni 怎麼選

最常見的兩種事後比較方法,就是 Tukey 和 Bonferroni。

  1. Tukey (Tukey's HSD)
* 適用情境:當你的組別數目相等,而且你只想比較「所有可能組合」的時候。

* 優點:它會一次性調整所有比較組合的 P 值,控制整體型一錯誤的機率。它在檢定力(Power)上表現不錯,比較不容易漏掉真實的差異。

* 舉例:如果你的 A、B、C 三台機台,每台都跑了 300 片晶圓的數據。而且你關心的是 A vs B, A vs C, B vs C 這所有三種組合。這時候 Tukey 就是首選。

  1. Bonferroni
* 適用情境:當你「只」想比較特定的幾個組合,而不是所有組合的時候。或是你的組別數目不相等時。

* 優點:它非常保守,會把你的 Alpha 值(通常是 0.05)直接除以你比較的次數。這樣做能非常嚴格地控制型一錯誤。

* 舉例:承接上面的例子,假設你知道歷史數據顯示 C 機台的表現一直都最好,你只想比較 A vs C 和 B vs C 這兩組,看 A、B 是否能追上 C。這時候 Bonferroni 就能派上用場。如果你有 3 組,想比 2 次,那你的 P 值就必須小於 0.05 / 2 = 0.025 才算顯著。

換句話說,Tukey 像是一個「全面普查」的工具,而 Bonferroni 則是一個「精準打擊」的工具。

最常見的坑:看到 P 值就亂喊有差

坦白講,我剛進來那幾年也踩過這個坑。那時候有個新製程,DPMO 數據出來是 6210,比舊製程的 5800 差了一截。我們跑了 ANOVA,P 值是 0.038,小於 0.05。我興奮地跟老闆說:「新製程跟舊製程有顯著差異!」結果老闆問:「所以是哪個參數設定造成差異?」我當場傻眼,因為 ANOVA 根本沒說。

後來才知道,我應該要用事後比較。而且當時只關心新舊製程的差異,用 Bonferroni 就夠了。如果當時只比一次,P 值就要小於 0.05 才算有差。但是,如果我同時還想比較新製程不同 Batch 的差異,那我就會比不只一次,P 值判斷標準就得更嚴格。

今天能做的一件事

下次跑完 ANOVA,別急著下結論,多跑一步事後比較,找出誰才是真正的問題根源。

想試試看?

文章裡提到的分析工具在 InsightFab 都可以直接用,上傳 CSV 即可分析。

前往工具頁面

同類別文章

常態分配假設的檢定:Shapiro-Wilk vs Anderson-Darling

欸,跟你說,最近看到一篇超實用的文章!它在講以前工廠良率很差,結果 CPK 報告出來,數據根本對不上 DPMO,全場傻眼。讀完你會知道,原來很多統計指標像 CPK 都有個大前提,就是你的數據得符合「常態分配」才準。如果數據不是常態,那些算出來的數字根本是白搭!所以啊,下次做分析前,記得先用 Shapiro-Wilk 檢定一下,才不會鬧出烏龍喔!

統計檢定力(Power):如何確保結論有意義

嘿,跟你分享一篇很有趣的文章!作者那天興高采烈拿著CPK從1.08進步到1.25的數據給老闆看,結果老闆一句「你確定這樣有差?」讓他瞬間語塞。 這篇文章超實用,它點出我們工程師常犯的錯誤——光看數據有變就急著下結論,卻沒考慮到那可能是隨機波動或樣本不足。裡面會教你怎麼用「統計檢定力」來證明你的結論夠不夠穩,讓你下次報告時,面對老闆的質疑也能自信滿滿!讀完你會知道怎麼讓你的數據說服力更強喔!

信賴區間的正確解讀:95% CI 不是你想的那樣

嘿,最近看到一篇超實用的文章!它從一個大家在開會時都可能遇過的尷尬情境說起:CPK 報告出來,PM 盯著 1.08 的數據和旁邊的「95% CI: 0.95-1.21」,問這到底是好是壞?然後大家就靜默了。讀完你會知道,我們平常對信賴區間的理解,尤其那個「95% 的機率落在這個區間」根本是錯的!這篇文會教你信賴區間的正確解讀方式,讓你以後看報表不再一頭霧水,超推!