InsightFab
知識庫/Kruskal-Wallis 檢定:當 ANOVA 的前提不滿足時
6 Sigma6 分鐘閱讀

Kruskal-Wallis 檢定:當 ANOVA 的前提不滿足時

要比較三組以上的均值,ANOVA 是標準工具。但如果數據不符合常態分布、有離群值,或是順序尺度數據,Kruskal-Wallis 才是正確選擇。

情境

你想比較三個供應商的材料硬度是否有顯著差異。但 Anderson-Darling 常態性檢定顯示三組數據都不符合常態分布。ANOVA 的前提假設就是要求常態性,現在怎麼辦?

ANOVA 的前提假設

單因子 ANOVA 要求:

  1. 各組數據來自常態分布
  2. 各組變異數相等(同質性)
  3. 獨立樣本

如果前提不滿足,ANOVA 的 P 值可能不可靠。

Kruskal-Wallis 是什麼

Kruskal-Wallis 是 ANOVA 的無母數替代方案

核心做法:不比較原始數值,而是把所有數據合在一起排名次(Rank),再比較各組的平均名次是否有顯著差異。

因為只用排名,不用假設數據的分布形式。

什麼時候用 Kruskal-Wallis

情況建議
數據符合常態分布用 ANOVA(統計力更強)
數據明顯不符合常態用 Kruskal-Wallis
有嚴重離群值且不能移除用 Kruskal-Wallis
順序尺度(等級 1-5)用 Kruskal-Wallis
樣本數很小(n < 10)考慮 Kruskal-Wallis

結果解讀

H₀:所有組的中位數相同

H₁:至少有一組的中位數不同

  • P < 0.05:至少有一組有顯著差異,再做事後比較找出是哪兩組不同
  • P ≥ 0.05:沒有足夠證據說組間有差異

事後比較(Post-hoc)

Kruskal-Wallis 顯著後,用 Dunn's test 做兩兩比較(類似 ANOVA 後的 Tukey test),並調整多重比較的 P 值(Bonferroni 或 Benjamini-Hochberg 校正)。

無母數對照表

問題母數方法無母數替代
比較 2 組均值t-testMann-Whitney U
比較 3+ 組均值One-way ANOVAKruskal-Wallis
配對比較Paired t-testWilcoxon Signed-Rank
相關性Pearson rSpearman ρ

代價:統計力

無母數方法不需要假設分布,但代價是統計力(Power)較低——在相同樣本數下,比較難偵測到真實差異。數據符合常態時,ANOVA 更好用。

金句

「工具箱裡有 ANOVA 也要有 Kruskal-Wallis——不是每批數據都會配合你假設它符合常態分布。」

想試試看?

文章裡提到的分析工具在 InsightFab 都可以直接用,上傳 CSV 即可分析。

前往工具頁面