情境
你想比較三個供應商的材料硬度是否有顯著差異。但 Anderson-Darling 常態性檢定顯示三組數據都不符合常態分布。ANOVA 的前提假設就是要求常態性,現在怎麼辦?
ANOVA 的前提假設
單因子 ANOVA 要求:
- 各組數據來自常態分布
- 各組變異數相等(同質性)
- 獨立樣本
如果前提不滿足,ANOVA 的 P 值可能不可靠。
Kruskal-Wallis 是什麼
Kruskal-Wallis 是 ANOVA 的無母數替代方案。
核心做法:不比較原始數值,而是把所有數據合在一起排名次(Rank),再比較各組的平均名次是否有顯著差異。
因為只用排名,不用假設數據的分布形式。
什麼時候用 Kruskal-Wallis
| 情況 | 建議 |
|---|---|
| 數據符合常態分布 | 用 ANOVA(統計力更強) |
| 數據明顯不符合常態 | 用 Kruskal-Wallis |
| 有嚴重離群值且不能移除 | 用 Kruskal-Wallis |
| 順序尺度(等級 1-5) | 用 Kruskal-Wallis |
| 樣本數很小(n < 10) | 考慮 Kruskal-Wallis |
結果解讀
H₀:所有組的中位數相同
H₁:至少有一組的中位數不同
- P < 0.05:至少有一組有顯著差異,再做事後比較找出是哪兩組不同
- P ≥ 0.05:沒有足夠證據說組間有差異
事後比較(Post-hoc)
Kruskal-Wallis 顯著後,用 Dunn's test 做兩兩比較(類似 ANOVA 後的 Tukey test),並調整多重比較的 P 值(Bonferroni 或 Benjamini-Hochberg 校正)。
無母數對照表
| 問題 | 母數方法 | 無母數替代 |
|---|---|---|
| 比較 2 組均值 | t-test | Mann-Whitney U |
| 比較 3+ 組均值 | One-way ANOVA | Kruskal-Wallis |
| 配對比較 | Paired t-test | Wilcoxon Signed-Rank |
| 相關性 | Pearson r | Spearman ρ |
代價:統計力
無母數方法不需要假設分布,但代價是統計力(Power)較低——在相同樣本數下,比較難偵測到真實差異。數據符合常態時,ANOVA 更好用。
金句
「工具箱裡有 ANOVA 也要有 Kruskal-Wallis——不是每批數據都會配合你假設它符合常態分布。」