Chi-squared 檢定：計數數據的假設檢定

情境

你有三條生產線，想知道各線的不良率是否有顯著差異。A 線 200 件中有 8 件不良，B 線 200 件中有 14 件不良，C 線 200 件中有 6 件不良。用 t-test？不行，這是計數數據，不是連續數據。

Chi-squared（χ²）檢定用於分析類別數據（Count Data）之間的關係，回答的問題是：

「觀察到的數據分布，和預期的分布有顯著差異嗎？」

三種主要用法：

問題： 數據的分布符合預期的比例嗎？

例子： 產品有 A、B、C 三個等級，理論比例應為 50%:30%:20%。實際生產了 200 件，比例是否符合？

H₀： 實際分布符合預期比例

H₁： 實際分布不符合預期比例

問題： 兩個類別變數之間有關聯嗎？

例子： 不良類型（尺寸超差、外觀不良、功能異常）和生產班別（早班、晚班）有關係嗎？

製作列聯表（Contingency Table）：

H₀： 不良類型和班別無關

H₁： 不良類型和班別有關

問題： 多個群組的類別分布相同嗎？

例子： 三條生產線的不良率是否相同？（就是上面情境的問題）

條件	說明
每格期望次數 ≥ 5	若不滿足，合併類別或用 Fisher's exact test
獨立樣本	同一個樣本不能出現在多個格子
類別數據	不適用於連續數據（用 t-test 或 ANOVA）

「當你的數據是在數件數，不是在量尺寸，Chi-squared 就是你的工具。」