ANOVA 假設檢查：同質性、常態性、獨立性

那個下午，CPK 報告出來，主任的臉綠了

那天下午三點，良率會議室裡瀰漫著一股凝重的氣氛。最新的機台 #31 良率報告投影在牆上，Cpk 慘不忍睹，只有 1.08，DPMO 更直接飆到 6210。主任眉頭鎖得死緊，問：「這批貨是怎麼回事？跟前幾批差這麼多？」設備小陳支支吾吾地說：「我……我跑了 ANOVA，結果說有顯著差異啊！」主任冷哼一聲：「顯著差異？你假設檢查都做了嗎？同質性、常態性、獨立性，隨便一個沒過，你的 ANOVA 根本是屁！」會議室裡，頓時鴉雀無聲。說實話，小陳的窘境，你是不是也遇過？

你的 ANOVA 為什麼會「沒用」？

說穿了，ANOVA（變異數分析）是一種很強大的工具，可以幫你比較好幾個批次、好幾台機台、好幾種設定之間，是不是真的有「統計上的差異」。但它不是萬靈丹，它有自己的「脾氣」。如果你沒有先搞定它的「前置作業」——也就是假設檢查——那你的 ANOVA 結果，就算跑出來有 P 值，也可能根本是誤導，甚至得出完全錯誤的結論。你想想看，如果你用一個不準的尺去量東西，量出來的數字能信嗎？就是這個道理。

所以重點是，ANOVA 假設檢查有三大天王：常態性、同質性、獨立性。這三位老兄沒搞定，你的分析就得重新來過。

實際上，你該怎麼檢查？

常態性 (Normality)：最常見也最直覺的。你的資料是不是呈現鐘形曲線？你可以用 Minitab 裡的「常態性檢定」或「機率圖」來看。如果點點都落在信賴區間裡面，通常就沒問題。如果你的 P 值小於 0.05（或你設定的顯著水準），那表示資料不符合常態分佈。舉例來說，你跑了 #31 機台的膜厚數據，結果常態性檢定的 P 值是 0.008，那就慘了，你的數據根本不是常態分佈。
變異數同質性 (Homogeneity of Variances)：這個也超級重要。簡單講，就是你比較的幾組資料，它們的變異程度要差不多。你不能拿一個數據分散很廣的組，跟一個數據很集中的組一起比。在 Minitab 裡，你可以用「Levene's Test」或「Bartlett's Test」。如果 P 值小於 0.05，就代表變異數不齊。想像一下，你比三台機台的良率，#31 機台的良率穩定在 99%±0.1%，#32 機台卻在 98%~99.5%之間大起大落，這兩台的「穩定度」差這麼多，直接用 ANOVA 比平均值，意義就不大了。
獨立性 (Independence)：這個最難用統計軟體直接檢定，但它非常關鍵。你的每一次量測，都不能受到前一次量測的影響。換句話說，你量測 #31 機台第一片晶圓的膜厚，不能影響到第二片晶圓的膜厚。如果你發現同一個操作員，連續測量時會習慣性地把數字「修飾」一下，那你的數據就沒有獨立性了。

我踩過最常見的坑

以前我剛進公司，有一次分析某個製程參數對產品可靠度的影響。跑完 ANOVA，P 值超小，興高采烈地跟主管報告「這參數影響很大！」結果被主管問：「你數據是不是從同一塊晶圓上，連續測了二十次？」我一聽，臉都綠了。沒錯，為了省時間，我讓測試工程師在同一塊晶圓上重複測量，這樣測出來的數據根本不是獨立的。後果就是，我的 ANOVA 結果完全不可信，所有結論都要推翻重來。浪費大家時間事小，萬一因此誤導決策，造成數百萬的損失，那可不是開玩笑的。

今天能做的一件事

下次跑 ANOVA 前，花五分鐘確認常態性跟同質性檢定的 P 值！