InsightFab
知識庫/ANOVA 假設檢查:同質性、常態性、獨立性
統計分析6 分鐘閱讀

ANOVA 假設檢查:同質性、常態性、獨立性

嘿,你知道嗎?有時候我們做了一堆數據分析,結果卻被上司打槍,說你的分析根本是「屁」!這篇文就點出了我們常犯的錯誤,尤其是在用 ANOVA(變異數分析)的時候。它會像朋友一樣告訴你,為什麼你的 ANOVA 常常不準、沒說服力,還會提醒你 ANOVA 並不是萬能丹,它其實有自己的「脾氣」!讀完這篇,你會知道下次遇到類似狀況,該怎麼做才不會再被主管釘爆,讓你的分析真正「有用」。

那個下午,CPK 報告出來,主任的臉綠了

那天下午三點,良率會議室裡瀰漫著一股凝重的氣氛。最新的機台 #31 良率報告投影在牆上,Cpk 慘不忍睹,只有 1.08,DPMO 更直接飆到 6210。主任眉頭鎖得死緊,問:「這批貨是怎麼回事?跟前幾批差這麼多?」設備小陳支支吾吾地說:「我……我跑了 ANOVA,結果說有顯著差異啊!」主任冷哼一聲:「顯著差異?你假設檢查都做了嗎?同質性、常態性、獨立性,隨便一個沒過,你的 ANOVA 根本是屁!」會議室裡,頓時鴉雀無聲。說實話,小陳的窘境,你是不是也遇過?

你的 ANOVA 為什麼會「沒用」?

說穿了,ANOVA(變異數分析)是一種很強大的工具,可以幫你比較好幾個批次、好幾台機台、好幾種設定之間,是不是真的有「統計上的差異」。但它不是萬靈丹,它有自己的「脾氣」。如果你沒有先搞定它的「前置作業」——也就是假設檢查——那你的 ANOVA 結果,就算跑出來有 P 值,也可能根本是誤導,甚至得出完全錯誤的結論。你想想看,如果你用一個不準的尺去量東西,量出來的數字能信嗎?就是這個道理。

所以重點是,ANOVA 假設檢查有三大天王:常態性、同質性、獨立性。這三位老兄沒搞定,你的分析就得重新來過。

實際上,你該怎麼檢查?

  1. 常態性 (Normality):最常見也最直覺的。你的資料是不是呈現鐘形曲線?你可以用 Minitab 裡的「常態性檢定」或「機率圖」來看。如果點點都落在信賴區間裡面,通常就沒問題。如果你的 P 值小於 0.05(或你設定的顯著水準),那表示資料不符合常態分佈。舉例來說,你跑了 #31 機台的膜厚數據,結果常態性檢定的 P 值是 0.008,那就慘了,你的數據根本不是常態分佈。
  2. 變異數同質性 (Homogeneity of Variances):這個也超級重要。簡單講,就是你比較的幾組資料,它們的變異程度要差不多。你不能拿一個數據分散很廣的組,跟一個數據很集中的組一起比。在 Minitab 裡,你可以用「Levene's Test」或「Bartlett's Test」。如果 P 值小於 0.05,就代表變異數不齊。想像一下,你比三台機台的良率,#31 機台的良率穩定在 99%±0.1%,#32 機台卻在 98%~99.5%之間大起大落,這兩台的「穩定度」差這麼多,直接用 ANOVA 比平均值,意義就不大了。
  3. 獨立性 (Independence):這個最難用統計軟體直接檢定,但它非常關鍵。你的每一次量測,都不能受到前一次量測的影響。換句話說,你量測 #31 機台第一片晶圓的膜厚,不能影響到第二片晶圓的膜厚。如果你發現同一個操作員,連續測量時會習慣性地把數字「修飾」一下,那你的數據就沒有獨立性了。

我踩過最常見的坑

以前我剛進公司,有一次分析某個製程參數對產品可靠度的影響。跑完 ANOVA,P 值超小,興高采烈地跟主管報告「這參數影響很大!」結果被主管問:「你數據是不是從同一塊晶圓上,連續測了二十次?」我一聽,臉都綠了。沒錯,為了省時間,我讓測試工程師在同一塊晶圓上重複測量,這樣測出來的數據根本不是獨立的。後果就是,我的 ANOVA 結果完全不可信,所有結論都要推翻重來。浪費大家時間事小,萬一因此誤導決策,造成數百萬的損失,那可不是開玩笑的。

今天能做的一件事

下次跑 ANOVA 前,花五分鐘確認常態性跟同質性檢定的 P 值!

想試試看?

文章裡提到的分析工具在 InsightFab 都可以直接用,上傳 CSV 即可分析。

前往工具頁面

同類別文章

常態分配假設的檢定:Shapiro-Wilk vs Anderson-Darling

欸,跟你說,最近看到一篇超實用的文章!它在講以前工廠良率很差,結果 CPK 報告出來,數據根本對不上 DPMO,全場傻眼。讀完你會知道,原來很多統計指標像 CPK 都有個大前提,就是你的數據得符合「常態分配」才準。如果數據不是常態,那些算出來的數字根本是白搭!所以啊,下次做分析前,記得先用 Shapiro-Wilk 檢定一下,才不會鬧出烏龍喔!

統計檢定力(Power):如何確保結論有意義

嘿,跟你分享一篇很有趣的文章!作者那天興高采烈拿著CPK從1.08進步到1.25的數據給老闆看,結果老闆一句「你確定這樣有差?」讓他瞬間語塞。 這篇文章超實用,它點出我們工程師常犯的錯誤——光看數據有變就急著下結論,卻沒考慮到那可能是隨機波動或樣本不足。裡面會教你怎麼用「統計檢定力」來證明你的結論夠不夠穩,讓你下次報告時,面對老闆的質疑也能自信滿滿!讀完你會知道怎麼讓你的數據說服力更強喔!

信賴區間的正確解讀:95% CI 不是你想的那樣

嘿,最近看到一篇超實用的文章!它從一個大家在開會時都可能遇過的尷尬情境說起:CPK 報告出來,PM 盯著 1.08 的數據和旁邊的「95% CI: 0.95-1.21」,問這到底是好是壞?然後大家就靜默了。讀完你會知道,我們平常對信賴區間的理解,尤其那個「95% 的機率落在這個區間」根本是錯的!這篇文會教你信賴區間的正確解讀方式,讓你以後看報表不再一頭霧水,超推!