那個下午,CPK 報告出來,主任的臉綠了
那天下午三點,良率會議室裡瀰漫著一股凝重的氣氛。最新的機台 #31 良率報告投影在牆上,Cpk 慘不忍睹,只有 1.08,DPMO 更直接飆到 6210。主任眉頭鎖得死緊,問:「這批貨是怎麼回事?跟前幾批差這麼多?」設備小陳支支吾吾地說:「我……我跑了 ANOVA,結果說有顯著差異啊!」主任冷哼一聲:「顯著差異?你假設檢查都做了嗎?同質性、常態性、獨立性,隨便一個沒過,你的 ANOVA 根本是屁!」會議室裡,頓時鴉雀無聲。說實話,小陳的窘境,你是不是也遇過?
你的 ANOVA 為什麼會「沒用」?
說穿了,ANOVA(變異數分析)是一種很強大的工具,可以幫你比較好幾個批次、好幾台機台、好幾種設定之間,是不是真的有「統計上的差異」。但它不是萬靈丹,它有自己的「脾氣」。如果你沒有先搞定它的「前置作業」——也就是假設檢查——那你的 ANOVA 結果,就算跑出來有 P 值,也可能根本是誤導,甚至得出完全錯誤的結論。你想想看,如果你用一個不準的尺去量東西,量出來的數字能信嗎?就是這個道理。
所以重點是,ANOVA 假設檢查有三大天王:常態性、同質性、獨立性。這三位老兄沒搞定,你的分析就得重新來過。
實際上,你該怎麼檢查?
- 常態性 (Normality):最常見也最直覺的。你的資料是不是呈現鐘形曲線?你可以用 Minitab 裡的「常態性檢定」或「機率圖」來看。如果點點都落在信賴區間裡面,通常就沒問題。如果你的 P 值小於 0.05(或你設定的顯著水準),那表示資料不符合常態分佈。舉例來說,你跑了 #31 機台的膜厚數據,結果常態性檢定的 P 值是 0.008,那就慘了,你的數據根本不是常態分佈。
- 變異數同質性 (Homogeneity of Variances):這個也超級重要。簡單講,就是你比較的幾組資料,它們的變異程度要差不多。你不能拿一個數據分散很廣的組,跟一個數據很集中的組一起比。在 Minitab 裡,你可以用「Levene's Test」或「Bartlett's Test」。如果 P 值小於 0.05,就代表變異數不齊。想像一下,你比三台機台的良率,#31 機台的良率穩定在 99%±0.1%,#32 機台卻在 98%~99.5%之間大起大落,這兩台的「穩定度」差這麼多,直接用 ANOVA 比平均值,意義就不大了。
- 獨立性 (Independence):這個最難用統計軟體直接檢定,但它非常關鍵。你的每一次量測,都不能受到前一次量測的影響。換句話說,你量測 #31 機台第一片晶圓的膜厚,不能影響到第二片晶圓的膜厚。如果你發現同一個操作員,連續測量時會習慣性地把數字「修飾」一下,那你的數據就沒有獨立性了。
我踩過最常見的坑
以前我剛進公司,有一次分析某個製程參數對產品可靠度的影響。跑完 ANOVA,P 值超小,興高采烈地跟主管報告「這參數影響很大!」結果被主管問:「你數據是不是從同一塊晶圓上,連續測了二十次?」我一聽,臉都綠了。沒錯,為了省時間,我讓測試工程師在同一塊晶圓上重複測量,這樣測出來的數據根本不是獨立的。後果就是,我的 ANOVA 結果完全不可信,所有結論都要推翻重來。浪費大家時間事小,萬一因此誤導決策,造成數百萬的損失,那可不是開玩笑的。
今天能做的一件事
下次跑 ANOVA 前,花五分鐘確認常態性跟同質性檢定的 P 值!