InsightFab
知識庫/多重檢定問題:FDR 控制與 Bonferroni 校正
統計分析6 分鐘閱讀

多重檢定問題:FDR 控制與 Bonferroni 校正

嘿,跟你說!這篇文章超有趣,它講了一個很常見卻容易被忽略的「多重檢定問題」。作者從他們公司機台換新耗材,結果 CPK 報告數字慘不忍睹的真實經驗談起,當時 PM 和工程師都嚇傻了,以為新耗材是來亂的! 但讀完你會知道,其實問題可能根本不在耗材,而是統計學上的「多重檢定」在作怪。你想想,當你檢測的參數一多,即使每個參數誤判機率很低,全部加起來誤判的機會就大幅增加了。這篇用很口語的方式,搭配實際案例

那天 CPK 報告出來,全場沉默了三秒

還記得好幾年前,我們機台換了一批新耗材,大家都很期待。結果第一份 CPK 報告出來,會議室裡瞬間安靜。PM 臉色鐵青,因為報告上密密麻麻的紅字,代表我們有 20 個參數的 CPK 都掉到 1.08 以下,也就是說,良率可能要爆炸了。我盯著那份報告,心想:「靠,這耗材是祖宗十八代有仇是不是?怎麼會爛成這樣?」PM 轉頭問我:「這批料是不是有問題?」我心裡也打鼓,但經驗告訴我,事情沒這麼單純。

問題出在哪

說穿了,這就是「多重檢定問題」在搞鬼。你想想看,我們有 20 個參數,每個參數都會做一次假設檢定,判斷它的 CPK 是否達標。假設我們把 alpha 值設在 0.05(也就是有 5% 的機率會誤判),那當你只做一次檢定時,誤判率確實是 5%。

但是,當你做了 20 次獨立檢定時,每一次都有 5% 的機會誤判。你猜猜看,這 20 次裡面,至少有一次誤判的機率是多少?算一下,1 – (1 – 0.05)^20 大約是 0.64!換句話說,有高達 64% 的機會,你至少會看到一個「假紅字」,但實際上根本沒問題。這就像你連續買了 20 張樂透,卻只中一張刮刮樂的安慰獎一樣。

所以重點是,當你同時檢定很多項目時,個別的 alpha 值已經不能代表整體錯誤率了,你會看到很多「假陽性」,浪費時間去追查根本不存在的問題。

實際上怎麼做

針對這種多重檢定問題,有兩種常用的方法:「Bonferroni 校正」和「FDR 控制」。

  1. Bonferroni 校正:這個方法最簡單粗暴。它直接把你的 alpha 值除以檢定次數。像我們有 20 個參數,原本 alpha 是 0.05,校正後新的 alpha 就變成 0.05 / 20 = 0.0025。也就是說,只有當 p 值小於 0.0025 時,我們才認為這個參數真的有問題。這種方法的好處是能有效控制「家庭錯誤率」(Family-Wise Error Rate, FWER),也就是保證所有檢定中至少一次誤判的機率不超過你設定的 alpha。但壞處是它太保守了,可能會讓很多真的有問題的參數被「漏掉」(假陰性)。

  1. FDR 控制 (False Discovery Rate):這個方法比較聰明,它控制的是「錯誤發現率」,也就是在所有你判斷為「有問題」的結果中,有多少比例其實是誤判的。FDR 會先把所有參數的 p 值由小到大排序,然後給每個 p 值一個新的臨界值。這個方法在半導體廠這種需要同時監控大量參數的環境特別好用,它比 Bonferroni 沒那麼保守,能讓我們發現更多潛在的問題,同時又不會被太多假陽性結果淹沒。

坦白講,現在很多統計軟體都有內建這些功能,你只要選對方法,數字就會幫你算好。

最常見的坑

我那時就踩過一個大坑。我們為了「不漏掉任何問題」,一開始根本沒做任何校正,直接盯著 20 個參數的原始 p 值。結果就是,只要有參數的 CPK 稍稍低於 1.33( DPMO 6210),我們就開始派人去拆機台、換零件,甚至停線檢查。搞到最後,發現很多所謂的「問題」根本是統計上的假象,只是為了那 5% 的隨機性在窮忙。

有一次,為了追一個「紅字」,大家忙了一整週,結果最後發現只是量測誤差加上多重檢定的效應,那個參數的真實 CPK 根本沒問題。那次我才真正意識到,統計分析如果用錯方法,比亂猜還慘,因為你還會為它投入真金白銀跟人力時間。

今天能做的一件事

下次報告出來看到一堆紅字,先問問自己:「這份報告做了幾次檢定?」

想試試看?

文章裡提到的分析工具在 InsightFab 都可以直接用,上傳 CSV 即可分析。

前往工具頁面

同類別文章

常態分配假設的檢定:Shapiro-Wilk vs Anderson-Darling

欸,跟你說,最近看到一篇超實用的文章!它在講以前工廠良率很差,結果 CPK 報告出來,數據根本對不上 DPMO,全場傻眼。讀完你會知道,原來很多統計指標像 CPK 都有個大前提,就是你的數據得符合「常態分配」才準。如果數據不是常態,那些算出來的數字根本是白搭!所以啊,下次做分析前,記得先用 Shapiro-Wilk 檢定一下,才不會鬧出烏龍喔!

統計檢定力(Power):如何確保結論有意義

嘿,跟你分享一篇很有趣的文章!作者那天興高采烈拿著CPK從1.08進步到1.25的數據給老闆看,結果老闆一句「你確定這樣有差?」讓他瞬間語塞。 這篇文章超實用,它點出我們工程師常犯的錯誤——光看數據有變就急著下結論,卻沒考慮到那可能是隨機波動或樣本不足。裡面會教你怎麼用「統計檢定力」來證明你的結論夠不夠穩,讓你下次報告時,面對老闆的質疑也能自信滿滿!讀完你會知道怎麼讓你的數據說服力更強喔!

信賴區間的正確解讀:95% CI 不是你想的那樣

嘿,最近看到一篇超實用的文章!它從一個大家在開會時都可能遇過的尷尬情境說起:CPK 報告出來,PM 盯著 1.08 的數據和旁邊的「95% CI: 0.95-1.21」,問這到底是好是壞?然後大家就靜默了。讀完你會知道,我們平常對信賴區間的理解,尤其那個「95% 的機率落在這個區間」根本是錯的!這篇文會教你信賴區間的正確解讀方式,讓你以後看報表不再一頭霧水,超推!