InsightFab
知識庫/信賴區間的正確解讀:95% CI 不是你想的那樣
統計分析6 分鐘閱讀

信賴區間的正確解讀:95% CI 不是你想的那樣

嘿,最近看到一篇超實用的文章!它從一個大家在開會時都可能遇過的尷尬情境說起:CPK 報告出來,PM 盯著 1.08 的數據和旁邊的「95% CI: 0.95-1.21」,問這到底是好是壞?然後大家就靜默了。讀完你會知道,我們平常對信賴區間的理解,尤其那個「95% 的機率落在這個區間」根本是錯的!這篇文會教你信賴區間的正確解讀方式,讓你以後看報表不再一頭霧水,超推!

那天 CPK 報告出來,全場沉默了三秒

還記得好幾年前,我們產線有個新機台導入,大家戰戰兢兢地跑完驗證,數據出來了。PM 一臉嚴肅地看著螢幕上的 CPK 報告,上面寫著「CPK: 1.08 (95% CI: 0.95-1.21)」。他眉頭一皺,問了一句:「這個 CPK 1.08 到底是好還是不好?它旁邊的那個區間又是什麼意思?」整個會議室瞬間安靜,大家面面相覷,沒有人敢直接回答。這不就是你我每天都會遇到的情境嗎?報表上的信賴區間,你真的搞懂了嗎?

問題出在哪

你是不是也覺得,那個 95% 信賴區間「0.95-1.21」的意思就是:我們這個 CPK 1.08 有 95% 的機率落在 0.95 到 1.21 之間?說實話,這幾乎是所有新手工程師都會犯的誤解,連一些資深一點的也常常搞混。坦白講,這個解讀是錯的!信賴區間的正確解讀,其實是關於「我們的估計方法」,而不是關於「單一一個值」的機率。

換句話說,如果我們重複取樣一百次,每次都用同樣的方法去計算一個 95% 的信賴區間,那大概會有 95 個信賴區間會包含「真實的」CPK 值。所以重點是,這 95% 的機率是針對「區間」本身,不是針對「單一的點估計值」CPK 1.08。這就像你射飛鏢,你每次射飛鏢都會射出一個範圍,有 95% 的機率你的範圍會圈到靶心,而不是說你的飛鏢有 95% 機率落在那個範圍裡面。

實際上怎麼做

那我們該怎麼看這個 CPK 1.08 (95% CI: 0.95-1.21) 呢?首先,你的點估計值(這裡就是 CPK 1.08)是你對真實狀況的「最佳猜測」。但因為我們不可能測量所有的產品,所以這個「猜測」一定會有誤差。信賴區間,就是用來告訴你這個「猜測」可能有多大的範圍。

  1. 看區間的寬度:區間越窄,代表你的估計越精確。像這個 0.95-1.21,寬度是 0.26。如果你的區間是 0.8-1.4,那表示你的估計誤差可能就更大。
  2. 看區間有沒有跨過關鍵值:假設你的客戶要求 CPK 至少要 1.0。你的點估計值是 1.08,看起來是過了。但信賴區間是 0.95-1.21,下限是 0.95。這表示「真實的」CPK 值,很有可能低於 1.0!這種情況下,你不能直接打包票說「我們 CPK 穩過 1.0」。你可能會需要增加樣本數,讓區間變窄,才能更有信心地判斷。

最常見的坑

我還遇過一個狀況,有一次我們在評估一個製程改動後的不良率,DPMO 從 7500 降到 6210。報告出來,新製程的 DPMO (95% CI: 5800-6600),舊製程的 DPMO (95% CI: 7100-7900)。PM 看到新製程的 DPMO 數字比較低,就很高興地說:「太棒了,有顯著改善!」

但仔細一看,新舊製程的信賴區間有沒有重疊?5800-6600 跟 7100-7900,兩個區間完全沒有重疊!這就表示,新製程確實有統計上的顯著改善。如果兩個區間有重疊,例如新製程變成 (95% CI: 6000-7000),那你就不能這麼快下定論了,因為真實值可能落在重疊區間,那可能就沒有顯著差異。說穿了就是,區間不重疊,才真的能證明有差異。

今天能做的一件事

下次看到信賴區間,別只看點估計,記得看區間有沒有跨過你的標準!

想試試看?

文章裡提到的分析工具在 InsightFab 都可以直接用,上傳 CSV 即可分析。

前往工具頁面

同類別文章

常態分配假設的檢定:Shapiro-Wilk vs Anderson-Darling

欸,跟你說,最近看到一篇超實用的文章!它在講以前工廠良率很差,結果 CPK 報告出來,數據根本對不上 DPMO,全場傻眼。讀完你會知道,原來很多統計指標像 CPK 都有個大前提,就是你的數據得符合「常態分配」才準。如果數據不是常態,那些算出來的數字根本是白搭!所以啊,下次做分析前,記得先用 Shapiro-Wilk 檢定一下,才不會鬧出烏龍喔!

統計檢定力(Power):如何確保結論有意義

嘿,跟你分享一篇很有趣的文章!作者那天興高采烈拿著CPK從1.08進步到1.25的數據給老闆看,結果老闆一句「你確定這樣有差?」讓他瞬間語塞。 這篇文章超實用,它點出我們工程師常犯的錯誤——光看數據有變就急著下結論,卻沒考慮到那可能是隨機波動或樣本不足。裡面會教你怎麼用「統計檢定力」來證明你的結論夠不夠穩,讓你下次報告時,面對老闆的質疑也能自信滿滿!讀完你會知道怎麼讓你的數據說服力更強喔!

事後比較(Post-hoc Test):Tukey vs Bonferroni 的選擇

嘿,哥們!最近看到一篇超實用的文章,完全是解決你在產線會遇到的那種「到底是哪台機台出問題」的窘境。它講到當 CPK 報告出來,發現目標沒達到,老闆問是哪台機台出包時,如果你只會說「有差」,那就GG了。這時候你就需要學會「事後比較」(Post-hoc Test),讓你一眼看出到底是哪兩台機台有顯著差異,幫你精準抓出問題,讓產線能立刻處理!趕快讀這篇,以後保證不再被老闆問倒!