信賴區間的正確解讀：95% CI 不是你想的那樣

那天 CPK 報告出來，全場沉默了三秒

還記得好幾年前，我們產線有個新機台導入，大家戰戰兢兢地跑完驗證，數據出來了。PM 一臉嚴肅地看著螢幕上的 CPK 報告，上面寫著「CPK: 1.08 (95% CI: 0.95-1.21)」。他眉頭一皺，問了一句：「這個 CPK 1.08 到底是好還是不好？它旁邊的那個區間又是什麼意思？」整個會議室瞬間安靜，大家面面相覷，沒有人敢直接回答。這不就是你我每天都會遇到的情境嗎？報表上的信賴區間，你真的搞懂了嗎？

問題出在哪

你是不是也覺得，那個 95% 信賴區間「0.95-1.21」的意思就是：我們這個 CPK 1.08 有 95% 的機率落在 0.95 到 1.21 之間？說實話，這幾乎是所有新手工程師都會犯的誤解，連一些資深一點的也常常搞混。坦白講，這個解讀是錯的！信賴區間的正確解讀，其實是關於「我們的估計方法」，而不是關於「單一一個值」的機率。

換句話說，如果我們重複取樣一百次，每次都用同樣的方法去計算一個 95% 的信賴區間，那大概會有 95 個信賴區間會包含「真實的」CPK 值。所以重點是，這 95% 的機率是針對「區間」本身，不是針對「單一的點估計值」CPK 1.08。這就像你射飛鏢，你每次射飛鏢都會射出一個範圍，有 95% 的機率你的範圍會圈到靶心，而不是說你的飛鏢有 95% 機率落在那個範圍裡面。

實際上怎麼做

那我們該怎麼看這個 CPK 1.08 (95% CI: 0.95-1.21) 呢？首先，你的點估計值（這裡就是 CPK 1.08）是你對真實狀況的「最佳猜測」。但因為我們不可能測量所有的產品，所以這個「猜測」一定會有誤差。信賴區間，就是用來告訴你這個「猜測」可能有多大的範圍。

看區間的寬度：區間越窄，代表你的估計越精確。像這個 0.95-1.21，寬度是 0.26。如果你的區間是 0.8-1.4，那表示你的估計誤差可能就更大。
看區間有沒有跨過關鍵值：假設你的客戶要求 CPK 至少要 1.0。你的點估計值是 1.08，看起來是過了。但信賴區間是 0.95-1.21，下限是 0.95。這表示「真實的」CPK 值，很有可能低於 1.0！這種情況下，你不能直接打包票說「我們 CPK 穩過 1.0」。你可能會需要增加樣本數，讓區間變窄，才能更有信心地判斷。

最常見的坑

我還遇過一個狀況，有一次我們在評估一個製程改動後的不良率，DPMO 從 7500 降到 6210。報告出來，新製程的 DPMO (95% CI: 5800-6600)，舊製程的 DPMO (95% CI: 7100-7900)。PM 看到新製程的 DPMO 數字比較低，就很高興地說：「太棒了，有顯著改善！」

但仔細一看，新舊製程的信賴區間有沒有重疊？5800-6600 跟 7100-7900，兩個區間完全沒有重疊！這就表示，新製程確實有統計上的顯著改善。如果兩個區間有重疊，例如新製程變成 (95% CI: 6000-7000)，那你就不能這麼快下定論了，因為真實值可能落在重疊區間，那可能就沒有顯著差異。說穿了就是，區間不重疊，才真的能證明有差異。

今天能做的一件事

下次看到信賴區間，別只看點估計，記得看區間有沒有跨過你的標準！

信賴區間的正確解讀：95% CI 不是你想的那樣

問題出在哪

實際上怎麼做

最常見的坑

今天能做的一件事

同類別文章