那天 CPK 報告出來,全場沉默了三秒
還記得好幾年前,我們產線有個新機台導入,大家戰戰兢兢地跑完驗證,數據出來了。PM 一臉嚴肅地看著螢幕上的 CPK 報告,上面寫著「CPK: 1.08 (95% CI: 0.95-1.21)」。他眉頭一皺,問了一句:「這個 CPK 1.08 到底是好還是不好?它旁邊的那個區間又是什麼意思?」整個會議室瞬間安靜,大家面面相覷,沒有人敢直接回答。這不就是你我每天都會遇到的情境嗎?報表上的信賴區間,你真的搞懂了嗎?
問題出在哪
你是不是也覺得,那個 95% 信賴區間「0.95-1.21」的意思就是:我們這個 CPK 1.08 有 95% 的機率落在 0.95 到 1.21 之間?說實話,這幾乎是所有新手工程師都會犯的誤解,連一些資深一點的也常常搞混。坦白講,這個解讀是錯的!信賴區間的正確解讀,其實是關於「我們的估計方法」,而不是關於「單一一個值」的機率。
換句話說,如果我們重複取樣一百次,每次都用同樣的方法去計算一個 95% 的信賴區間,那大概會有 95 個信賴區間會包含「真實的」CPK 值。所以重點是,這 95% 的機率是針對「區間」本身,不是針對「單一的點估計值」CPK 1.08。這就像你射飛鏢,你每次射飛鏢都會射出一個範圍,有 95% 的機率你的範圍會圈到靶心,而不是說你的飛鏢有 95% 機率落在那個範圍裡面。
實際上怎麼做
那我們該怎麼看這個 CPK 1.08 (95% CI: 0.95-1.21) 呢?首先,你的點估計值(這裡就是 CPK 1.08)是你對真實狀況的「最佳猜測」。但因為我們不可能測量所有的產品,所以這個「猜測」一定會有誤差。信賴區間,就是用來告訴你這個「猜測」可能有多大的範圍。
- 看區間的寬度:區間越窄,代表你的估計越精確。像這個 0.95-1.21,寬度是 0.26。如果你的區間是 0.8-1.4,那表示你的估計誤差可能就更大。
- 看區間有沒有跨過關鍵值:假設你的客戶要求 CPK 至少要 1.0。你的點估計值是 1.08,看起來是過了。但信賴區間是 0.95-1.21,下限是 0.95。這表示「真實的」CPK 值,很有可能低於 1.0!這種情況下,你不能直接打包票說「我們 CPK 穩過 1.0」。你可能會需要增加樣本數,讓區間變窄,才能更有信心地判斷。
最常見的坑
我還遇過一個狀況,有一次我們在評估一個製程改動後的不良率,DPMO 從 7500 降到 6210。報告出來,新製程的 DPMO (95% CI: 5800-6600),舊製程的 DPMO (95% CI: 7100-7900)。PM 看到新製程的 DPMO 數字比較低,就很高興地說:「太棒了,有顯著改善!」
但仔細一看,新舊製程的信賴區間有沒有重疊?5800-6600 跟 7100-7900,兩個區間完全沒有重疊!這就表示,新製程確實有統計上的顯著改善。如果兩個區間有重疊,例如新製程變成 (95% CI: 6000-7000),那你就不能這麼快下定論了,因為真實值可能落在重疊區間,那可能就沒有顯著差異。說穿了就是,區間不重疊,才真的能證明有差異。
今天能做的一件事
下次看到信賴區間,別只看點估計,記得看區間有沒有跨過你的標準!