統計顯著性 vs 實務顯著性：p < 0.05 不等於重要

那天 CPK 報告出來，全場沉默了三秒

還記得好幾年前，我們部門剛導入新製程，大家戰戰兢兢，每個禮拜都要開會 review 數據。有一次，RD 丟出一份報告，裡面好幾個參數的 p-value 都小於 0.001，還信誓旦旦說：「你看，這些變數對良率的影響是統計顯著的！」結果呢？一個參數從 CPK 1.08 提升到 1.10，另一個 DPMO 從 6210 降到 6195。我看著報告，再看看產線的良率，臉都綠了。會議室裡，大家的表情也僵在那邊，沉默了三秒。說實話，那幾秒鐘，我心裡只有一句話：「這統計顯著性，到底顯著在哪裡？」

問題出在哪？

這就是我們常常會搞混的地方：「統計顯著性」跟「實務顯著性」根本是兩回事。統計顯著性（p < 0.05 這種），它只是告訴你，你觀察到的差異「不太可能是隨機發生的」。換句話說，它只是在說「這件事可能真的有影響，不是瞎貓碰到死耗子」。

但它從來沒有告訴你這個影響有多「大」，多「重要」，或者對你的產品、良率、成本有沒有「實質」的幫助。一個參數即使 p-value 小到爆，對良率的影響可能只有 0.0001%，這種差異，對產線來說根本是噪音，你花再多力氣去調整，也只是白忙一場。說穿了，統計顯著性就像是偵測到一個微弱的信號，但這個信號可能根本沒有任何實際意義。

實際上怎麼做？

所以，每次拿到數據，除了看 p-value，你還要多看兩件事：

效果量 (Effect Size)：這個變數到底「影響了多少」？例如，你的參數調整 1 個單位，良率會提升 0.5% 還是 5%？DPMO 會下降 10 還是 1000？你要看具體的數字，而不是只看「有沒有影響」。如果 CPK 從 1.08 變成 1.10，這效果量基本上是微不足道的。
業界標準與客戶要求：你的改善，有沒有達到客戶的規格？有沒有超越競爭對手？一個從 DPMO 6210 降到 6195 的「改善」，雖然有統計顯著性，但如果客戶要求是 DPMO 1000 以下，那這個改善根本是杯水車薪。

所以重點是，你必須把統計結果跟你的製程知識、目標、客戶要求結合起來看。

最常見的坑

我踩過最大的坑，就是把所有 p-value 小於 0.05 的變數都拉出來，然後花大把時間去追那些其實根本不重要的參數。有一次，我們一個批次的良率稍微掉了一點，統計分析出來，發現一個冷門的化學品濃度有統計顯著性。當時我傻傻的，真的花了一整天去追那個供應商，要求他們提供更精準的批次報告。結果呢？那個濃度的變異，對良率的實際影響，換算下來只有萬分之一。當時被課長唸爆，說我浪費時間在雞毛蒜皮的事情上。坦白講，如果當時我能多問一句：「這差異對良率會造成多大的影響？」就不會那麼蠢了。

今天能做的一件事

拿到統計報告，別只看 p-value，先問：「這差異有多大？對我們重要嗎？」