情境
你做了一個改善實驗,把螺絲扭力從 5Nm 調高到 5.5Nm。跑了統計分析,P-value = 0.043。你的主管問:「有沒有效?」你說:「有,P < 0.05。」
主管滿意了,你把新參數寫進 SOP。三個月後,同樣的問題又出現了。你回去查,發現那次的樣本只有 12 個。
白話翻譯
P-value 不是「這個改善有沒有效」的答案。它只回答一件事:
如果這個改善「完全沒有效果」,要隨機產生這麼好看的結果,機率是多少?
P = 0.043 的意思是:假設你的改善無效,要剛好抽到這組數據的機率是 4.3%。因為很低,所以我們說「顯著」。
但「顯著」不等於「重要」。一個 P = 0.001 的結果,效果可能只有 0.01mm——統計上很顯著,工程上根本不在乎。
P-value 要配合「效果量(Effect Size)」一起看。
實戰判斷
| P-value | 解讀 | 行動 |
|---|---|---|
| > 0.05 | 差異可能是隨機波動 | 不要輕易調整製程 |
| 0.01–0.05 | 有統計顯著 | 看效果量值不值得改 |
| < 0.01 | 強顯著 | 可以有信心說有效果 |
| 樣本數 < 30 | P-value 不可靠 | 先增加樣本 |
3 個你不能只看 P-value 的情境:
- 樣本數很大(n > 500):幾乎任何微小差異都會顯著
- 多重比較(同時跑很多組):每多跑一組,假陽性機率累積
- 數據不符合常態:t-test 的 P-value 可能失準
InsightFab 怎麼做
Minitab 和 JMP 都只給你一個 P 值,要自己判斷效果量。InsightFab 除了 P-value,還直接給你信賴區間和效果量解讀,告訴你「統計顯著,但效果量小,實務上是否值得改善請自行評估」。
金句
「低於 0.05 的 P-value 是你的護身符,但它只保護你不被統計打臉——不保護你做出正確的工程決策。」