InsightFab
知識庫/P-value:它不是「通過/不通過」的開關
6 Sigma
7 分鐘閱讀

P-value:它不是「通過/不通過」的開關

P = 0.043,你說「有效」,把新參數寫進 SOP。三個月後同樣問題又出現。那次樣本只有 12 個。P-value 告訴你的,比你以為的少很多。

情境

你做了一個改善實驗,把螺絲扭力從 5Nm 調高到 5.5Nm。跑了統計分析,P-value = 0.043。你的主管問:「有沒有效?」你說:「有,P < 0.05。」

主管滿意了,你把新參數寫進 SOP。三個月後,同樣的問題又出現了。你回去查,發現那次的樣本只有 12 個。

白話翻譯

P-value 不是「這個改善有沒有效」的答案。它只回答一件事:

如果這個改善「完全沒有效果」,要隨機產生這麼好看的結果,機率是多少?

P = 0.043 的意思是:假設你的改善無效,要剛好抽到這組數據的機率是 4.3%。因為很低,所以我們說「顯著」。

但「顯著」不等於「重要」。一個 P = 0.001 的結果,效果可能只有 0.01mm——統計上很顯著,工程上根本不在乎。

P-value 要配合「效果量(Effect Size)」一起看。

實戰判斷

P-value解讀行動 > 0.05差異可能是隨機波動不要輕易調整製程 0.01–0.05有統計顯著看效果量值不值得改 < 0.01強顯著可以有信心說有效果 樣本數 < 30P-value 不可靠先增加樣本 3 個你不能只看 P-value 的情境:
  • 樣本數很大(n > 500):幾乎任何微小差異都會顯著
  • 多重比較(同時跑很多組):每多跑一組,假陽性機率累積
  • 數據不符合常態:t-test 的 P-value 可能失準
  • InsightFab 怎麼做

    Minitab 和 JMP 都只給你一個 P 值,要自己判斷效果量。InsightFab 除了 P-value,還直接給你信賴區間效果量解讀,告訴你「統計顯著,但效果量小,實務上是否值得改善請自行評估」。

    金句

    「低於 0.05 的 P-value 是你的護身符,但它只保護你不被統計打臉——不保護你做出正確的工程決策。」

    想試試看?

    文章裡提到的分析工具在 InsightFab 都可以直接用,上傳 CSV 即可分析。

    前往工具頁面