InsightFab
知識庫/Box-Cox 轉換:讓非常態數據變常態的正確做法
6 Sigma
7 分鐘閱讀

Box-Cox 轉換:讓非常態數據變常態的正確做法

很多統計分析(t-test、ANOVA、Cpk)都假設數據符合常態分布。Box-Cox 轉換是最系統化的方法,自動找出最佳的轉換參數,讓數據符合常態前提。

情境

你的製程數據明顯右偏,無法直接用 Cpk 或 ANOVA。同事說「取 log」,你取了,但常態性檢定還是不過。另一個同事說「取平方根」,也不行。有沒有更系統化的方法找到最佳轉換?

有,就是 Box-Cox 轉換。

Box-Cox 轉換公式

Y(λ) = (Xλ - 1) / λ,當 λ ≠ 0

Y(λ) = ln(X),當 λ = 0

λ(lambda)是轉換參數,由數據決定最佳值。

常見 λ 值對應的轉換

λ 值等效轉換 -21/X² -11/X(倒數) -0.51/√X 0ln(X)(自然對數) 0.5√X(平方根) 1X(不轉換) 2X²(平方)

如何找最佳 λ

統計軟體(Minitab、InsightFab)會自動:

  • 嘗試不同 λ 值(通常 -5 到 5)
  • 對每個 λ,計算轉換後數據的 log-likelihood
  • 找到讓 log-likelihood 最大的 λ
  • 同時提供 95% 信賴區間,若區間包含整數(如 0 或 0.5),取整數更好溝通
  • 實際操作步驟

    Step 1:確認數據符合使用條件
  • 數據必須全部 > 0(Box-Cox 不能處理負數或零)
  • 如有零,加一個常數:X' = X + 0.001
  • Step 2:執行 Box-Cox,取得最佳 λ 和信賴區間 Step 3:用最佳 λ 轉換數據 Step 4:對轉換後數據做常態性檢定確認 Step 5:在轉換後的尺度做分析 Step 6:結果需要解讀時,反轉換回原始尺度

    重要限制

    規格界限也要轉換

    如果用 Box-Cox 計算 Cpk,USL 和 LSL 必須用同樣的 λ 轉換,才能在轉換後尺度比較。

    不能無中生有

    Box-Cox 只是改變數據的尺度,不能把真正的非常態製程(如雙峰分布)變成常態。轉換後還是要做常態性確認。

    λ 是從當前數據估計的

    新數據應使用相同的 λ,不要每批數據重新計算 λ(否則前後不可比)。

    和其他轉換方法比較

    方法特點 Box-Cox自動找最佳 λ,適用廣 Johnson 轉換更靈活,能處理更多分布類型 手動 log/sqrt直觀,但可能不是最佳

    金句

    「Box-Cox 不是魔法,是在你的數據中找到一把最順手的尺——換了尺,問題還是你的問題,只是現在標準工具能量了。」

    想試試看?

    文章裡提到的分析工具在 InsightFab 都可以直接用,上傳 CSV 即可分析。

    前往工具頁面