情境
你的製程數據明顯右偏,無法直接用 Cpk 或 ANOVA。同事說「取 log」,你取了,但常態性檢定還是不過。另一個同事說「取平方根」,也不行。有沒有更系統化的方法找到最佳轉換?
有,就是 Box-Cox 轉換。
Box-Cox 轉換公式
Y(λ) = (Xλ - 1) / λ,當 λ ≠ 0
Y(λ) = ln(X),當 λ = 0
λ(lambda)是轉換參數,由數據決定最佳值。
常見 λ 值對應的轉換
| λ 值 | 等效轉換 |
|---|---|
| -2 | 1/X² |
| -1 | 1/X(倒數) |
| -0.5 | 1/√X |
| 0 | ln(X)(自然對數) |
| 0.5 | √X(平方根) |
| 1 | X(不轉換) |
| 2 | X²(平方) |
如何找最佳 λ
統計軟體(Minitab、InsightFab)會自動:
- 嘗試不同 λ 值(通常 -5 到 5)
- 對每個 λ,計算轉換後數據的 log-likelihood
- 找到讓 log-likelihood 最大的 λ
- 同時提供 95% 信賴區間,若區間包含整數(如 0 或 0.5),取整數更好溝通
實際操作步驟
Step 1:確認數據符合使用條件
- 數據必須全部 > 0(Box-Cox 不能處理負數或零)
- 如有零,加一個常數:X' = X + 0.001
Step 2:執行 Box-Cox,取得最佳 λ 和信賴區間
Step 3:用最佳 λ 轉換數據
Step 4:對轉換後數據做常態性檢定確認
Step 5:在轉換後的尺度做分析
Step 6:結果需要解讀時,反轉換回原始尺度
重要限制
規格界限也要轉換
如果用 Box-Cox 計算 Cpk,USL 和 LSL 必須用同樣的 λ 轉換,才能在轉換後尺度比較。
不能無中生有
Box-Cox 只是改變數據的尺度,不能把真正的非常態製程(如雙峰分布)變成常態。轉換後還是要做常態性確認。
λ 是從當前數據估計的
新數據應使用相同的 λ,不要每批數據重新計算 λ(否則前後不可比)。
和其他轉換方法比較
| 方法 | 特點 |
|---|---|
| Box-Cox | 自動找最佳 λ,適用廣 |
| Johnson 轉換 | 更靈活,能處理更多分布類型 |
| 手動 log/sqrt | 直觀,但可能不是最佳 |
金句
「Box-Cox 不是魔法,是在你的數據中找到一把最順手的尺——換了尺,問題還是你的問題,只是現在標準工具能量了。」