2^k-p 部分因子設計：混淆（Confounding）的管理

那天 CPK 1.08 的報告出來，全場空氣凍結了三秒

還記得有一次，為了提升新產品的良率，我們搞了一個超大規模的 DOE。那陣子產線的狀況有點怪，明明 A 機台的參數看起來沒問題，但出來的產品 Cpk 就是只有 1.08，比隔壁 B 機台的 1.35 差了一大截。老闆看了報告臉都綠了，當場就把我們幾個主管級的工程師叫進會議室，問說：「到底在搞什麼？DOE 的結果還能這樣？」當下會議室的空氣，說實話，比無塵室的氮氣還凝結。

問題出在哪？不是你沒做 DOE，是你沒搞懂「混淆」

我們做了 DOE 沒錯，但問題就出在，我們用的其實是 2^k-p 的部分因子設計。這玩意兒，說穿了就是一種「省資源」的做法。當你因子太多，全因子設計做下去要跑好幾百批，時間跟成本根本吃不消。所以，我們就會選擇只跑部分組合。但省資源的代價是什麼？就是你的因子效應可能會跟別的因子或交互作用「混淆」在一起。

換句話說，你看到的 A 因子效應，其實可能包含了 B 和 C 的交互作用。就像你看到 Cpk 1.08，你以為是機台 A 的問題，但其實可能是機台 A 的某個參數，在特定的環境溫度下，表現特別差。這時候，如果你直接去調機台 A 的參數，搞不好問題沒解決，還會引發新的災難。

實際上怎麼做？看清楚你的「產生元」

在 2^k-p 的設計裡，要管理混淆，最關鍵的就是你的「產生元」（Generators）。產生元決定了哪些因子會跟哪些因子混淆。

舉個例子，假設我們要做一個 2^(5-2) 的設計，也就是有 5 個因子，但我們只跑 2^3 = 8 組實驗。這裡的「-2」就表示我們用了兩個產生元。

假設我們的產生元是 D = AB 和 E = AC。
這代表 D 因子會跟 AB 的交互作用混淆，E 因子會跟 AC 的交互作用混淆。
更進一步，如果你把 D = AB 和 E = AC 相乘，你會得到 DE = A^2BC = BC。這表示 DE 的交互作用會跟 BC 的交互作用混淆。

所以重點來了，你要知道你的產生元是什麼，然後去查它的「解析度」（Resolution）。解析度越高，代表你的主要因子或低階交互作用被混淆的程度越低。

解析度 III：主要因子會跟二階交互作用混淆。
解析度 IV：主要因子不會被混淆，但二階交互作用會跟二階交互作用混淆。
解析度 V：主要因子和二階交互作用都不會被混淆。

坦白講，解析度 V 是最好的，但犧牲的實驗次數也最少。如果預算允許，通常會建議至少做到解析度 IV。

最常見的坑：想省又想準，結果兩頭空

我見過最常見的坑，就是大家在選設計的時候，只顧著省實驗次數，結果選了一個解析度只有 III 的設計。然後實驗結果出來，發現有個主要因子很顯著，就直接衝上去改參數。結果呢？良率沒提升，反而出了更多怪問題。

後來才發現，那個顯著的「主要因子」，其實是跟一個很關鍵的二階交互作用混淆了。你調整了主要因子，卻完全沒動到真正有影響的交互作用。這就像你頭痛醫頭，結果是腳痛引起的，當然沒用。

我們那次 Cpk 1.08 的案例，最後發現就是某個低解析度的設計，把機台 A 的一個參數跟環境濕度的交互作用混淆了。當天濕度特別高，導致那個參數的效應被放大，看起來像是機台 A 的問題。

今天能做的一件事

下次做 DOE，請先確認你的部分因子設計的「解析度」是多少。