InsightFab
知識庫/2^k-p 部分因子設計:混淆(Confounding)的管理
DOE6 分鐘閱讀

2^k-p 部分因子設計:混淆(Confounding)的管理

欸,你是不是也遇過產品良率一直拉不起來,做了老半天實驗(DOE),結果老闆看了數據還是氣到臉發綠?這篇講的就是作者他們也碰上這種窘境,明明參數看起來沒問題,但良率就是差一大截。讀完你會知道,問題可能不是你沒做 DOE,而是你沒搞懂「混淆」這個魔王!原來,為了省錢省時間做的部分因子設計,很容易讓因子效應偷偷跟其他變數「混」在一起,結果你以為找出問題點,其實根本搞錯方向。想知道怎麼避免掉進這個陷阱嗎?

那天 CPK 1.08 的報告出來,全場空氣凍結了三秒

還記得有一次,為了提升新產品的良率,我們搞了一個超大規模的 DOE。那陣子產線的狀況有點怪,明明 A 機台的參數看起來沒問題,但出來的產品 Cpk 就是只有 1.08,比隔壁 B 機台的 1.35 差了一大截。老闆看了報告臉都綠了,當場就把我們幾個主管級的工程師叫進會議室,問說:「到底在搞什麼?DOE 的結果還能這樣?」當下會議室的空氣,說實話,比無塵室的氮氣還凝結。

問題出在哪?不是你沒做 DOE,是你沒搞懂「混淆」

我們做了 DOE 沒錯,但問題就出在,我們用的其實是 2^k-p 的部分因子設計。這玩意兒,說穿了就是一種「省資源」的做法。當你因子太多,全因子設計做下去要跑好幾百批,時間跟成本根本吃不消。所以,我們就會選擇只跑部分組合。但省資源的代價是什麼?就是你的因子效應可能會跟別的因子或交互作用「混淆」在一起。

換句話說,你看到的 A 因子效應,其實可能包含了 B 和 C 的交互作用。就像你看到 Cpk 1.08,你以為是機台 A 的問題,但其實可能是機台 A 的某個參數,在特定的環境溫度下,表現特別差。這時候,如果你直接去調機台 A 的參數,搞不好問題沒解決,還會引發新的災難。

實際上怎麼做?看清楚你的「產生元」

在 2^k-p 的設計裡,要管理混淆,最關鍵的就是你的「產生元」(Generators)。產生元決定了哪些因子會跟哪些因子混淆。

舉個例子,假設我們要做一個 2^(5-2) 的設計,也就是有 5 個因子,但我們只跑 2^3 = 8 組實驗。這裡的「-2」就表示我們用了兩個產生元。

  1. 假設我們的產生元是 D = AB 和 E = AC。
  2. 這代表 D 因子會跟 AB 的交互作用混淆,E 因子會跟 AC 的交互作用混淆。
  3. 更進一步,如果你把 D = AB 和 E = AC 相乘,你會得到 DE = A^2BC = BC。這表示 DE 的交互作用會跟 BC 的交互作用混淆。

所以重點來了,你要知道你的產生元是什麼,然後去查它的「解析度」(Resolution)。解析度越高,代表你的主要因子或低階交互作用被混淆的程度越低。

  • 解析度 III:主要因子會跟二階交互作用混淆。
  • 解析度 IV:主要因子不會被混淆,但二階交互作用會跟二階交互作用混淆。
  • 解析度 V:主要因子和二階交互作用都不會被混淆。

坦白講,解析度 V 是最好的,但犧牲的實驗次數也最少。如果預算允許,通常會建議至少做到解析度 IV。

最常見的坑:想省又想準,結果兩頭空

我見過最常見的坑,就是大家在選設計的時候,只顧著省實驗次數,結果選了一個解析度只有 III 的設計。然後實驗結果出來,發現有個主要因子很顯著,就直接衝上去改參數。結果呢?良率沒提升,反而出了更多怪問題。

後來才發現,那個顯著的「主要因子」,其實是跟一個很關鍵的二階交互作用混淆了。你調整了主要因子,卻完全沒動到真正有影響的交互作用。這就像你頭痛醫頭,結果是腳痛引起的,當然沒用。

我們那次 Cpk 1.08 的案例,最後發現就是某個低解析度的設計,把機台 A 的一個參數跟環境濕度的交互作用混淆了。當天濕度特別高,導致那個參數的效應被放大,看起來像是機台 A 的問題。

今天能做的一件事

下次做 DOE,請先確認你的部分因子設計的「解析度」是多少。

想試試看?

文章裡提到的分析工具在 InsightFab 都可以直接用,上傳 CSV 即可分析。

前往工具頁面