InsightFab
知識庫/隨機化與區集:DOE 實驗順序的重要性
DOE6 分鐘閱讀

隨機化與區集:DOE 實驗順序的重要性

嘿,你實驗結果是不是也常跑出「意外」?這篇文章超像在講我的心聲!作者分享他以前把舊材料CPK從1.35搞到1.08,DPMO直接爆表的可怕經驗。結果發現,機器參數、SOP都沒問題,竟然是「實驗順序」在搞鬼!讀完這篇你會知道,很多時候實驗結果根本是被「隱藏變數」綁架了,像「時間」這種變數,一不小心就可能讓你的數據失真。強烈推薦,趕快看看你的實驗是不是也被綁架了!

那天 CPK 報告出來,全場沉默了三秒

還記得好幾年前,我們機台換了新材料,想看看對產品的電性表現有沒有影響。那時大家興沖沖地設計了一個 DOE,把新舊材料交叉跑了幾批,然後就等著看結果。結果,當 CPK 報告出來,舊材料的 CPK 竟然從原本的 1.35 掉到 1.08,DPMO 直接飆到 6210!全場安靜了三秒,我心想:「完了,這下要被釘在牆上了。」老闆的臉都綠了,質問到底是哪裡出問題。檢查了半天,設備參數沒變、操作SOP也沒錯,最後才發現,問題竟然出在「實驗順序」上。

問題出在哪?你的實驗是不是被「綁架」了?

說穿了就是,你以為你只是在測材料差異,但其實你的實驗結果可能被其他「隱藏變數」給綁架了。最常見的就是「時間」這個變數。你想想看,如果你把舊材料批次集中在早上跑,新材料批次集中在下午跑,那結果出來,你真的能說差異是材料造成的嗎?會不會其實是機台跑久了有溫升、人員換班造成操作手法差異,或者甚至是批次之間的環境變化?這時候,你的實驗結果就混雜了材料的效應和時間的效應,根本分不清楚。

所以重點是,當你在做 DOE 實驗時,一定要考慮「隨機化 (Randomization)」和「區集 (Blocking)」。隨機化就是把你的實驗執行順序打亂,不要讓某些因子固定在特定時段或特定條件下。區集則是在你知道某些變數無法避免,但又不想讓它影響你的主要因子分析時,把它獨立出來考慮。

實際上怎麼做?亂中有序才是王道

最簡單的方式,就是用亂數排一下實驗順序。假設你有 A、B 兩種材料,各跑三批,總共六批。如果你是 A1, A2, A3, B1, B2, B3 這樣跑,就很容易踩到時間的坑。但如果你用亂數產生器,排出一個像 B2, A1, B3, A3, B1, A2 這樣的順序,那時間對材料結果的影響就會被「平均掉」,比較不會出現單一方向的偏差。

舉個更實際的例子,像我們在驗證新製程參數時,常常會遇到機台只有一台。如果你的實驗設計是先跑完所有低溫的組合,再跑所有高溫的組合,那中間的機台溫升、耗材磨損等效應,就會被你誤認為是溫度造成的差異。這時候,你可以考慮把「溫度」這個因子進行區集。也就是說,在每個溫度條件下,都隨機化其他參數的順序。或者,把一天分成上午下午兩個區集,各自隨機化實驗順序,這樣就可以把一天內的變化與材料本身的影響分開來看。

最常見的坑:圖方便真的會掉坑

我遇過最扯的是,為了節省時間或人力,把同一天要跑的實驗,直接讓同一個工程師從頭跑到尾,然後下個班次再換另一個工程師跑下半段。結果數據出來,上半段跟下半段的結果像是兩回事。去查了才發現,兩個工程師的操作習慣有微妙差異,機台在連續跑了十幾個小時後,表現也開始飄移。這時候,如果你沒有隨機化,把這兩個「區塊」的效應混在一起,你會發現不管怎麼調參數,產品良率都像在坐雲霄飛車,完全搞不清楚哪個參數才是真正有影響的。說實話,貪圖一時的方便,最後往往要花十倍的時間去收拾殘局。

今天能做的一件事

下次 DOE 前,先花三分鐘用亂數排一下實驗順序。

想試試看?

文章裡提到的分析工具在 InsightFab 都可以直接用,上傳 CSV 即可分析。

前往工具頁面