那天 CPK 報告出來,全場沉默了三秒
還記得好幾年前,我們機台突然出了一批貨,CPK 掉到 1.08,DPMO 瞬間飆到 6210。那數字一出來,會議室裡所有人都僵住了,尤其製造的那個小陳,臉都綠了。老闆眉頭一皺,問說:「前段製程參數有沒有監控?是不是哪個值跑掉了?」當下,負責前段的學弟立馬拉出一堆報表,指著其中一個參數的 SPC 圖,上面寫著「跟後段 A 參數相關係數高達 0.85」,然後就信誓旦旦地說:「老闆,你看!前段這個參數明明在管制內啊,而且跟後段的相關性這麼高,應該不是我們的問題吧?」
問題出在哪
說實話,聽到學弟這樣講,我差點翻白眼。這就是我們工程師最常犯的錯誤之一:「相關性很高,所以一定是相關參數導致的」。你是不是也常常覺得,兩個參數之間只要統計上的相關係數很高,那就代表一個是另一個的因果?坦白講,這根本就是把「相關」跟「因果」搞混了。相關性,只是表示兩個變數的趨勢可能一致或相反,但它不會告訴你「為什麼」會這樣,更不會告訴你「誰」是因、「誰」是果。
舉個例,你每天早上吃早餐,然後去上班。吃早餐這件事跟上班這件事,在你的日常生活中幾乎是 100% 相關的,但你會說吃早餐「導致」你上班嗎?當然不會啊!你上班是因為你公司在等你,你吃早餐只是為了填飽肚子。所以重點是,相關性高,可能只是兩者同時受到某個「隱藏的第三變數」影響,或者根本就是巧合。
實際上怎麼做
所以遇到像上面 CPK 掉下來這種鳥事,你不能光看相關係數就下定論。
你應該要這樣思考:
換句話說,你得去了解 製程物理機制。這個 B 參數,在物理上、化學上,真的會影響到 A 參數的表現嗎?它的變動範圍,會不會真的造成 A 參數的品質變差?很多時候,我們看到相關係數很高,但實際上,那個 B 參數的變動,根本不足以讓 A 參數的 CPK 掉這麼多。可能它只是跟 A 參數同步受到機台溫度或壓力的小波動影響,但那個波動本身是良性的,不至於讓產品變差。
最常見的坑
我見過最常見的坑,就是工程師為了趕著交報告,找一堆「高相關性」的參數來解釋,結果繞了一大圈,根本沒找到真兇。
有一次,我們遇到 wafer 邊緣的膜厚異常。學弟拉出報表,發現跟某個 process chamber 的溫度相關性高達 0.9。他興沖沖地說:「一定是溫度!溫度有在管制內,但波動幅度變大了!」結果我們去查了那個 chamber 的溫度紀錄,發現雖然有波動,但那個波動幅度在製程容許範圍內,根本不足以造成膜厚的異常。最後呢?我們才發現是 chamber 裡的 gas flow sensor 故障了,導致實際 gas flow 跟設定值有偏離,但因為溫度跟 gas flow 物理上有些連動,所以才出現了高相關性。你看,如果只看相關性,根本就錯失了真兇。說穿了就是,相關性只是線索,不是證據。
今天能做的一件事
下次看到「高相關係數」,請先問自己:「這兩者之間,物理上或化學上真的有因果關係嗎?」