InsightFab
知識庫/關聯製程參數的 SPC:相關性不等於因果
SPC
6 分鐘閱讀

關聯製程參數的 SPC:相關性不等於因果

欸!你是不是也常常以為,只要兩個數據有「高相關性」,就代表一個是另一個的「因果」?這篇文章根本就像在講我們工程師的日常!作者分享了他們機台CPK掉漆的慘痛經驗,當時大家也把鍋推給了高相關的參數。讀完你會知道,這種想法錯得多離譜,還有為什麼搞清楚「相關」跟「因果」的差別,對我們解決問題有多重要。快來看看,別再當個把相關性當因果的「傻」工程師啦!

那天 CPK 報告出來,全場沉默了三秒

還記得好幾年前,我們機台突然出了一批貨,CPK 掉到 1.08,DPMO 瞬間飆到 6210。那數字一出來,會議室裡所有人都僵住了,尤其製造的那個小陳,臉都綠了。老闆眉頭一皺,問說:「前段製程參數有沒有監控?是不是哪個值跑掉了?」當下,負責前段的學弟立馬拉出一堆報表,指著其中一個參數的 SPC 圖,上面寫著「跟後段 A 參數相關係數高達 0.85」,然後就信誓旦旦地說:「老闆,你看!前段這個參數明明在管制內啊,而且跟後段的相關性這麼高,應該不是我們的問題吧?」

問題出在哪

說實話,聽到學弟這樣講,我差點翻白眼。這就是我們工程師最常犯的錯誤之一:「相關性很高,所以一定是相關參數導致的」。你是不是也常常覺得,兩個參數之間只要統計上的相關係數很高,那就代表一個是另一個的因果?坦白講,這根本就是把「相關」跟「因果」搞混了。相關性,只是表示兩個變數的趨勢可能一致或相反,但它不會告訴你「為什麼」會這樣,更不會告訴你「誰」是因、「誰」是果。

舉個例,你每天早上吃早餐,然後去上班。吃早餐這件事跟上班這件事,在你的日常生活中幾乎是 100% 相關的,但你會說吃早餐「導致」你上班嗎?當然不會啊!你上班是因為你公司在等你,你吃早餐只是為了填飽肚子。所以重點是,相關性高,可能只是兩者同時受到某個「隱藏的第三變數」影響,或者根本就是巧合。

實際上怎麼做

所以遇到像上面 CPK 掉下來這種鳥事,你不能光看相關係數就下定論。

你應該要這樣思考:

  • 先確認「管制圖異常」的參數是哪一個? 像我們那個案例,後段 A 參數的 CPK 掉下來,那 A 參數才是你的主要目標。
  • 檢視 A 參數的管制圖是否有 Out of Control (OOC) 或 Out of Spec (OOS) 的點? 如果有,先處理那個點。
  • 如果 A 參數的管制圖都在管制內,但 CPK 還是變差了,才去考慮「潛在相關參數」。 這時候,你找到那個跟 A 參數相關性 0.85 的前段 B 參數,但你不能只看 B 參數的管制圖也都在管制內就鬆懈。
  • 換句話說,你得去了解 製程物理機制。這個 B 參數,在物理上、化學上,真的會影響到 A 參數的表現嗎?它的變動範圍,會不會真的造成 A 參數的品質變差?很多時候,我們看到相關係數很高,但實際上,那個 B 參數的變動,根本不足以讓 A 參數的 CPK 掉這麼多。可能它只是跟 A 參數同步受到機台溫度或壓力的小波動影響,但那個波動本身是良性的,不至於讓產品變差。

    最常見的坑

    我見過最常見的坑,就是工程師為了趕著交報告,找一堆「高相關性」的參數來解釋,結果繞了一大圈,根本沒找到真兇。

    有一次,我們遇到 wafer 邊緣的膜厚異常。學弟拉出報表,發現跟某個 process chamber 的溫度相關性高達 0.9。他興沖沖地說:「一定是溫度!溫度有在管制內,但波動幅度變大了!」結果我們去查了那個 chamber 的溫度紀錄,發現雖然有波動,但那個波動幅度在製程容許範圍內,根本不足以造成膜厚的異常。最後呢?我們才發現是 chamber 裡的 gas flow sensor 故障了,導致實際 gas flow 跟設定值有偏離,但因為溫度跟 gas flow 物理上有些連動,所以才出現了高相關性。你看,如果只看相關性,根本就錯失了真兇。說穿了就是,相關性只是線索,不是證據。

    今天能做的一件事

    下次看到「高相關係數」,請先問自己:「這兩者之間,物理上或化學上真的有因果關係嗎?」

    想試試看?

    文章裡提到的分析工具在 InsightFab 都可以直接用,上傳 CSV 即可分析。

    前往工具頁面

    喜歡這篇?訂閱週報

    每週一篇工程知識,SPC、CPK、製程改善實戰,直接寄到信箱。免費。

    無垃圾郵件,隨時可取消訂閱