那天 CPK 報告出來,全場沉默了三秒
還記得好幾年前,我們機台的 Cpk 突然掉到 1.08。要知道,這在半導體廠根本是警報等級的數字。會議室裡,RD、製程、設備,大家面面相覷,氣氛凝重到像是空氣都結冰了。老闆臉色鐵青,只問一句:「問題出在哪?」你說,這時候我們能做的,就是把手邊所有能用的統計工具翻出來,試圖從一大堆數據裡找出那隻「搞鬼的」。Analyze 階段,說穿了就是「偵探辦案」,找出根本原因。
問題出在哪?
說白了,Analyze 階段的核心,就是從一堆看來相關又不相關的數據中,找到那個「真兇」。它不是讓你瞎猜,而是要你用科學方法,把所有可能的嫌疑犯(也就是「潛在因子」)都列出來,然後逐一排除,直到你找到那個真正導致問題的「根本原因」。這個階段,最怕的就是你憑感覺下結論,那根本不是解決問題,只是在「碰運氣」。
所以重點是,我們要用統計工具來「篩選」和「驗證」。當你的產品良率從 99.99% 變成 99.38% (換算下來 DPMO 從 100 飆到 6210),絕對不是什麼「偶發事件」,背後一定有規律。這時候,你會需要用到像是「直方圖」、「柏拉圖」、「散佈圖」這類的基礎工具,它們能幫你快速把數據「視覺化」,找出一些初步的「眉角」。
實際上怎麼做
當 Cpk 掉到 1.08,我們第一步通常會做「柏拉圖分析」。這玩意兒很簡單,就是把所有可能造成 Cpk 降低的缺陷模式,按照發生的頻率或影響程度由高到低排列。比如說,我們發現「膜厚不均」佔了 70% 的不良,再來是「顆粒」佔 20%,剩下的零星問題加起來才 10%。這時候,你就知道你的主要火力應該集中在解決「膜厚不均」這個問題上。
再來,我們會用「散佈圖」來檢視「膜厚不均」是否跟某些製程參數有關係。舉個例子,如果我們發現膜厚不均跟「機台腔體壓力」有明顯的負相關(壓力越高,不均越嚴重),那麼這就是一個很強的線索。如果更進一步,你想知道多個因子同時對結果的影響,甚至它們之間有沒有交互作用,那「迴歸分析」或「變異數分析 (ANOVA)」就會是你的好幫手。
換句話說,這些工具不是讓你一次梭哈,而是像一套組合拳。先用柏拉圖找出大方向,再用散佈圖或直方圖深挖個別因子,最後用迴歸或 ANOVA 驗證結論,確保你抓到的不是替死鬼。
最常見的坑
坦白講,我踩過最大的坑,就是「數據不足就下結論」。有一次,我們看到某個參數跟良率有點相關,就急著去改動。結果勒?改了之後,良率沒改善,反而把另一個看似不相干的參數搞壞了,造成更大的災難。後來才發現,當初收集的樣本數太少,數據噪音太大,導致我們誤判了相關性。
另一個常見的鳥事,就是「只看平均值,不看變異」。有時候,兩個製程的平均良率可能差不多,但其中一個製程的良率波動非常大,一下子很高,一下子很低。如果你只看平均值,就會錯失這個「變異大」的關鍵問題。所以,看數據不只要看「集中趨勢」(平均數、中位數),更要看「離散程度」(標準差、全距)。
說穿了,你不能只看數據表面,要深入理解數據背後的「故事」,才能避免這些低級錯誤。
今天能做的一件事
打開 Excel,把你最近的良率數據畫個柏拉圖吧!