Analyze 階段：根本原因分析的統計工具選用

那天 CPK 報告出來，全場沉默了三秒

還記得好幾年前，我們機台的 Cpk 突然掉到 1.08。要知道，這在半導體廠根本是警報等級的數字。會議室裡，RD、製程、設備，大家面面相覷，氣氛凝重到像是空氣都結冰了。老闆臉色鐵青，只問一句：「問題出在哪？」你說，這時候我們能做的，就是把手邊所有能用的統計工具翻出來，試圖從一大堆數據裡找出那隻「搞鬼的」。Analyze 階段，說穿了就是「偵探辦案」，找出根本原因。

問題出在哪？

說白了，Analyze 階段的核心，就是從一堆看來相關又不相關的數據中，找到那個「真兇」。它不是讓你瞎猜，而是要你用科學方法，把所有可能的嫌疑犯（也就是「潛在因子」）都列出來，然後逐一排除，直到你找到那個真正導致問題的「根本原因」。這個階段，最怕的就是你憑感覺下結論，那根本不是解決問題，只是在「碰運氣」。

所以重點是，我們要用統計工具來「篩選」和「驗證」。當你的產品良率從 99.99% 變成 99.38% (換算下來 DPMO 從 100 飆到 6210)，絕對不是什麼「偶發事件」，背後一定有規律。這時候，你會需要用到像是「直方圖」、「柏拉圖」、「散佈圖」這類的基礎工具，它們能幫你快速把數據「視覺化」，找出一些初步的「眉角」。

實際上怎麼做

當 Cpk 掉到 1.08，我們第一步通常會做「柏拉圖分析」。這玩意兒很簡單，就是把所有可能造成 Cpk 降低的缺陷模式，按照發生的頻率或影響程度由高到低排列。比如說，我們發現「膜厚不均」佔了 70% 的不良，再來是「顆粒」佔 20%，剩下的零星問題加起來才 10%。這時候，你就知道你的主要火力應該集中在解決「膜厚不均」這個問題上。

再來，我們會用「散佈圖」來檢視「膜厚不均」是否跟某些製程參數有關係。舉個例子，如果我們發現膜厚不均跟「機台腔體壓力」有明顯的負相關（壓力越高，不均越嚴重），那麼這就是一個很強的線索。如果更進一步，你想知道多個因子同時對結果的影響，甚至它們之間有沒有交互作用，那「迴歸分析」或「變異數分析 (ANOVA)」就會是你的好幫手。

換句話說，這些工具不是讓你一次梭哈，而是像一套組合拳。先用柏拉圖找出大方向，再用散佈圖或直方圖深挖個別因子，最後用迴歸或 ANOVA 驗證結論，確保你抓到的不是替死鬼。

最常見的坑

坦白講，我踩過最大的坑，就是「數據不足就下結論」。有一次，我們看到某個參數跟良率有點相關，就急著去改動。結果勒？改了之後，良率沒改善，反而把另一個看似不相干的參數搞壞了，造成更大的災難。後來才發現，當初收集的樣本數太少，數據噪音太大，導致我們誤判了相關性。

另一個常見的鳥事，就是「只看平均值，不看變異」。有時候，兩個製程的平均良率可能差不多，但其中一個製程的良率波動非常大，一下子很高，一下子很低。如果你只看平均值，就會錯失這個「變異大」的關鍵問題。所以，看數據不只要看「集中趨勢」（平均數、中位數），更要看「離散程度」（標準差、全距）。

說穿了，你不能只看數據表面，要深入理解數據背後的「故事」，才能避免這些低級錯誤。

今天能做的一件事

打開 Excel，把你最近的良率數據畫個柏拉圖吧！