邏輯斯迴歸在製造業：不良品預測模型

那天 CPK 報告出來，全場沉默了三秒

還記得好幾年前，我們產線一台新機台剛裝好，大家都滿心期待它能衝高產能。結果試產沒多久，良率就開始像溜滑梯一樣往下掉。最慘的是，我們跑完一批貨，主管叫我去看那份 Cpk 報告，上面數字是 1.08。會議室裡，除了空調聲，沒人說話。大家心裡都清楚，這數字根本是災難。老闆臉都綠了，直接問：「誰能告訴我，到底哪邊出包？」

問題出在哪？

說實話，良率低當然有很多原因。可能是機台參數跑掉、原料批次問題，甚至連溫濕度都會影響。但最頭痛的是，通常出問題的時候，我們已經生產了好多不良品。這就像你去看醫生，醫生說你生病了，然後才開始抽血、照X光，等你報告出來，可能都病入膏肓了。

所以，重點是什麼？我們需要的不是事後諸葛，而是能「預先」判斷哪批貨可能會出問題的模型。這時候，「邏輯斯迴歸」（Logistic Regression）就派上用場了。坦白講，它聽起來很學術，但說穿了就是一種分類器。它會根據你給的各種條件，判斷這批貨是「好品」還是「不良品」的機率。

想像一下，你把機台的溫度、壓力、時間，還有原物料的純度、供應商這些數據都丟給它。它會學著從這些數據裡抓出規律。當一個新的生產批次進來時，它就能給你一個「這個批次會出不良品的機率」。

實際上怎麼做？

要建立這種預測模型，你手邊一定要有歷史數據。這些數據至少包含：

各種製程參數：例如機台溫度、壓力、流量、轉速、時間。這些數字必須是可量化的。
原物料資訊：供應商、批號、原料檢測報告上的數值。
最終結果：這批貨是「良品」還是「不良品」。這就是你的目標變數。

把這些數據餵給邏輯斯迴歸模型去訓練。訓練完之後，你就可以拿它來預測了。舉個例子，如果你的模型吐出來，某個批次的良率只有 70%，那你的 DPMO（每百萬缺陷數）就是 300,000！這個數字高到嚇人。這時候，你就可以在還沒完全做完之前，就趕快停線檢查，而不是等貨都做完了才發現一堆報廢品。

所以重點是，這東西能幫你從一大堆參數裡，找出真正會影響良率的關鍵因子。它會告訴你，哪個參數對不良品發生的機率影響最大。

最常見的坑

我在導入這種模型的時候，最常踩到的坑有兩個：

數據品質超爛：很多時候，機台數據根本沒好好蒐集，或是缺東缺西。甚至有些參數根本沒人管，但又被記錄下來。這導致模型訓練出來的效果很差。記得，垃圾進，垃圾出（Garbage In, Garbage Out）。數據不好，模型再厲害也沒用。
以為模型能解決所有問題：模型只是工具，它給你一個機率，但不會直接告訴你為什麼不良品會發生。如果它預測良率低，你還是得回頭去檢查製程，找出根本原因。它只是幫你「縮小問題範圍」，不是魔法棒。

有一次，模型一直預測某個批次會出問題，但我們檢查參數都正常。後來才發現，是某個作業員習慣性會把一個閥門開到最大，導致瞬間流量過大。這個操作沒被記錄在任何參數裡，模型當然抓不到。這也提醒我，現場的「眉角」還是很重要。

今天能做的一件事

回去看看你們良率最差的產品線，然後把過去三個月的製程參數和良率數據找出來。