那天 CPK 報告出來,全場沉默了三秒
還記得好幾年前,我們產線一台新機台剛裝好,大家都滿心期待它能衝高產能。結果試產沒多久,良率就開始像溜滑梯一樣往下掉。最慘的是,我們跑完一批貨,主管叫我去看那份 Cpk 報告,上面數字是 1.08。會議室裡,除了空調聲,沒人說話。大家心裡都清楚,這數字根本是災難。老闆臉都綠了,直接問:「誰能告訴我,到底哪邊出包?」
問題出在哪?
說實話,良率低當然有很多原因。可能是機台參數跑掉、原料批次問題,甚至連溫濕度都會影響。但最頭痛的是,通常出問題的時候,我們已經生產了好多不良品。這就像你去看醫生,醫生說你生病了,然後才開始抽血、照X光,等你報告出來,可能都病入膏肓了。
所以,重點是什麼?我們需要的不是事後諸葛,而是能「預先」判斷哪批貨可能會出問題的模型。這時候,「邏輯斯迴歸」(Logistic Regression)就派上用場了。坦白講,它聽起來很學術,但說穿了就是一種分類器。它會根據你給的各種條件,判斷這批貨是「好品」還是「不良品」的機率。
想像一下,你把機台的溫度、壓力、時間,還有原物料的純度、供應商這些數據都丟給它。它會學著從這些數據裡抓出規律。當一個新的生產批次進來時,它就能給你一個「這個批次會出不良品的機率」。
實際上怎麼做?
要建立這種預測模型,你手邊一定要有歷史數據。這些數據至少包含:
- 各種製程參數:例如機台溫度、壓力、流量、轉速、時間。這些數字必須是可量化的。
- 原物料資訊:供應商、批號、原料檢測報告上的數值。
- 最終結果:這批貨是「良品」還是「不良品」。這就是你的目標變數。
把這些數據餵給邏輯斯迴歸模型去訓練。訓練完之後,你就可以拿它來預測了。舉個例子,如果你的模型吐出來,某個批次的良率只有 70%,那你的 DPMO(每百萬缺陷數)就是 300,000!這個數字高到嚇人。這時候,你就可以在還沒完全做完之前,就趕快停線檢查,而不是等貨都做完了才發現一堆報廢品。
所以重點是,這東西能幫你從一大堆參數裡,找出真正會影響良率的關鍵因子。它會告訴你,哪個參數對不良品發生的機率影響最大。
最常見的坑
我在導入這種模型的時候,最常踩到的坑有兩個:
- 數據品質超爛:很多時候,機台數據根本沒好好蒐集,或是缺東缺西。甚至有些參數根本沒人管,但又被記錄下來。這導致模型訓練出來的效果很差。記得,垃圾進,垃圾出(Garbage In, Garbage Out)。數據不好,模型再厲害也沒用。
- 以為模型能解決所有問題:模型只是工具,它給你一個機率,但不會直接告訴你為什麼不良品會發生。如果它預測良率低,你還是得回頭去檢查製程,找出根本原因。它只是幫你「縮小問題範圍」,不是魔法棒。
有一次,模型一直預測某個批次會出問題,但我們檢查參數都正常。後來才發現,是某個作業員習慣性會把一個閥門開到最大,導致瞬間流量過大。這個操作沒被記錄在任何參數裡,模型當然抓不到。這也提醒我,現場的「眉角」還是很重要。
今天能做的一件事
回去看看你們良率最差的產品線,然後把過去三個月的製程參數和良率數據找出來。