InsightFab
知識庫/邏輯斯迴歸在製造業:不良品預測模型
統計分析6 分鐘閱讀

邏輯斯迴歸在製造業:不良品預測模型

嘿,跟你推薦這篇!它在講以前工廠機台良率超低,Cpk 報告出來只有 1.08,整個會議室都嚇傻了,老闆臉都綠了。那時候,他們發現常常要等不良品都做出來了才發現問題,根本是「事後諸葛」。讀完你會知道,他們後來怎麼用一個叫「邏輯斯迴歸」的模型,來預先判斷哪批貨可能會出包,這樣就能在問題發生前就處理,超實用!如果你也好奇怎麼用資料科學解決實際問題,這篇很值得看喔!

那天 CPK 報告出來,全場沉默了三秒

還記得好幾年前,我們產線一台新機台剛裝好,大家都滿心期待它能衝高產能。結果試產沒多久,良率就開始像溜滑梯一樣往下掉。最慘的是,我們跑完一批貨,主管叫我去看那份 Cpk 報告,上面數字是 1.08。會議室裡,除了空調聲,沒人說話。大家心裡都清楚,這數字根本是災難。老闆臉都綠了,直接問:「誰能告訴我,到底哪邊出包?」

問題出在哪?

說實話,良率低當然有很多原因。可能是機台參數跑掉、原料批次問題,甚至連溫濕度都會影響。但最頭痛的是,通常出問題的時候,我們已經生產了好多不良品。這就像你去看醫生,醫生說你生病了,然後才開始抽血、照X光,等你報告出來,可能都病入膏肓了。

所以,重點是什麼?我們需要的不是事後諸葛,而是能「預先」判斷哪批貨可能會出問題的模型。這時候,「邏輯斯迴歸」(Logistic Regression)就派上用場了。坦白講,它聽起來很學術,但說穿了就是一種分類器。它會根據你給的各種條件,判斷這批貨是「好品」還是「不良品」的機率。

想像一下,你把機台的溫度、壓力、時間,還有原物料的純度、供應商這些數據都丟給它。它會學著從這些數據裡抓出規律。當一個新的生產批次進來時,它就能給你一個「這個批次會出不良品的機率」。

實際上怎麼做?

要建立這種預測模型,你手邊一定要有歷史數據。這些數據至少包含:

  1. 各種製程參數:例如機台溫度、壓力、流量、轉速、時間。這些數字必須是可量化的。
  2. 原物料資訊:供應商、批號、原料檢測報告上的數值。
  3. 最終結果:這批貨是「良品」還是「不良品」。這就是你的目標變數。

把這些數據餵給邏輯斯迴歸模型去訓練。訓練完之後,你就可以拿它來預測了。舉個例子,如果你的模型吐出來,某個批次的良率只有 70%,那你的 DPMO(每百萬缺陷數)就是 300,000!這個數字高到嚇人。這時候,你就可以在還沒完全做完之前,就趕快停線檢查,而不是等貨都做完了才發現一堆報廢品。

所以重點是,這東西能幫你從一大堆參數裡,找出真正會影響良率的關鍵因子。它會告訴你,哪個參數對不良品發生的機率影響最大。

最常見的坑

我在導入這種模型的時候,最常踩到的坑有兩個:

  1. 數據品質超爛:很多時候,機台數據根本沒好好蒐集,或是缺東缺西。甚至有些參數根本沒人管,但又被記錄下來。這導致模型訓練出來的效果很差。記得,垃圾進,垃圾出(Garbage In, Garbage Out)。數據不好,模型再厲害也沒用。
  2. 以為模型能解決所有問題:模型只是工具,它給你一個機率,但不會直接告訴你為什麼不良品會發生。如果它預測良率低,你還是得回頭去檢查製程,找出根本原因。它只是幫你「縮小問題範圍」,不是魔法棒。

有一次,模型一直預測某個批次會出問題,但我們檢查參數都正常。後來才發現,是某個作業員習慣性會把一個閥門開到最大,導致瞬間流量過大。這個操作沒被記錄在任何參數裡,模型當然抓不到。這也提醒我,現場的「眉角」還是很重要。

今天能做的一件事

回去看看你們良率最差的產品線,然後把過去三個月的製程參數和良率數據找出來。

想試試看?

文章裡提到的分析工具在 InsightFab 都可以直接用,上傳 CSV 即可分析。

前往工具頁面

同類別文章

常態分配假設的檢定:Shapiro-Wilk vs Anderson-Darling

欸,跟你說,最近看到一篇超實用的文章!它在講以前工廠良率很差,結果 CPK 報告出來,數據根本對不上 DPMO,全場傻眼。讀完你會知道,原來很多統計指標像 CPK 都有個大前提,就是你的數據得符合「常態分配」才準。如果數據不是常態,那些算出來的數字根本是白搭!所以啊,下次做分析前,記得先用 Shapiro-Wilk 檢定一下,才不會鬧出烏龍喔!

統計檢定力(Power):如何確保結論有意義

嘿,跟你分享一篇很有趣的文章!作者那天興高采烈拿著CPK從1.08進步到1.25的數據給老闆看,結果老闆一句「你確定這樣有差?」讓他瞬間語塞。 這篇文章超實用,它點出我們工程師常犯的錯誤——光看數據有變就急著下結論,卻沒考慮到那可能是隨機波動或樣本不足。裡面會教你怎麼用「統計檢定力」來證明你的結論夠不夠穩,讓你下次報告時,面對老闆的質疑也能自信滿滿!讀完你會知道怎麼讓你的數據說服力更強喔!

信賴區間的正確解讀:95% CI 不是你想的那樣

嘿,最近看到一篇超實用的文章!它從一個大家在開會時都可能遇過的尷尬情境說起:CPK 報告出來,PM 盯著 1.08 的數據和旁邊的「95% CI: 0.95-1.21」,問這到底是好是壞?然後大家就靜默了。讀完你會知道,我們平常對信賴區間的理解,尤其那個「95% 的機率落在這個區間」根本是錯的!這篇文會教你信賴區間的正確解讀方式,讓你以後看報表不再一頭霧水,超推!