InsightFab
知識庫/貝氏統計入門:先驗與後驗的直觀理解
統計分析6 分鐘閱讀

貝氏統計入門:先驗與後驗的直觀理解

嘿,跟你分享一篇超實用的文章!上次出貨 CPK 只有 1.08,老闆臉都綠了,大家都在猜到底是機台還是儀器出問題?這時候你是不是也常憑感覺判斷?這篇文章就用超白話的方式,教你怎麼在證據不足時,運用「先驗機率」來做判斷。它會跟你解釋,我們過去的經驗或「感覺」,其實就是統計學的先驗機率,讀完你會知道怎麼更科學地找出問題點,再也不用瞎猜啦!

那天 CPK 報告出來,全場沉默了三秒

還記得上次出貨前,新製程那批貨的 CPK 報告出來嗎?PM 看了臉都綠了,因為 CPK 只有 1.08,雖然「勉強」及格,但跟我們目標的 1.33 差了一大截。老闆當場臉就垮下來,問說:「到底是機台出問題,還是量測儀器飄了?」你知道的,這種時候大家都會先推給儀器飄移,然後才開始懷疑機台。但問題是,你怎麼知道哪個「可能性」比較大?

問題出在哪?

說白了,這種情況就是你在做判斷時,手上沒有足夠的「確切證據」。你可能心裡有個底,覺得某台機台之前就常常鬧脾氣,或是上次校驗完的儀器,感覺怪怪的。這些「感覺」或「過去經驗」,其實就是統計學裡說的「先驗機率」(Prior Probability)。它代表你在看到任何新數據之前,對於某件事發生的「信念」或「猜測」。

舉個例子,如果我們過去經驗顯示,機台出包的機率是 70%,儀器飄移的機率是 30%。這就是你的先驗。但現在,你手上有新的 CPK 數據 1.08。這個新的數據出來後,你會不會因此調整你對「機台出包」或「儀器飄移」的看法?會嘛!這調整後的看法,就是「後驗機率」(Posterior Probability)。

所以重點是,貝氏統計就是在教你,如何用「新的證據」(比如 CPK 1.08)來更新你「舊的信念」(對機台或儀器的看法),讓你做出的判斷更精準。它不是要你推翻舊的經驗,而是要你用新的資訊來修正它。

實際上怎麼做?

我們回到 CPK 1.08 的例子。假設你根據過往紀錄,有以下先驗資訊:

  1. 機台真的有問題的機率是 70%。
  2. 量測儀器飄移的機率是 30%。

再來,你還需要知道,在兩種情況下,出現「CPK 1.08」這種數據的可能性:

  1. 如果機台真的有問題,出現 CPK 1.08 的機率可能是 60%。(因為有問題通常會更慘,但有時會剛好卡在邊緣)
  2. 如果量測儀器飄移,出現 CPK 1.08 的機率可能是 80%。(儀器飄通常數據會變差,而且常飄到剛好卡邊緣)

有了這些,你就可以用貝氏定理來算「後驗機率」了。它會幫你算出:

  • 在「看到 CPK 1.08」這個前提下,「機台真的有問題」的機率。
  • 在「看到 CPK 1.08」這個前提下,「量測儀器飄移」的機率。

說穿了就是把「先驗機率」乘上「在各種情況下發生這個事件的機率」,然後正規化。這樣你就能得到,看到 CPK 1.08 後,哪種情況的機率變高了。你會發現,經過計算,儀器飄移的後驗機率會明顯高於機台問題的後驗機率。這表示,你應該優先去查儀器!

最常見的坑

我跟你講,最常見的坑就是「先入為主」。很多人拿到數據,腦袋裡早就想好是誰的鍋了。例如,某個班的良率突然掉了,DPMO 從 6210 變成 9800,第一時間就直覺是那個新來的 OP 搞砸了。這就是只憑「感覺」做事,沒有去評估「先驗機率」和「看到這個 DPMO 值時,各種可能性發生的機率」。

結果呢?花了一堆時間盯著新人,最後才發現是前一個班的工程師,在換料時順手調了一個製程參數,而且沒記錄下來!如果當時我們能冷靜下來,用貝氏的思維,去評估「新人犯錯」和「參數被改」這兩個事件的先驗機率,以及在 DPMO 9800 這個情況下,兩者各自發生的機率,搞不好早就查到是參數的問題了。

所以,別讓你的「直覺」完全主導你的判斷,它很重要,但也要有數據來修正。

今天能做的一件事

下次遇到問題,先想想你對原因的「第一印象」是什麼?這就是你的「先驗」。

想試試看?

文章裡提到的分析工具在 InsightFab 都可以直接用,上傳 CSV 即可分析。

前往工具頁面

同類別文章

常態分配假設的檢定:Shapiro-Wilk vs Anderson-Darling

欸,跟你說,最近看到一篇超實用的文章!它在講以前工廠良率很差,結果 CPK 報告出來,數據根本對不上 DPMO,全場傻眼。讀完你會知道,原來很多統計指標像 CPK 都有個大前提,就是你的數據得符合「常態分配」才準。如果數據不是常態,那些算出來的數字根本是白搭!所以啊,下次做分析前,記得先用 Shapiro-Wilk 檢定一下,才不會鬧出烏龍喔!

統計檢定力(Power):如何確保結論有意義

嘿,跟你分享一篇很有趣的文章!作者那天興高采烈拿著CPK從1.08進步到1.25的數據給老闆看,結果老闆一句「你確定這樣有差?」讓他瞬間語塞。 這篇文章超實用,它點出我們工程師常犯的錯誤——光看數據有變就急著下結論,卻沒考慮到那可能是隨機波動或樣本不足。裡面會教你怎麼用「統計檢定力」來證明你的結論夠不夠穩,讓你下次報告時,面對老闆的質疑也能自信滿滿!讀完你會知道怎麼讓你的數據說服力更強喔!

信賴區間的正確解讀:95% CI 不是你想的那樣

嘿,最近看到一篇超實用的文章!它從一個大家在開會時都可能遇過的尷尬情境說起:CPK 報告出來,PM 盯著 1.08 的數據和旁邊的「95% CI: 0.95-1.21」,問這到底是好是壞?然後大家就靜默了。讀完你會知道,我們平常對信賴區間的理解,尤其那個「95% 的機率落在這個區間」根本是錯的!這篇文會教你信賴區間的正確解讀方式,讓你以後看報表不再一頭霧水,超推!