InsightFab
知識庫/直方圖與常態機率圖:分配形狀的視覺判斷
統計分析6 分鐘閱讀

直方圖與常態機率圖:分配形狀的視覺判斷

欸,跟你分享一篇超實用的文章!作者從自己部門當年導入新機台、CPK 報告慘不忍睹的糗事說起,點出我們在看生產數據時,很容易只看數字、不看「分佈」。很多時候,光看 CPK 這種單一指標會被誤導,就算數字看起來還行,但如果數據分佈「歪七扭八」,那問題可就大了!讀完這篇,你會知道為什麼光看數字會騙人,以及數據「形狀」有多重要,保證讓你對品質管理有更深的理解!

那天 CPK 報告出來,全場沉默了三秒

還記得好幾年前,我們部門剛導入一台新機台,那時候大家都很興奮,想說產能又要噴發了。結果,試產完一跑 CPK 報告,螢幕上跳出一個 1.08 的數字,全場真的安靜了三秒。老闆的臉有點綠,我心想:「完了,這下不知道要被釘多久。」後來才知道,問題其實不在機台,而是我們根本沒搞懂「分配」這回事。那時候我還菜,現在回想起來,簡直是把生產數據當成排隊買雞排,只看隊伍長度,沒看隊伍排得好不好看。

問題出在哪?光看數字會騙人啦!

說穿了,很多時候我們看 CPK、DPMO 這些數字,就像在看成績單,只知道是好是壞,但不知道為什麼好,為什麼壞。你可能覺得 CPK 1.08 好像還有救,沒到慘不忍睹。但如果我跟你說,這個 1.08 是因為數據分佈「歪七扭八」造成的,你還會覺得沒事嗎?

所以重點是,光看單一數字會騙人!我們需要看到數據的「形狀」,也就是它的分佈狀況。這時候,直方圖 (Histogram) 跟常態機率圖 (Normal Probability Plot) 就是你的好朋友了。直方圖就是把你的數據分組,然後畫成長條圖,告訴你每個範圍的數據有多少。常態機率圖則更進階,它會幫你判斷你的數據是不是「常態分佈」。

換句話說,直方圖讓你看到數據長怎樣,是不是「中間高、兩邊低」的鐘形曲線。常態機率圖則像一個魔術鏡,如果數據點都乖乖地排在一直線上,那就代表你的數據很接近常態分佈。

實際上怎麼做?看圖說故事就對了!

  1. 直方圖:第一眼檢查。
* 假設你今天量測了一批 wafer 的厚度,你先把它們畫成直方圖。

* 如果長得像個對稱的「鐘形」,恭喜你,你的數據看起來很接近常態分佈。

* 如果像一邊高一邊低,或者出現兩個高峰(雙峰),那就要小心了!例如,我遇過有一次機台換了新程式,結果厚度分佈出現雙峰,才發現是新舊程式參數沒切乾淨,導致數據混在一起。這時候你的 DPMO 就算只有 6210,也可能藏著兩個完全不同的問題。

* 記住,直方圖一眼就能讓你看出端倪,是最直觀的工具。

  1. 常態機率圖:精準判斷。
* 直方圖讓你「感覺」是不是常態,常態機率圖則給你更明確的「證據」。

* 如果你把數據點畫上去,它們都緊密地圍繞在一條直線上,那就表示你的數據非常接近常態分佈。這時候計算出來的 CPK 或其他統計量才比較可信。

* 但如果數據點歪來扭去,或者形成 S 形曲線,那你的數據就不是常態分佈了。這時候,你就算算出了 CPK 1.08,這個數字的意義也會大打折扣,甚至會誤導你。

最常見的坑:數字迷思害慘你

我見過太多工程師,包括以前的我,只會看 CPK 報告上的數字,然後就直接下結論。有一次,一個機台參數明明設定沒問題,CPK 卻一直在 1.1 左右徘徊,大家都很納悶。後來我把數據拉出來畫常態機率圖,才發現數據點呈現明顯的 S 型。一追查,才發現是量測儀器在特定範圍內有「系統性誤差」,導致數據被拉偏了,根本不是機台本身的問題。

坦白講,如果你的數據不是常態分佈,你用常態分佈的公式去計算 CPK,那個結果根本就是「參考用」的,甚至會讓你做出錯誤的判斷。這就像你拿尺量身高,結果尺被你折彎了,量出來的數字當然不準。

今天能做的一件事

下次看到 CPK 或 DPMO 報告,記得順手把直方圖和常態機率圖也叫出來看一看。

想試試看?

文章裡提到的分析工具在 InsightFab 都可以直接用,上傳 CSV 即可分析。

前往工具頁面

同類別文章

常態分配假設的檢定:Shapiro-Wilk vs Anderson-Darling

欸,跟你說,最近看到一篇超實用的文章!它在講以前工廠良率很差,結果 CPK 報告出來,數據根本對不上 DPMO,全場傻眼。讀完你會知道,原來很多統計指標像 CPK 都有個大前提,就是你的數據得符合「常態分配」才準。如果數據不是常態,那些算出來的數字根本是白搭!所以啊,下次做分析前,記得先用 Shapiro-Wilk 檢定一下,才不會鬧出烏龍喔!

統計檢定力(Power):如何確保結論有意義

嘿,跟你分享一篇很有趣的文章!作者那天興高采烈拿著CPK從1.08進步到1.25的數據給老闆看,結果老闆一句「你確定這樣有差?」讓他瞬間語塞。 這篇文章超實用,它點出我們工程師常犯的錯誤——光看數據有變就急著下結論,卻沒考慮到那可能是隨機波動或樣本不足。裡面會教你怎麼用「統計檢定力」來證明你的結論夠不夠穩,讓你下次報告時,面對老闆的質疑也能自信滿滿!讀完你會知道怎麼讓你的數據說服力更強喔!

信賴區間的正確解讀:95% CI 不是你想的那樣

嘿,最近看到一篇超實用的文章!它從一個大家在開會時都可能遇過的尷尬情境說起:CPK 報告出來,PM 盯著 1.08 的數據和旁邊的「95% CI: 0.95-1.21」,問這到底是好是壞?然後大家就靜默了。讀完你會知道,我們平常對信賴區間的理解,尤其那個「95% 的機率落在這個區間」根本是錯的!這篇文會教你信賴區間的正確解讀方式,讓你以後看報表不再一頭霧水,超推!