InsightFab
知識庫/Box Plot 解讀:四分位距與離群值的識別
統計分析6 分鐘閱讀

Box Plot 解讀:四分位距與離群值的識別

欸,跟你說,這篇文超實用!有次產線CPK突然從1.35掉到1.08,大家臉都綠了,老闆也超火大。光看CPK這種單一數字,你只知道出問題,但完全不知道是哪裡出包!這篇作者就分享了,當時他們怎麼靠著「Box Plot」這個超神工具,一眼就看出問題點,成功救回生產線。讀完你會知道,遇到類似狀況時,除了CPK,還能用什麼方法快速抓出真兇,讓你在職場上超前部署!

那天 CPK 報告出來,全場沉默了三秒,然後我看到 Box Plot 救了我們

那天是個禮拜五下午,眼看就要下班了,突然產線那邊一個電話,說 L3 機台的 CPK 掉了,從 1.35 掉到 1.08,差點就破 1.0 了。我心想:「完了,週末肯定泡湯了。」老闆臉色一沉,直接把所有相關人叫進會議室。大家看著那張紅通通的 CPK 報表,一片死寂,有人開始低頭檢查製程參數,有人在看機台履歷。坦白講,CPK 掉一點點可能還好,但掉到快要 1.0,這代表良率可能開始往下噴了。

問題出在哪?光看平均值跟標準差真的不夠!

「CPK 掉到 1.08,很明顯就是製程變異變大了啊!」一個菜鳥同事小聲說。是啊,這沒錯,但問題是,變異變大有千百種原因。可能是機台突然抽風,可能是某個批次的料異常,也可能是操作員手抖。光看 CPK 這種單一數字,你只知道「有問題」,但不知道「問題在哪裡」。這時候,Box Plot(盒鬚圖)就超級好用。說穿了,它就是把你的數據攤開來給你看,不只看平均,還看分佈,特別是那些「怪咖」數據。

所以重點是:Box Plot 能讓你一眼看出數據的分佈狀況,包含中位數、四分位數,還有最關鍵的「離群值」。

實際上怎麼做?看懂這三條線和幾個點就夠了!

當你拿到一份 Box Plot,你得知道怎麼看。它通常有五個「數」,稱為「五數摘要」。

  1. 中位數 (Median):盒子中間那條線。它把數據分成兩半,一半比它大,一半比它小。這比平均數更抗異常值。
  2. 第一四分位數 (Q1):盒子的底部。代表 25% 的數據比它小。
  3. 第三四分位數 (Q3):盒子的頂部。代表 75% 的數據比它小。
  4. 四分位距 (IQR):Q3 減 Q1 的距離。它代表了中間 50% 數據的「寬度」,數據越集中,IQR 就越小。像我們那天 L3 機台的某個關鍵量測值,正常時候 IQR 大概是 0.05 毫米,但那天直接飆到 0.12 毫米,這就亮紅燈了!
  5. 上下限 (Whiskers):盒子兩邊伸出去的「鬍鬚」。這鬍鬚通常會延伸到 Q1-1.5*IQR 和 Q3+1.5*IQR 的範圍內。

所以重點是:這些線和點能告訴你數據的集中程度,以及有沒有特別「突出」的數值。

最常見的坑:看到點點就慌了?

那天在會議室,我馬上把 L3 機台的 Box Plot 叫出來。結果一堆點點在鬍鬚外面,散落在上下兩邊。這就是「離群值 (Outliers)」。

「哇,這麼多異常點!」新人小張驚呼。

「別急著慌。」我說,「離群值不一定就是壞事,但你一定要去檢查。」

我舉個例子:假設我們在量測一個晶圓的厚度。

正常情況下,厚度分佈應該蠻集中的。但如果 Box Plot 出現一堆在上面的離群點,這可能代表某幾片晶圓特別厚。我們那天 L3 機台的 Box Plot,就是出現一堆離群值在下限之外。這表示有幾批產品的量測值突然變得特別低,把整體的變異拉大了,導致 CPK 往下掉。一查,果然是某個批次的進料參數跑掉了,導致製程沒辦法達到穩定。如果只看 CPK,你只會看到「變異大」,但 Box Plot 直接告訴你:「有幾筆數據跟別人很不一樣!」

所以重點是:離群值是 Box Plot 的靈魂,它直接指向了你可能忽略的問題源頭。

今天能做的一件事

把你手邊的製程數據,先畫個 Box Plot 看看有沒有離群值。

想試試看?

文章裡提到的分析工具在 InsightFab 都可以直接用,上傳 CSV 即可分析。

前往工具頁面

同類別文章

常態分配假設的檢定:Shapiro-Wilk vs Anderson-Darling

欸,跟你說,最近看到一篇超實用的文章!它在講以前工廠良率很差,結果 CPK 報告出來,數據根本對不上 DPMO,全場傻眼。讀完你會知道,原來很多統計指標像 CPK 都有個大前提,就是你的數據得符合「常態分配」才準。如果數據不是常態,那些算出來的數字根本是白搭!所以啊,下次做分析前,記得先用 Shapiro-Wilk 檢定一下,才不會鬧出烏龍喔!

統計檢定力(Power):如何確保結論有意義

嘿,跟你分享一篇很有趣的文章!作者那天興高采烈拿著CPK從1.08進步到1.25的數據給老闆看,結果老闆一句「你確定這樣有差?」讓他瞬間語塞。 這篇文章超實用,它點出我們工程師常犯的錯誤——光看數據有變就急著下結論,卻沒考慮到那可能是隨機波動或樣本不足。裡面會教你怎麼用「統計檢定力」來證明你的結論夠不夠穩,讓你下次報告時,面對老闆的質疑也能自信滿滿!讀完你會知道怎麼讓你的數據說服力更強喔!

信賴區間的正確解讀:95% CI 不是你想的那樣

嘿,最近看到一篇超實用的文章!它從一個大家在開會時都可能遇過的尷尬情境說起:CPK 報告出來,PM 盯著 1.08 的數據和旁邊的「95% CI: 0.95-1.21」,問這到底是好是壞?然後大家就靜默了。讀完你會知道,我們平常對信賴區間的理解,尤其那個「95% 的機率落在這個區間」根本是錯的!這篇文會教你信賴區間的正確解讀方式,讓你以後看報表不再一頭霧水,超推!