InsightFab
知識庫/F 檢定:兩組變異數相等性的比較
統計分析6 分鐘閱讀

F 檢定:兩組變異數相等性的比較

欸,跟你推一篇超實用的文章!裡面在講,很多時候我們看數據,常常只顧著看平均值,覺得差不多就沒事。但其實啊,除了平均值要準,更重要的是「變異數」要夠小!作者用他當年工廠新機台跑出低到爆炸的 CPK 值當例子,超生動地解釋了為什麼只看平均值會有問題。讀完這篇,你會知道變異數有多重要,下次看報告或分析數據時,就知道要留意哪些「魔鬼細節」了!絕對顛覆你對數據的看法,快去看看!

那天 CPK 報告出來,全場沉默了三秒

還記得好幾年前,我們廠剛裝了一批新的高階量測機台,準備要導入量產。那時候產線大家都很期待,因為舊機台動不動就卡料,搞得大家火氣都很大。新機台裝好後,測試階段跑了一堆數據,我被叫去開會看報告。結果,當負責的工程師投影出那張 CPK 報告時,全場真的是沉默了三秒。CPK 值低到一個讓人想罵髒話的程度,產線主管的臉色直接垮下來。大家都開始碎碎念:「新機台不是說很穩嗎?」「是不是參數沒設好?」那時候,我心裡就有個底了,八成又是「變異數」在搞鬼。

問題出在哪?

說穿了,很多時候我們看數據,常常只看平均值,覺得平均值差不多就沒事。但實際上一條產線穩不穩,除了平均值要準,更重要的是「變異數」要小。想像一下,你今天開車,時速平均 60 公里很正常,但如果你的車速一下 20、一下 100,雖然平均是 60,但這樣開車是不是很危險?這就是變異數大的問題。

回到剛剛機台的例子,新機台的 CPK 爆掉,很大的原因就是它的量測結果「不穩定」,也就是變異數太大了。這時候,我們就需要 F 檢定來幫忙。F 檢定簡單來說,就是拿兩組數據的變異數來比較,看看它們是不是真的有顯著差異。用白話文解釋,它就是告訴你:「這兩批產品的品質穩定度,到底有沒有一樣?」

實際上怎麼做

F 檢定其實就是幫你比兩組數據的變異數。假設今天我們要比較新舊兩批材料的尺寸穩定度。

  1. 收集數據:
* 新材料批次 A:抽樣 30 個,量測尺寸得到一組數據。

* 舊材料批次 B:同樣抽樣 30 個,量測尺寸得到另一組數據。

  1. 計算變異數: 分別算出這兩組數據的變異數。你會得到一個 S^2_A 和一個 S^2_B。

  1. 計算 F 值: F 值就是兩組變異數的比值。通常我們會把變異數比較大的放在分子。
* 例如,如果 S^2_A 是 0.0025,S^2_B 是 0.0009。

* 那麼 F 值 = 0.0025 / 0.0009 ≈ 2.78。

  1. 查表或用軟體: 接著,你要根據你的「顯著水準」(通常是 0.05 或 0.01)和兩組數據的「自由度」(樣本數減 1),去查 F 分配表,或直接用統計軟體(Excel、Minitab 都行)跑出來一個 P 值。

  1. 判斷:
* 如果 P 值 小於 0.05(你設定的顯著水準),那就代表兩組的變異數「有顯著差異」。換句話說,這兩批材料的穩定度就是不一樣,你需要找出原因。

* 如果 P 值 大於 0.05,那麼恭喜你,兩組變異數「沒有顯著差異」,代表它們的穩定度是差不多的。

那天新機台的例子,我們就用 F 檢定去比較了它在不同參數設定下的量測結果變異數。結果發現,某個參數設定下的變異數,跟我們過去驗證過很穩定的機台比起來,F 值大到一個誇張,P 值幾乎是 0。這就鐵證如山地證明:新機台在這個參數設定下,量測結果確實不穩。

最常見的坑

說實話,我踩過最大的坑,就是以為數據越多越好。以前剛進公司,每次遇到問題,就拚命叫產線多跑一點數據,覺得樣本數夠大,結果一定準。但 F 檢定有個小眉角,它對數據的「常態性」很敏感。如果你兩組數據,其中一組或兩組都不是常態分佈,你硬去跑 F 檢定,結果可能就會失真。

記得有一次,我們在比較不同供應商提供的化學藥品批次穩定性。我抓了兩批藥品,每批都取了 100 個樣品去測試濃度。跑了 F 檢定,P 值是 0.001,超顯著,想說終於抓到供應商品質不穩了。結果後來被資深學長打槍,他叫我先跑常態分佈檢定,才發現其中一批藥品的濃度數據是偏態的,根本不符合常態分佈。這樣就不能直接用 F 檢定,得改用其他非參數檢定。所以,別急著跑 F 檢定,先確認你的數據是不是常態分佈,這很重要!

今天能做的一件事

打開 Excel 或 Minitab,找兩組你手邊的生產數據,跑一下 F 檢定,看看 P 值是多少。

想試試看?

文章裡提到的分析工具在 InsightFab 都可以直接用,上傳 CSV 即可分析。

前往工具頁面

同類別文章

常態分配假設的檢定:Shapiro-Wilk vs Anderson-Darling

欸,跟你說,最近看到一篇超實用的文章!它在講以前工廠良率很差,結果 CPK 報告出來,數據根本對不上 DPMO,全場傻眼。讀完你會知道,原來很多統計指標像 CPK 都有個大前提,就是你的數據得符合「常態分配」才準。如果數據不是常態,那些算出來的數字根本是白搭!所以啊,下次做分析前,記得先用 Shapiro-Wilk 檢定一下,才不會鬧出烏龍喔!

統計檢定力(Power):如何確保結論有意義

嘿,跟你分享一篇很有趣的文章!作者那天興高采烈拿著CPK從1.08進步到1.25的數據給老闆看,結果老闆一句「你確定這樣有差?」讓他瞬間語塞。 這篇文章超實用,它點出我們工程師常犯的錯誤——光看數據有變就急著下結論,卻沒考慮到那可能是隨機波動或樣本不足。裡面會教你怎麼用「統計檢定力」來證明你的結論夠不夠穩,讓你下次報告時,面對老闆的質疑也能自信滿滿!讀完你會知道怎麼讓你的數據說服力更強喔!

信賴區間的正確解讀:95% CI 不是你想的那樣

嘿,最近看到一篇超實用的文章!它從一個大家在開會時都可能遇過的尷尬情境說起:CPK 報告出來,PM 盯著 1.08 的數據和旁邊的「95% CI: 0.95-1.21」,問這到底是好是壞?然後大家就靜默了。讀完你會知道,我們平常對信賴區間的理解,尤其那個「95% 的機率落在這個區間」根本是錯的!這篇文會教你信賴區間的正確解讀方式,讓你以後看報表不再一頭霧水,超推!