在線量測（In-line Metrology）的取樣策略設計

那天 CPK 報告出來，全場沉默了三秒

還記得好幾年前，我們新製程剛上線，良率一直卡關。那時候大家每天都在追數據，壓力真的爆棚。有一次，PM 盯著線上量測的 CPK 報告，螢幕上亮眼的 1.08，大家突然安靜下來。這個數字說實話，離我們目標的 1.33 差了一大截。PM 臉色鐵青，直接問：「你們的量測數據真的能代表製程嗎？」這話一出，大家面面相覷，因為坦白講，我們對取樣策略的信心其實也不高。

問題出在哪？

說穿了，很多時候我們量測數據很好看，CPK 很高，DPMO 很低，結果良率卻一直拉不起來。為什麼？很簡單，你的數據可能只是「假象」。尤其是在線上量測（In-line Metrology）的世界裡，我們不可能每個產品都量。成本太高，時間太久，根本不實際。所以我們必須「取樣」。

這個「取樣」就是關鍵。如果你取樣的邏輯有問題，量到的數據就無法真實反映整個批次的狀況。就像你去超市買水果，只挑了最上面的三顆蘋果，結果回家發現底下都是爛的。這就是取樣偏差。在半導體廠，這會導致你以為製程很穩，結果產品送到客戶手上才發現問題，那真的會搞死人。

所以重點是：你的取樣策略，必須能夠有效地「代表」你整個批次的製程狀況，而不是只挑好的量，或是隨便量。

實際上怎麼做？

設計取樣策略，其實有幾個面向要考慮，我說幾個最常用的：

批次內變異 (Within-lot Variation)： 你的製程在同一個批次內，從第一片到最後一片，會不會有差異？例如有些設備在長時間運作後，溫度或壓力會有些微變化。如果你只量批次的前幾片，可能就忽略了後面的問題。這時候，你可能需要從批次的前、中、後各取幾片來量測，甚至考慮每隔幾片就量一片，比如「每 5 片量 1 片」。

晶圓內變異 (Within-wafer Variation)： 就算在同一片晶圓上，邊緣和中心點的製程表現也可能不同。舉個例子，如果你的蝕刻製程在晶圓邊緣有蝕刻不足的問題，但你只量測晶圓中心點，那你永遠不會發現。所以，在晶圓上取樣時，除了中心點，也要考慮邊緣、上下左右等不同位置。像我們常用的九點量測、五點量測就是為了解決這個。

製程穩定度 (Process Stability)： 如果你的製程超級穩定，CPK 常常破 2.0，DPMO 幾乎是 0，那你可以稍微降低取樣頻率。但如果製程像雲霄飛車，CPK 一下 1.08，一下又掉到 0.8，那你可能就要提高取樣頻率，甚至考慮 100% 量測。

舉個具體數字，假設一個批次有 25 片晶圓。如果你的製程穩定度不高，你可能就要採取「每 5 片量 1 片」的頻率，也就是一個批次量 5 片。然後每片晶圓再執行「9 點量測」，確保晶圓內的數據也夠全面。這樣一來，一個批次總共會產生 5 \* 9 = 45 個數據點。這些數據就能提供比較可靠的製程資訊。

最常見的坑

我見過最常見的坑，就是「沿用舊的取樣策略」。很多時候，新製程上線，大家直接把舊製程的取樣頻率和點位複製貼上。結果呢？舊製程可能已經跑了十年，穩定度極高，取樣頻率可以很低。但新製程剛起步，變數一大堆，你用舊的低頻率取樣，根本抓不到問題。

還有一個坑是「為了省錢而犧牲取樣」。量測機台很貴，量測時間也要錢，所以常常有人想盡辦法減少量測次數。結果就是，當良率出問題時，你手上的數據根本無法幫你判斷問題出在哪，反而浪費更多時間和金錢去 debug。

說實話，取樣策略的設計沒有標準答案，它就是一個在「成本」和「資訊完整度」之間的權衡。

今天能做的一件事

回去看看你現在的取樣策略，問自己：「這個策略真的能代表我的製程嗎？」