那天 CPK 報告出來,全場沉默了三秒
還記得好幾年前,我們新製程剛上線,良率一直卡關。那時候大家每天都在追數據,壓力真的爆棚。有一次,PM 盯著線上量測的 CPK 報告,螢幕上亮眼的 1.08,大家突然安靜下來。這個數字說實話,離我們目標的 1.33 差了一大截。PM 臉色鐵青,直接問:「你們的量測數據真的能代表製程嗎?」這話一出,大家面面相覷,因為坦白講,我們對取樣策略的信心其實也不高。
問題出在哪?
說穿了,很多時候我們量測數據很好看,CPK 很高,DPMO 很低,結果良率卻一直拉不起來。為什麼?很簡單,你的數據可能只是「假象」。尤其是在線上量測(In-line Metrology)的世界裡,我們不可能每個產品都量。成本太高,時間太久,根本不實際。所以我們必須「取樣」。
這個「取樣」就是關鍵。如果你取樣的邏輯有問題,量到的數據就無法真實反映整個批次的狀況。就像你去超市買水果,只挑了最上面的三顆蘋果,結果回家發現底下都是爛的。這就是取樣偏差。在半導體廠,這會導致你以為製程很穩,結果產品送到客戶手上才發現問題,那真的會搞死人。
所以重點是:你的取樣策略,必須能夠有效地「代表」你整個批次的製程狀況,而不是只挑好的量,或是隨便量。
實際上怎麼做?
設計取樣策略,其實有幾個面向要考慮,我說幾個最常用的:
- 批次內變異 (Within-lot Variation): 你的製程在同一個批次內,從第一片到最後一片,會不會有差異?例如有些設備在長時間運作後,溫度或壓力會有些微變化。如果你只量批次的前幾片,可能就忽略了後面的問題。這時候,你可能需要從批次的前、中、後各取幾片來量測,甚至考慮每隔幾片就量一片,比如「每 5 片量 1 片」。
- 晶圓內變異 (Within-wafer Variation): 就算在同一片晶圓上,邊緣和中心點的製程表現也可能不同。舉個例子,如果你的蝕刻製程在晶圓邊緣有蝕刻不足的問題,但你只量測晶圓中心點,那你永遠不會發現。所以,在晶圓上取樣時,除了中心點,也要考慮邊緣、上下左右等不同位置。像我們常用的九點量測、五點量測就是為了解決這個。
- 製程穩定度 (Process Stability): 如果你的製程超級穩定,CPK 常常破 2.0,DPMO 幾乎是 0,那你可以稍微降低取樣頻率。但如果製程像雲霄飛車,CPK 一下 1.08,一下又掉到 0.8,那你可能就要提高取樣頻率,甚至考慮 100% 量測。
舉個具體數字,假設一個批次有 25 片晶圓。如果你的製程穩定度不高,你可能就要採取「每 5 片量 1 片」的頻率,也就是一個批次量 5 片。然後每片晶圓再執行「9 點量測」,確保晶圓內的數據也夠全面。這樣一來,一個批次總共會產生 5 \* 9 = 45 個數據點。這些數據就能提供比較可靠的製程資訊。
最常見的坑
我見過最常見的坑,就是「沿用舊的取樣策略」。很多時候,新製程上線,大家直接把舊製程的取樣頻率和點位複製貼上。結果呢?舊製程可能已經跑了十年,穩定度極高,取樣頻率可以很低。但新製程剛起步,變數一大堆,你用舊的低頻率取樣,根本抓不到問題。
還有一個坑是「為了省錢而犧牲取樣」。量測機台很貴,量測時間也要錢,所以常常有人想盡辦法減少量測次數。結果就是,當良率出問題時,你手上的數據根本無法幫你判斷問題出在哪,反而浪費更多時間和金錢去 debug。
說實話,取樣策略的設計沒有標準答案,它就是一個在「成本」和「資訊完整度」之間的權衡。
今天能做的一件事
回去看看你現在的取樣策略,問自己:「這個策略真的能代表我的製程嗎?」