那天 CPK 報告出來,全場沉默了三秒
還記得好幾年前,我們有個新產品導入,大家都盯著良率看。那時候測試站點的 CPK 報告出來,一個關鍵參數的 CPK 竟然只有 1.08,DPMO 高達 6210!PM 馬上跳起來,問這東西到底能活多久?會不會客戶剛裝上沒多久就掛掉?那時候大家面面相覷,因為我們根本沒做過完整的壽命測試,只憑著經驗說「應該沒問題啦」。結果呢?三個月後,客戶抱怨聲浪就來了,東西果然撐不久。從那時候開始,我們才真的開始重視「End-of-Life(EOL)分析」這件事。說實話,以前都是火燒屁股才想到要滅火。
問題出在哪
說穿了,EOL 分析就是要搞清楚你的產品到底能撐多久才「開始」出問題。不是指完全壞掉,而是指它性能開始明顯退化,到一個客戶無法接受的地步。我們常說「死期將至」,但在半導體廠,我們其實更關心「病入膏肓」的點在哪。
以前我們都只看「良率」,也就是東西出廠時是不是好的。但好的不代表永遠好,對吧?你的手機剛買來電池很好,用一年就開始噴電。產品也是一樣,隨著時間、溫度、電壓這些壓力因子的摧殘,它的電性表現會慢慢飄移,最後可能飄出規格線。EOL 分析就是要建立一個「退化模型」,去預測這個飄移的速度有多快,什麼時候會「飄出界」。
實際上怎麼做
最直接的作法,就是找一批產品,讓它在加速老化環境下「操到爆」。例如,把產品放在 125°C 的烤箱裡持續通電,然後每隔一段時間就拿出來量測它的關鍵電性參數。舉例來說,我們有個類比電路,輸出電壓的偏移量(offset voltage)是關鍵參數。我們假設新產品的偏移量都在 10mV 以內,但規格要求必須小於 20mV。
- 收集數據: 我們拿 50 顆產品,在 125°C、額定電壓下跑 1000 小時,每 100 小時量測一次 offset voltage。
- 建立模型: 你會發現,隨著時間增加,這個 offset voltage 會逐漸往上飄。你把這些數據畫成圖,通常會看到一條趨勢線,可能是線性的,也可能是指數型的。這個趨勢線就是你的退化模型。
- 預測壽命: 根據這個模型,你就可以預測,這顆產品大概在什麼時候,它的 offset voltage 會「飄過」20mV 這個規格線。假設我們算出來是在 2500 小時會飄過。
- 轉換成真實壽命: 別忘了,這是加速壽命,還得用阿倫紐斯方程式 (Arrhenius Equation) 或其他加速因子模型,把這個加速壽命轉換成在真實使用環境下的壽命。例如,如果我們加速因子是 10 倍,那 2500 小時的加速壽命,就代表在客戶端大約是 25000 小時(約 2.8 年)才會開始退化到影響功能。
所以重點是,你不能只看「現在好不好」,還要看「未來會不會壞」。
最常見的坑
我遇過最常見的坑,就是大家常常只做「失效分析」,而不是「退化分析」。意思是,等到東西壞了才去分析為什麼壞,而不是在它還沒壞的時候就預測它什麼時候會開始「變差」。
- 只測初期良率: 很多團隊只關心產品剛出廠時的良率,認為過了測試就萬事大吉。結果客戶用一陣子才發現根本不耐用。
- 選錯監控參數: 有時候工程師會選一個跟產品壽命退化不那麼相關的參數來監控。結果測半天,數據很漂亮,但產品還是該壞就壞。說穿了,你得找到那個真正會「變質」的關鍵指標。
- 加速模型亂用: 最慘的是,好不容易做了加速測試,結果在計算真實壽命的時候,隨便套一個加速因子。坦白講,每個產品、每種失效模式,它的加速因子都不一樣,不能一概而論。沒經過驗證的加速因子,算出來的壽命就是自己騙自己。
今天能做的一件事
找出一個你產品最關鍵的電性參數,開始監控它在加速老化下的趨勢。