那天產線停了,老闆問我:「你怎麼知道是燒掉的?」
你還記得前幾個月,隔壁組那個小王嗎?他那批新的量產晶片,在測試站一直出狀況。一開始以為是電性問題,結果燒機燒到一半,突然有個批次的良率直接掉到 85%,Cpk 值只有 1.08,DPMO 竟然高達 6210。老闆氣到臉都綠了,直接衝到小王座位旁邊,指著那疊不良品問:「你怎麼知道是燒掉的?說清楚!」小王支支吾吾半天,講不出個所以然。其實,這時候老闆想聽的,就是有沒有好好做熱應力分析啦。
說穿了,就是想知道你的晶片會不會熱死
你是不是也遇過類似的狀況?晶片設計再屌,製程再精準,如果最後散熱沒搞好,燒機燒一燒就掛了,那一切都是白搭。說穿了,熱應力分析的目的,就是想預測你的晶片在實際運作環境下,會不會因為溫度太高而提早「GG」。我們常聽到的什麼「熱阻網絡模型」啊、「θJA 計算」啊,坦白講,就是一套幫你評估晶片散熱能力的方法。它不是什麼玄學,就是一套讓你用數字說話的工具。
實際上怎麼算 θJA,其實沒那麼難
你可能會想,這些東西聽起來很專業,是不是要很複雜的軟體才能算?其實不然。最簡單的 θJA(Junction-to-Ambient Thermal Resistance,結點到環境的熱阻)計算,你用高中物理的概念就能理解。
- 先量出你的 TJ (Junction Temperature):也就是晶片核心的溫度。通常我們會用熱電偶或紅外線熱像儀去量測,或是在晶片內部設計溫度感測器。假設我們量到 Tj 是 105°C。
- 量測 Ta (Ambient Temperature):這是環境溫度,通常就是你測試設備周圍的空氣溫度。假設我們量到 Ta 是 25°C。
- 量測 Pd (Power Dissipation):晶片消耗的功率。這部分可以從你的產品規格書上找到,或者用電壓電流表實測。假設 Pd 是 5 瓦。
有了這些數據,θJA 其實就是:
θJA = (Tj - Ta) / Pd
所以,用上面的例子,θJA = (105°C - 25°C) / 5W = 80°C / 5W = 16°C/W。
換句話說,這個晶片每消耗 1 瓦的功率,晶片核心溫度會比環境溫度高 16°C。這個值越小,代表散熱能力越好,晶片越不容易熱死。
最常見的坑:忽略了真實世界
我跟你說,最常犯的錯誤,就是大家只看數據,忘了真實世界有多複雜。當年我剛進公司的時候,有個前輩就是這樣。他把晶片放在一個全密閉的測試箱裡量 θJA,算出來的數字漂亮到不行。結果產品一上市,放到客戶的機櫃裡,機櫃裡面因為通風不良,環境溫度飆高到 50°C,結果晶片溫度直接衝破 120°C,良率慘不忍睹,被客戶罵到臭頭。
所以重點是,你量測的環境條件,一定要盡可能模擬真實產品的使用情境。不能只在實驗室的「完美世界」裡測試。還有,熱阻網絡模型不只θJA,還有θJC (Junction-to-Case)、θJB (Junction-to-Board) 等等,這些都是針對不同散熱路徑的考量,你都要根據實際的封裝和散熱設計去選擇適當的參數。說實話,這些數值都是要跟封裝廠、散熱模組供應商緊密合作才能拿到的。
今天能做的一件事
回去看看你們的產品可靠度報告,熱應力分析的數據齊全嗎?