那天 PM 問我:「這東西能活多久?」我差點沒噎死
靠北,你各位在半導體廠混這麼久,有沒有遇過這種鳥事?PM 拿著一張漂亮的規格書,上面寫什麼「MTBF > 500,000 小時」,然後一臉正經地問你:「Leo,這東西真的能活這麼久嗎?」哇操,我當時心裡 OS:「你當我算命仙喔?」但嘴上還是要擠出個專業的笑容,心裡想著,這下好了,又要跟那堆 IEC 62380 的文件奮戰了。
問題出在哪?你的產品不是在實驗室長大的
說穿了,很多時候我們講的可靠度,都只停留在「理論值」。你設計出來的板子,在實驗室裡吹冷氣、喝咖啡,當然頭好壯壯。但一旦丟到客戶手上,什麼高溫、濕度、震動、電壓不穩,各種妖魔鬼怪都跑出來。
那 IEC 62380 是什麼?坦白講,它就是一份歐洲標準,專門教你怎麼「預測」電子系統的可靠度。它跟那些美軍標準(MIL-HDBK-217F)有點像,但又更進一步,考慮了更多實際運作的環境參數。簡單來說,它不是要你去「測」可靠度,而是要你去「算」可靠度,而且這個「算」還得把你的產品實際會遇到的惡劣環境考量進去。
所以重點是,你不能只顧著設計,還要預設你的產品會被客人「凌虐」。
實際上怎麼做?用數字說話,別再靠感覺
IEC 62380 其實就是一套很詳細的計算方法。它會把你的電子產品拆解成一個個零組件,像是電阻、電容、IC、PCB 等等。然後,針對每一個零組件,它會有一套「失效率」的模型。
舉個例子,假設你有一顆電容,在實驗室條件下,它的失效率是 0.001 次/百萬小時。但如果你的產品要在 85 度C 的環境下連續運作,那這個失效率肯定會往上飆。IEC 62380 就會給你一個「環境因子」去乘上這個基礎失效率。
換句話說,你必須:
- 列出所有零組件: 把你的 BOM 表拿出來,一個蘿蔔一個坑。
- 查詢基礎失效率: 這些數據通常來自零組件供應商的資料,或是標準手冊。
- 評估操作條件: 你的產品會在什麼溫度、濕度、電壓下工作?這些都要明確。
- 套用環境因子: 根據 IEC 62380 的表格,找出對應的環境因子,去修正你的失效率。
最後,把所有零組件的失效率加起來,你就會得到整個系統的預期失效率(λ)。然後再用 1/λ,你就能算出那個讓 PM 高潮的 MTBF 值。
比如說,我之前有個案子,算出來的 MTBF 只有 250,000 小時,PM 馬上跳起來。後來我們調整了幾個關鍵零件,把其中一顆在 75 度C 環境下工作的電晶體換成更耐高溫的型號,它的失效率從原來的 0.00002 次/小時降到 0.000008 次/小時。就這麼一個小小的調整,整個系統的 MTBF 瞬間拉到 400,000 小時。所以重點是,每個小零件都可能影響大局。
最常見的坑:忘記「環境」才是最大的殺手
說實話,我踩過最大的坑,就是一開始太相信「理論值」。有一次,我們設計了一個網路交換器,按照零件資料手冊算出來的 MTBF 高達 800,000 小時,那時候大家還在辦公室開香檳慶祝。結果呢?第一批貨出到客戶那邊,不到半年就陸續傳出故障。
後來我們深入分析才發現,客戶那邊的機房,散熱系統根本是個笑話,環境溫度長期在 45 度C 以上跑。我們當初預設是 25 度C,結果環境因子差了一大截!光是溫度這個變數,就把我們的 MTBF 砍掉一半以上。
所以說穿了,你不能只看 datasheet,你得去了解你的產品未來會被丟到什麼鬼地方去。
今天能做的一件事
把你的 BOM 表拿出來,圈出最貴的那三顆零組件,查查它們的「額定操作溫度」。