那天老闆問我 DVT 測了什麼,我冷汗直流
那天下午,產線突然停了。不是那種小問題,是整個產線。老闆衝過來,臉色鐵青,直接問我:「那批貨 DVT 到底測了什麼?怎麼會出這種事?」我心裡涼了半截,因為那批貨的 DVT 報告,我只記得是『過』,但細節早就忘光了。老闆看我一臉茫然,補了一句:「連 DVT 怎麼規劃都搞不清楚,怎麼當工程師?」媽的,當場想找個地洞鑽下去。這故事告訴我們,驗證測試的規劃,真的不是『有測就好』,而是要『測到點上』。
問題出在哪?不是『測』,是『亂測』
很多時候,我們做 DVT (Design Verification Test)、EVT (Engineering Verification Test) 甚至 PVT (Production Verification Test),都只是把 spec 上的項目拉出來,然後照著跑一遍。跑完,過了,就覺得沒事了。但說穿了,如果只是這樣,那產品出包根本是遲早的事。為什麼?因為你可能沒考慮到真實世界的使用情境,或根本沒把關鍵的可靠度風險點找出來。你只是在做『測驗』,而不是『驗證』。兩者差一個字,但意義差很大。
所以重點是,驗證測試的規劃,不是看你測了多少項目,而是看你測對了多少風險點。
實際上怎麼做?找到你的「魔鬼」
要規劃可靠度驗證測試,我會建議你這樣做:
- 先盤點所有『可能』會壞的地方:產品的結構、材料、電路設計、軟體功能,甚至包裝方式。把這些都列出來,然後問自己:「這個地方在什麼情況下會出問題?」例如,一個新設計的電源模組,我會想它在高溫、低溫、濕度大的環境下會不會掛?長時間運轉會不會有漂移?
- 找出關鍵失效模式 (Failure Mode):這是第一步的延伸。想像一下,如果這個產品真的壞了,它會怎麼壞?是燒掉?斷線?功能異常?例如,你做一個手機晶片,失效模式可能是高溫下頻率不穩定,或是長時間使用後功耗飆高。
- 定義測試條件與標準:這是最關鍵的一步。你不能說「測到壞掉就好」。你必須設定一個明確的標準。舉個例子,我們之前有個產品,要求在高溫 85°C 環境下,連續運轉 1000 小時,Cpk 必須達到 1.33 以上。如果只達到 Cpk 1.08,就算沒壞,也代表製程能力不夠穩,我會直接打掉重練,而不是只看它『有沒有壞』。又或者,我們規定在震動測試後,產品的 DPMO (Defects Per Million Opportunities) 不能超過 6210 ppm,也就是百萬分之 6210 的機會會出錯。這比單純的 Pass/Fail 更能看出產品的強韌度。
換句話說,你要像個偵探,去找出產品裡面的「魔鬼」,然後設計一個「陷阱」來抓住它。
最常見的坑:『別人有測,我們也要測』
我真的看過太多工程師,拿著競爭對手的產品驗證報告,或只是聽說某個客戶特別重視某項測試,然後就照單全收。結果呢?花了一堆時間金錢,測了一堆不痛不癢的項目,真正會出問題的地方卻沒測到。
說實話,每個產品都有它獨特的風險。盲目跟風,不如花時間好好分析自己的產品。有一次,我們開發一個新的光學模組,照著舊產品的測試項目跑。結果出貨後,客戶抱怨在高濕環境下,鏡片會起霧。回頭檢討才發現,舊產品沒有高濕度的應用,所以沒規劃相關測試,但新產品卻會。這就是典型的『別人有測,我們也要測』,然後忘記思考自己的產品特性。
這個坑,說穿了就是懶惰。懶得分析,懶得思考。
今天能做的一件事
重新檢視你最近一份驗證計畫,問自己:「這個測試,是為了證明什麼?」