散熱問題,困住晶片大廠
將晶片嵌入堆疊晶片組件會產生散熱問題,從而降低這些設備的可靠性和使用壽命,隨著晶片製造商開始將晶片塞入帶有更薄基板的先進封裝中,這個問題變得越來越嚴重。過去,幾乎所有這些複雜的設計都用於嚴格控制的環境,例如大型資料中心,透過將部分運算轉移到不同的伺服器刀片或機架,可以快速解決過熱問題。但這些堆疊的晶片組件現在正進入安全至關重要的應用,例如汽車感測器和心臟起搏器,這些應用中可用的選擇較少。
從根本上講,可靠性受熱循環的影響,因此每次打開晶片時,它都會加熱、冷卻、膨脹和收縮,但當晶片被緊密閉合時,冷卻時間可能會顯著延長。
英飛凌科技公司物聯網、計算和工業MCU 高級總監Ketan Dewan 表示:“熱管理絕對必要。如果管理不當,可能會導致性能損失、運行不可靠、設備故障和系統成本增加。”
更糟糕的是,許多此類設備都涉及不同的材料。「你要處理的是差異膨脹,」 Ansys產品行銷總監Marc Swinnen 指出。“如果你拿一塊金屬,加熱一端而不加熱另一端,你的晶片就會彎曲和變形。”
翹曲會破壞各種運算元件和基板之間的連接,迫使訊號重新路由並降低效能。與熱相關的應力也可能造成熱失控,連接變得非常熱,導致凸塊熔化或改變電路行為。後一種影響可能導致參數漂移,在這種情況下,晶片最初可能按預期工作,但最終不再符合其最初定義的參數。因此,設備在發佈時可能看起來沒有問題,但幾個月後就會出現異常或完全失效。
分立元件更加隔離,但它們也不能免受熱問題的影響。 「它們可能會產生熱量,但由於晶片位於基板上,所以熱量有地方可以散發,所以散熱會容易一些,」西門子EDA的Calibre nmDRC 應用產品管理總監John Ferguson 表示。 “當你堆疊東西時,事情會變得更加困難。並排放置還不算太糟,但你可以跨邊界進行互動。”
物理問題可能會變得更加複雜,這取決於佈局和與其他電路的接近程度。
例如,汽車感測器可能受到熱量和振動的影響,這取決於它們的位置,這意味著熱應力和機械應力都會成為問題。
「當你談論嵌入式系統時,不僅僅是元件本身產生的熱量,還有鄰近元件產生的熱量,」Swinnen 說。 「它嵌入在某個東西中,然後它旁邊的東西也會產生熱量,所以你的晶片會突然產生一股熱量,這與你正在做的事情無關。是隔壁的晶片變熱了,但你的溫度上升了,看起來好像是你的晶片在發熱。
封裝層面的異質性增加了設計上的複雜性。「從歷史上看,熱分析的方式是,封裝中的晶片不僅被視為均勻的材料,而且被視為均勻的溫度,」Ferguson 說。 「但這種觀點未能涵蓋相互作用的全部複雜性。晶片是熱量產生的源頭,但它們也可能是熱量的受害者。如果你在封裝層面考慮這個問題,那麼抓住這一點很重要。”
然而,即使設計師意識到了這些問題,在嵌入式設備中緩解這些問題並不容易。 Cadence 產品管理總監Melika Roshandell 表示:「例如,對手機而言,熱分析非常重要,因為你不能在手機中放置散熱器。此外,手機沒有風扇,當你把它放在耳邊時,你肯定不希望它燙傷你的臉。的傳導和輻射分析來確定閾值。
即使可以使用風扇等傳統冷卻解決方案,也可能不是理想選擇。「風扇會造成電氣幹擾,但這只是次要問題,」 Flex Logix執行長Geoff Tate 表示。 「風扇最大的問題除了體積大、噪音大之外,就是容易損壞。如果風扇壞了,冷卻系統就會崩潰。所以現在問題大了。當你添加更多晶體管,晶體管運行速度更快時(這是每個人都希望的),就會消耗更多電量。你需要安裝一個散熱器,散熱器會覆蓋整個大散熱器。它放在室外環境中。
但問題不止於此。事實上,根據環境的不同,情況可能會變得更糟。「客戶可能會說,『它必須能在室外使用,我們在鳳凰城,那裡的溫度是125°F,』」泰特說。 「或者它必須在加拿大埃德蒙頓-40°F 的環境下工作。你必須能夠在很寬的溫度範圍內工作,所以你必須設計你的晶片,弄清楚它的所有部件,對封裝和冷卻進行熱分析,並了解客戶將如何使用它。多的電量,而你無法消散它。升到這個水平,但我希望它能更高一些。 ‘這很快就會變得非常複雜。
即使在鳳凰城這樣的條件下,設備也可以放置在受控環境中,例如監控空調商店的攝影機。但設計師也必須考慮客戶是否會始終遵守這些規範,以及要留多少空間。畢竟,即使是最好的HVAC 系統也有可能出現故障,或者原本應該放在陰影角落的傳感器可能會被移到靠近大窗戶的地方,從而受到陽光直射的加熱。
環境考慮
此類環境不確定性,加上許多嵌入式設備使用的關鍵情況,可能導致保守的設計和封裝選擇。這包括在較舊的製程節點上開發晶片/小晶片,以獲得經過驗證的可靠性,以及挑戰性較低的組裝選項。這些選擇也可能受到責任問題以及工程問題的影響。 「我看到合約中有更多的法律術語,」弗格森觀察到。
對於嵌入式設備,工程問題通常與人類安全問題重疊。 「如果你有一個醫療器械,你把它放入人體,它會發熱,這會對人體造成什麼影響?」弗格森問道。 “或者更糟的是,如果人體承受壓力,從而產生熱量,這會影響包裝嗎?你需要更加保守和謹慎,考慮到如何處理這些東西。”
想想熱管理不佳的起搏器會發生什麼。 「心律調節器的使用壽命應該超過10 年,」英飛凌的Dewan 說。 “但如果嵌入式設備沒有進行熱管理,嵌入式設備的漏電和功耗可能在不到10 年的時間內就需要更換電池。”
即使在體外,也需要極其謹慎。汽車產業已經制定了ISO 26262,這是一項由12 部分組成的安全標準,規定了汽車電子產品的最佳實踐。遵守ISO 26262 的要求為克服熱問題提供了更令人信服的理由,此外還有一個簡單的經濟事實:設備越熱,在採用冷卻解決方案上需要花費的錢就越多。
解決方案
有幾種方法可以緩解先進封裝中的熱問題。從EDA 的角度來看,首選方法是在設計週期的早期解決這些問題,使用實際工作負載進行廣泛的模擬和原型設計。這越來越多地涉及使用數位孿生。
「首先要考慮晶片的放置位置,」西門子的Ferguson 說。 “你能否更好地選擇放置位置,以免過多的熱量集中在一個區域?下一階段將著眼於芯片本身。有什麼辦法可以散熱?如果你無法移動任何東西,如何散熱?”
對於嵌入式設備,還有額外的考量。 「解決方案必須再修改一下,」Ferguson 說。 「你可以在封裝中採用各種形式的冷卻,例如散熱器。你可以在頂部放置TIM(熱界面材料)來幫助冷卻。如果你將一個晶片放在另一個晶片之上,那麼底部晶片可能會加熱頂部晶片。
從多物理角度來看,與所有其他電子模擬相比,熱模擬的最大差異在於需要有限元素網格。 「這是一個體積網格,而不是表面網格,因為熱量在表面的三個方向上流動,」Ansys 的Swinnen 說。 “利用設備的體積網格,您可以模擬功率如何擴散,以及環境溫度如何侵入您的系統並擴散到整個系統。”
結論
散熱問題是設計中一個長期且日益嚴重的問題。「對於某些設備來說,散熱問題一直存在,但這不是晶片設計師需要處理的問題,因為封裝設計師會在最後階段處理它,」Swinnen 指出。 「你對可以使用的功率有一個概念,如果結果顯示功率稍高,沒有人會因為功率過高而放棄晶片。功率曾被視為軟性指標,但現在它已成為頭號問題。散熱與功率直接相關,但兩者是兩碼事。意味著它們更難冷卻。設計正在考慮液體冷卻和全浸沒等想法,但(在嵌入式設備中)只有有限的幾個問題可以通過這種方式解決。
最終,解決困擾嵌入式和分立設備的散熱問題可能需要新材料(如玻璃基板)和對現有組件的新思維。「從歷史上看,我們根深蒂固地認為我們需要盡可能快的互連,」 Ferguson 說,「但我們是否可以選擇對熱敏感度較低的互連——可能是像TSV 這樣的寬垂直連接? 我們需要弄清楚的部分是權衡。率,這可能會產生更多的熱量。