5種工藝1000億晶體管Intel造出有史以來最複雜的芯片?
從歷史上看,英特爾將其積累的所有芯片知識用於推進摩爾定律,並將這些知識應用到其未來的CPU 中。如今,其中一些高級處理器將用於阿貢國家實驗室即將推出的“Aurora”超級計算機。
然而,要求苛刻的模擬和建模工作負載也能從GPU 加速中獲益匪淺。認識到這一不斷增長的需求,英特爾著手設計和構建迄今為止最複雜的GPU,並在非常緊迫的時間內完成。
這項努力的結果是,以前代號為“Ponte Vecchio”的英特爾Max 系列GPU將1000 億個晶體管和47 個區塊打包到五個工藝節點上。
除此之外,它們還包括兩項封裝創新,即EMIB 2.5D 和Foveros 3D 技術,以及將模塊堆疊在一起以獲得更高的處理器密度。
英特爾Max 系列GPU 產品經理Duke Tallam 表示:“英特爾Max 系列GPU 的開發週期非常緊湊,因此將其變為現實就像挑戰我們的團隊一年蓋房子,明年建造摩天大樓。”
“迄今為止,GPU 是我們最複雜的處理器,代表了英特爾矽產品的巨大飛躍。然而,整個封裝可以放在一個人的手掌中。”
眾多創新將MAX 系列GPU 推向市場
Max 系列GPU 的巨大復雜性需要全球英特爾團隊成員的支持。在俄勒岡州和亞利桑那州的工廠完成技術開發過程後,矽片被運往英特爾在檳城的製造工廠進行大批量生產。
不過,要達到那個階段,需要創造性的解決方案,因為英特爾需要對其製造過程進行多次修改。首先,英特爾將芯片晶圓互連的間距縮小到36μm,大約是人類頭髮的寬度。
這是Intel 晶圓廠或工廠成功使用過的最細粒度的pitch。
英特爾工廠還開發了一種在工廠生產線上測試裸片的新方法——稱為單一堆疊裸片測試( SSD T)。SSDT 確保在添加其他昂貴的組件(如基板和高帶寬內存(HBM) 芯片)之前,只有功能正常的芯片才能在製造過程中向前推進。
該公司還找到了一種將管芯焊接到封裝上的新方法,將工藝能力提高了50%。最後,該小組開發了先進的晶圓級組裝工藝,將可靠性提高了十倍。
除了GPU 的技術複雜性之外,驗證過程還涉及在最少數量的樣本GPU 上完成矽前測試的挑戰。
因此,該團隊不再依賴物理樣本進行測試,而是轉向虛擬模擬來展示虛擬芯片在真實場景中的表現。在其他地方,工程師採用其他創造性方法來加速測試過程,例如在從事該項目的許多團隊成員之間運行並行工作流的方法。
當被問及在兩年內將GPU 推向市場所需的巨大努力時,英特爾的Tallam 提出了他的觀點。
“我們在製造處理器方面擁有半個多世紀的經驗,但設計GPU 的複雜性和性能要求需要我們過去的所有知識和技能。”
Tallam 繼續說道,“Max 系列GPU 有助於彌合當今已經令人難以置信的HPC 系統與世界上少數能夠或將要達到exascale 級性能的系統之間的差距。
因此,我們以意大利佛羅倫薩著名的橋樑命名GPU 似乎是正確的。
Max 系列GPU 橋既美觀又功能非凡。我們的團隊對更小規模的GPU 也有同樣的看法。”
這些數據中心GPU 與新推出的Intel Xeon CPU Max 系列處理器的綜合能力將加速工作負載,從而在比以前更短的時間內揭示有價值的結果。阿貢國家實驗室是Max 系列的首批採用者之一。
其團隊計劃部署60,000 個Max 系列GPU,平均分配給10,000 個服務器刀片。
每個刀片還將依靠兩個Intel Xeon CPU Max 系列處理器(這些是帶有HBM 內存的“Sapphire Rapids”Xeons SP)來最大化Aurora 的架構,以應對一些有史以來最重要的科學工作負載。
一旦ANL 在其旗艦Aurora 系統上部署完整的Max 系列GPU 和CPU,其雙精度計算性能將超過2 exaFLOPS。
研究人員已經計劃將所有計算能力用於一些最具挑戰性的科學問題,例如宇宙建模、推進基於聚變的安全能源解決方案、幫助實現醫學突破或更精確地預測颶風。
這些GPU 代表了英特爾雄心勃勃的多年IDM 2.0 產品領導、創新和長期客戶價值戰略的核心組成部分。
匯集一切
去年11 月,馬來西亞的檳城組裝與測試(PGAT) 員工慶祝了首批60,000 個GPU 的製造。馬來西亞擁有英特爾最大的組裝和測試製造工廠,由四家工廠組成。
檳城組裝與測試(PGAT) 工廠經理Wong Mei Fong 在她28 年的英特爾職業生涯中經歷了很多挑戰。儘管如此,與GPU 的1,500 名團隊成員的複雜性和協調性相比,它們都相形見絀。
PGAT 需要用通常與這種規模的項目相關的一半時間來滿足生產需求。為了使這一切成為可能,其他團隊和工廠也支持這項工作。
“該產品的眾多複雜性是無與倫比的。由於時間緊迫,我們面臨的嚴峻挑戰變得更加困難,”Mei Fong 說。“儘管存在這些障礙,我們在合作夥伴組織的寶貴幫助下實現了最初看似不可能的目標。”
寶貴的教訓
從開發和製造GPU Max 系列中獲得的綜合經驗為未來的生產流程帶來了新的見解,這將加速即將推出的處理器的交付。Tallum 指出,“我們對最新的處理器版本感到興奮,我們很自豪有機會為實現突破性科學儘自己的一份力量。”