英特爾詳解Ponte Vecchio Xe HPC GPU A0晶片設計
在 2021 架構日活動期間,英特爾詳細介紹了 Ponte Vecchio A0 的晶片設計。 考慮到英特爾長期缺乏獨立顯卡方面的經驗,Ponte Vecchio 可算是該公司一項雄心勃勃的登月計劃。 現在看來,由Raja Koduri和 Masooma Bhaiwala 帶領的這支開發團隊,著實給我們帶來了不少驚喜。
(圖 via WCCFTech)
對於英特爾公司的投資者們來說,Ponte Vecchio 有助於其在 HPC GPU 市場搶佔更多的份額。
Raja Koduri 手裡拿著的,就是 Ponte Vecchio A0 晶片。
2021 架構日活動期間,英特爾還坦承已掃清 Xe HPC 架構上市前的最後一道障礙。
上圖中的藍色和綠色線條,分別指代了英特爾 Xe 和競爭對手(或許是英偉達)。 隨著 Ponte Vecchio 在 2021 年的橫空出世,英特爾在 HPC GPU 領域也實現了重大的超越。
英特爾透露,在打造 Ponte Vecchio 的設計過程中,他們幾乎對所有部分都進行了重新設計和重組。
據悉,Ponte Vecchio 封裝中包含了 47 塊「瓦片」,且各個瓦片可能基於不同的代工廠(比如 Intel 自家或台積電)。
顯然,這需要極高的封裝工藝作為支撐,才能最終讓 Ponte Vecchio 成為一個有”凝聚力”的整體。
Folsom 團隊已經測量了 45 TFLOPs 的 FP32 輸送量、5 TBps 的顯存頻寬、以及 2 TBps 的連接頻寬,以驗證 A0 晶片的所有部分都如預期般正常工作,並且有望為圖形領域的重大突破做出貢獻。
以 Resnet 基準測試為例,英特爾已經證明瞭 A0 Ponte Vecchio 晶片可打破世界紀錄。
此外英特爾 Xe HPC 將提供 1 個或 2 個堆疊設計,且 Xe Link 鏈路將用於在多個子系統中連結 Ponte Vecchio 。
與 Xe HPG 不同的是,Ponte Vecchio GPU 中的 Xe HPC 內核,擁有 8 個向量引擎(512 位)和 8 個矩陣引擎(4096 位)。
很明顯,英特爾似乎已經邁過了圖形技術停滯不前的低谷,並在高性能圖形計算領域迎來了突飛猛進般的重大進展。
值得一提的是,規劃中的 Aurora 超算,也將使用該公司的 Ponte Vecchio GPU 加速卡。
該公司甚至搬出了一個 Aurora Blade 刀片元件,無數的 Aurora Blade 單元將可組合成為一個超算集群。