科學家開發多GPU結構晶圓計算機希望突破數據鏈路瓶頸
伊利諾伊大學香檳分校和加州大學洛杉機分校的科研團隊正在研發一台晶圓級計算機架構,其目標旨在構建多GPU芯片以芯片數據內連連接(interconnect)的高效計算系統,實現內部數據互連的速率和能效,突破數據鏈路導致的性能瓶頸。
超級計算機中通常將一個任務應用負載分散至單獨的印刷電路板的多GPU計算單元,這些GPU單元通過長途數據鏈路相互通信。數據鏈路成為了主要的瓶頸,因為它們的傳輸速度比芯片內部數據互連要慢得多。
此外,“芯片和印刷電路板的存在機械性的不匹配”。意味著這些處理器必須包含在芯片封裝內,但這些封裝在輸入/輸出次數上是有限制的。
綜合起來數據鏈路就會產生顯著的性能瓶頸。如果是在理想情況下,多GPU模塊間數據通信可以和芯片內部數據互連的速度/能效一樣高。
一種方法是把所有GPU都整合入同一塊矽晶圓的計算機,並且用芯片內連連接它們。從規模生產上來看這種方法不現實,如果整合40個GPU入一個晶圓就足夠製造工藝災難,很難保證如此規模項目中不存在某個製造瑕疵。
研究團隊採用了另一種方法:他們稱之為矽互連結構(SiIF)的新技術,使用通過質量測試的標準GPU芯片,並用緊密集成的SiIF結構更好地連接它們。從工程師的角度來看,其性能就是一個巨型的怪獸級GPU芯片,而非40個獨立GPU芯片並聯計算。
這種多GPU性能怪物的模擬計算速度提升19倍,並將綜合能耗和信號延遲的削減了140多倍。
伊利諾伊的計算機工程助理教授Rakesh Kumar和他的同事們已經開始建造晶圓級原型,有望在2月IEEE國際高性能計算機體系結構研討會上展示他們的研究成果。