歐洲LUMI超算新進展:代碼移植與開源調優仍在繼續2022年中上線
位於芬蘭的LUMI 超級計算機仍在組裝過程中,但項目團隊已經介紹了他們的最新進展。據悉,由AMD 提供技術支撐的這套裝置,一共有2560 個計算節點。每個節點包括一枚64 核心的Trento CPU、以及四路Instinct miMI250X GPU 加速卡。
按照原計劃,擁有375+ PFLOPs 算力的LUMI 超算本該在2021 年底前上線。但受供應鏈短缺的挑戰,最新目標已設定在2022 年中期全面上線。
雖然硬件仍處於組裝過程中,但高性能計算(HPC)工程師一直在努力優化開源Linux 軟件堆棧。
作為CSC 的首席HPC 科學家,Georgios Markomanolis 曾於去年2 月發表過一次很棒的演講。
期間提到了Radeon Open eCosystem 的現狀,以及他們經手的所有移植工作—— 包括讓傳統上以NVIDIA 為中心的HPC 工作負載,也能夠在那時的AMD測試硬件上工作。
早期規劃使用的是Instinct MI100 GPU 加速卡,但LUMI 也在等待MI250X 的落地成熟。
(圖via Phoronix)
在上週末的FOSDEM 2022大會期間,Georgios Markomanolis 又分享了他們在過去一年的開源軟件工作新進展。
可知HPC 工程師們已經對面向GPU 計算的AMD ROCm 開源軟件堆棧使用得更加技術純熟。
同時繼續在HIP 上努力將更多CUDA 代碼庫移植到AMD GPU 支持軟件中。
然後努力對代碼進行微調,以便在AMD 硬件上順暢運行。
而在過去一年裡被添加到工具包中的新軟件組件,值得一提的就包括AMD 的GPUFort 開源項目。
其旨在幫助開發者將OpenACC 和CUDA Fortran 代碼,遷移到以AMD 為主的架構中。
儘管相關工作仍相當複雜,但通過將相關代碼庫移植到AMD ROCm 空間,應用程序可獲得最佳的GPU 性能表現。
最後,對LUMI 上線運營的具體事務感興趣的朋友,可移步至FOSDEM.org查閱更多正在進行CSC 開源移植和調優工作。