歐洲LUMI超算新進展:代碼移植與開源調優仍在繼續2022年中上線
位於芬蘭的LUMI 超級計算機仍在組裝過程中,但項目團隊已經介紹了他們的最新進展。據悉,由AMD 提供技術支撐的這套裝置,一共有2560 個計算節點。每個節點包括一枚64 核心的Trento CPU、以及四路Instinct miMI250X GPU 加速卡。
![0.jpg](https://i0.wp.com/static.cnbetacdn.com/article/2022/0210/eaa95fc09caff7b.jpg?w=640&ssl=1)
按照原計劃,擁有375+ PFLOPs 算力的LUMI 超算本該在2021 年底前上線。但受供應鏈短缺的挑戰,最新目標已設定在2022 年中期全面上線。
雖然硬件仍處於組裝過程中,但高性能計算(HPC)工程師一直在努力優化開源Linux 軟件堆棧。
作為CSC 的首席HPC 科學家,Georgios Markomanolis 曾於去年2 月發表過一次很棒的演講。
期間提到了Radeon Open eCosystem 的現狀,以及他們經手的所有移植工作—— 包括讓傳統上以NVIDIA 為中心的HPC 工作負載,也能夠在那時的AMD測試硬件上工作。
早期規劃使用的是Instinct MI100 GPU 加速卡,但LUMI 也在等待MI250X 的落地成熟。
![1.jpg](https://i0.wp.com/static.cnbetacdn.com/thumb/article/2022/0210/9cf9900f63875fc.jpg?w=640&ssl=1)
(圖via Phoronix)
在上週末的FOSDEM 2022大會期間,Georgios Markomanolis 又分享了他們在過去一年的開源軟件工作新進展。
可知HPC 工程師們已經對面向GPU 計算的AMD ROCm 開源軟件堆棧使用得更加技術純熟。
同時繼續在HIP 上努力將更多CUDA 代碼庫移植到AMD GPU 支持軟件中。
然後努力對代碼進行微調,以便在AMD 硬件上順暢運行。
![2.jpg](https://i0.wp.com/static.cnbetacdn.com/thumb/article/2022/0210/41857f4d84ce54d.jpg?w=640&ssl=1)
而在過去一年裡被添加到工具包中的新軟件組件,值得一提的就包括AMD 的GPUFort 開源項目。
其旨在幫助開發者將OpenACC 和CUDA Fortran 代碼,遷移到以AMD 為主的架構中。
儘管相關工作仍相當複雜,但通過將相關代碼庫移植到AMD ROCm 空間,應用程序可獲得最佳的GPU 性能表現。
最後,對LUMI 上線運營的具體事務感興趣的朋友,可移步至FOSDEM.org查閱更多正在進行CSC 開源移植和調優工作。