第三大CPU架構RISC-V進入超算表現可圈可點
一個歐洲大學生團隊組裝出第一台能夠平衡功耗和性能的RISC-V 超級計算機。更重要的是,它展示了RISC-V 在高性能計算方面的巨大潛力,為歐洲擺脫對美國芯片技術的依賴提供了機會。“Monte Cimone”集群不會很快用於處理大規模的天氣模擬等,因為它只是一台實驗機器。
這台設備由博洛尼亞大學和意大利最大的超級計算中心CINECA 的人員構建,六節點集群設計,旨在展示除浮點能力之外的各種HPC 性能元素。
它使用SiFive 的Freedom U740 片上系統RISC-V 的電源模塊,這個2020 年推出的SoC 有五個64 位RISC-V CPU 內核——四個U7 應用程序內核和一個S7 系統管理內核——2MB 二級緩存、千兆以太網以及各種外圍設備和硬件控制器。
它可以運行在大約1.4GHz頻率,以下是Monte Cimone 的組件以及速度:
六台雙板服務器,外形尺寸為4.44 厘米(1U) 高、42.5 厘米寬、40 厘米深。每塊板都遵循行業標準Mini-ITX 外形尺寸(每170 毫米170 毫米);
每塊主板配備一個SiFive Freedom U740 SoC 和16GB 的64 位DDR 內存,運行速度為1866s MT/s,以及一個運行速度為7.8 GB/s 的PCIe Gen 3 x8 總線、一個千兆以太網端口和USB 3.2 Gen 1 接口;
每個節點都有一個M.2 M-key 擴展槽,由操作系統使用的1TB NVME 2280 SSD佔用。每塊板上都插有一張microSD 卡,用於UEFI 啟動;
每個節點內部集成了兩個250 W 電源,以支持硬件和未來的PCIe 加速器和擴展板。
每個節點的俯視圖,顯示了兩個SiFive Freedom SoC 板
Freedom SoC 主板本質上是SiFive 的HiFive Unmatched 主板。正如大多數超級計算機使用的那樣,六個計算節點中的兩個配備了Infiniband 主機通道適配器(HCA)。目標是部署56GB/s Infiniband 以允許RDMA 實現I/O 性能。
這對於一個年輕的架構來說是雄心勃勃的,而且並非沒有一些小問題。
“供應商目前僅支持PCIe Gen 3 通道,”集群團隊寫道。“第一個實驗結果表明,內核能夠識別設備驅動程序並掛載內核模塊來管理Mellanox OFED 堆棧。由於尚未確定軟件堆棧和內核驅動程序的不兼容性,我們無法使用HCA 的所有RDMA 功能。
儘管如此,我們還是成功地在兩個板之間以及一個板和一個HPC 服務器之間運行了IB ping 測試,表明完全支持Infiniband 是可行的。
”事實證明,HPC 軟件堆棧比人們想像的要容易。“我們在Monte Cimone 上移植了在生產環境中運行HPC 工作負載所需的所有基本服務,即NFS、LDAP 和SLURM 作業調度程序。將所有必要的軟件包移植到RISC-V 相對簡單。
該集群最終將成為這將為進一步測試RISC-V 平臺本身及其與其他架構良好配合的能力鋪平道路,這是一個重要元素因為至少在未來幾年內我們不太可能看到百億億級的RISC-V 系統。
現在,就連英特爾也在關注RISC-V的未來。