國內系統首次奪冠“鵬城雲腦II”獲世界IO500排行榜冠軍
在世界超算界的頂級盛會SC20期間,多名國際專家聯合發布了新一期IO500榜單。鵬城實驗室等單位聯合研製的“鵬城雲腦II”分別以7043.99和1129.75的得分,位居IO500總榜榜首和10節點榜單榜首。這是國內系統首次佔據該榜單榜首位置。
據了解,在大規模算力系統設計中,存儲系統的性能日益受到關注。IO500榜單是高性能計算領域針對存儲性能最權威的世界排行榜之一。自2017年11月開始,IO500榜單在高性能計算領域的頂級會議(美國的SC和德國的ISC大會)上發布。
為證明“鵬城雲腦II”項目的世界級先進算力,鵬城實驗室、清華大學和華為技術有限公司共同開展IO500測試工作。對系統軟硬件性能進行了極限測試,包括數據帶寬BW(GiB/S)和元數據性能MD(KIOP/S)兩大部分,需要具有各種規模下的良好擴展性和穩定性。
本次“鵬城雲腦II”的存儲系統基於清華大學計算機系開發的超算緩存文件系統MadFS研製,針對“鵬城雲腦II”的硬件特徵,提出了基於RUST語言的高可擴展並發訪問、大粒度數據緩存/旁路訪問、數據訪問/落盤流水化、零拷貝極速RPC處理技術等創新方法。
IO500的兩項桂冠反映了“鵬城雲腦II”面向實際應用的設計原則。不但全系統得分四倍於上屆冠軍,實現大幅度超越,在小規模數據吞吐的10節點榜單上,得分也超過上屆冠軍近一半,成為首個10節點得分超過1000分的系統。這意味著對於各種規模的人工智能應用,“鵬城雲腦II”均能提供世界領先的數據吞吐能力和頂級算力。據悉,“鵬城雲腦II”於2020年10月建成試運行,擁有超過1000P OPS的人工智能算力,即將服務於從基礎研究到產業賦能的廣泛領域。
公開資料顯示,“鵬城雲腦Ⅱ”系統的AI計算子系統包含4096顆AI處理器,提供理論上1E OPS FP16和2E OPS INT8的AI運算能力。通用算力由基於ARM架構的2048顆CPU組成,每個CPU提供不少於0.49T Flops的通用算力。