摩爾線程國產GPU千卡集群完成30億參數大模型實訓

摩爾線程、無問芯穹聯合宣布，雙方已經正式完成MT-infini-3B 3B(30億參數)規模大模型的實訓，基於摩爾線程國產全功能GPU MTT S4000組成的千卡集群，以及無問芯穹的AIStudio PaaS平台。

這次實訓充分驗證了誇娥千卡智算集群在大模型訓練場景下的可靠性，同時也在業界率先開啟了國產大語言模型與國產GPU千卡智算集群深度合作的新範式。

據悉，這次的MT-infini-3B模型訓練總共用時13.2天，全程穩定無中斷，集群訓練穩定性達到100％，千卡訓練和單機相比擴展效率超過90％。

目前，實訓出來的MT-infini-3B性能在同規模模型中躋身前列，相比在國際主流硬體上(尤其是NVIDIA)訓練而成的其他模型，在C-Eval、MMLU、CMMLU等3個測試集上均實現性能領先。

無問芯穹正在打造「M種模型」與「N種晶片」之間的「M x N」中間層產品，實現多種大模型演算法在多元晶片上的高效、統一部署，已與摩爾線程達成深度戰略合作。

摩爾線程是第一家接入無問芯穹並進行千卡級別大模型訓練的國產GPU公司，誇娥千卡集群已與無穹Infini-AI順利完成系統級融合適配，完成LLama2 700億參數大模型的訓練測試。

T-infini-3B的訓練，則是業界首次實現基於國產GPU晶片從0到1的端到端大模型實訓案例。

就在日前，基於摩爾線程的誇娥千卡集群，憨猴集團也成功完成了7B、34B、70B不同參數量級的大模型分佈式訓練，雙方也達成策略合作。

經雙方共同嚴苛測試，相容適配程度高，訓練效率達到預期，精準度符合要求，整個訓練過程持續穩定。

WONGCW 網誌