摩爾線程MTT S4000組成千卡集群「誇娥」可訓練千億參數大模型

2024-04-02 Comments 0 Comment

近日，無問芯穹發布了「無穹Infini-AI」大模型開發與服務平台，並宣布與摩爾線程達成深度策略合作。無穹Infini-AI基於無問芯穹的智算雲平台，可服務生成式大模型的多種場應用落地，為應用開發者提供高性能、易上手、安全可靠的大模型服務，覆蓋從大模型開發到大模型服務化部署的全流程。

目前，無穹Infini-AI已支援百川Baichuan2、ChatGLM2、ChatGLM3、ChatGLM3閉源模型、Llama2、Qwen、Qwen1.5等系列模型共20多個模型。

摩爾線程是第一家接入無問芯穹並成功完成千卡級別大模型訓練的國產GPU公司，「誇娥」(KUAE)集群已經與無穹Infini-AI順利完成了系統級融合適配，並完成了LLama2 700億參數大模型的訓練測試。

「誇娥」叢集則是基於雙路八卡GPU伺服器MCCX D800，每個節點有八塊MTT S4000 GPU加速卡、兩顆Intel第四代至強處理器、16 x 64GB記憶體、4×3.84TB NVMe SSD，以及雙路400Gb IB、四路25Gb乙太網路，一體化交付解決大規模GPU算力的建設和營運管理問題。

誇娥氏是我國神話傳說中的大力神，出自《愚公移山》：「帝感其誠，命誇娥氏二子負二山，一厝朔東，一厝雍南。自此，冀之南，漢之陰，無隴斷焉。”