騰訊混元自研深度思考模型T1正式發布：吐字快、能秒回

騰訊正式發布了自研深度思考模型混元T1正式版，這是騰訊自研的最強推理模型。騰訊表示，T1不僅吐字快、能秒回，還擅長超長文處理。透過大規模強化學習，並結合數學、邏輯推理、科學和代碼等理科難題的專題優化，混元T1正式版進一步提升了推理能力。

在體現推理模型基礎能力的常見benchmark上，如大語言模型評估增強資料集MMLU-PRO中，混元T1取得87.2分，僅次於o1。

在CEval、AIME、Zebra Logic等中英文知識及競賽級數學、邏輯推理的公開基準測試中，混元T1的成績也達到業界領先推理模型的水平。

T1也在多項對齊任務、指令跟隨任務和工具利用任務中展現出了非常強的適應性。

混元T1正式版沿用了混元Turbo S的創新架構，採用Hybrid-Mamba-Transformer融合模式。

这是工业界首次将混合Mamba架构无损应用于超大型推理模型，有效降低了传统Transformer结构的计算复杂度，减少了KV-Cache的内存占用，从而显著降低了训练和推理成本。

基於出色的長文捕捉能力，混元T1能有效解決長文推理中常見的上下文遺失和長距離資訊依賴問題。

同時，混合Mamba架構針對長序列處理進行了專項優化，透過高效的計算方式，在確保長文本資訊捕捉能力的同時大幅降低資源消耗，在相近的激活參數量下，實現了解碼速度提升2倍。

目前騰訊混元T1已經開放體驗，同時也上線了API：輸入價格為每百萬tokens 1元，輸出價格為每百萬tokens 4元。

WONGCW 網誌