中國聯通發布元景思維鏈大模型表現比肩OpenAI
中國聯通宣布,聯通數據智能有限公司日前發布元景思維鏈大模型。目前,元景思維鏈模型已在GitHub、魔搭、始智等社群中全面開源。作為央企首個開源的通用思維鏈大模型,元景思維鏈大模型既擁有強大慢思考能力,又具備不限於數學的多學科、多場景通用推理能力,且能做到針對不同任務和難度的自適應慢思考,大幅降低資源消耗。
中國聯通表示,主流榜單的評估結果顯示,元景思維鏈大模型的表現超過了目前最好的通用語言模型(OpenAI GPT-4o和Deepseek V3)以及開源思維鏈模型通義千問QwQ。
據介紹,元景思維鏈大模型透過任務自適應和難度自適應兩種策略來實現模型的「自適應慢思考」。
在非推理任務評測集上對比,元景思維鏈模型在保證正確率的情況下明顯傾向於產生較短的答案(長度小於100和200個token的數量明顯多於通義千問QwQ):
這個大模型在評估模型產生的長思維鏈資料時,除了考慮生成的答案正確與否,還綜合考慮了問題的難度以及生成答案的長度,透過強化學習讓模型將答案長度與當前問題的難度相匹配。
根據官方演示,元景思維鏈模型可順利解答物理、化學高考真題、24點遊戲、邏輯推理等問題。