國產AI大模型高考成績單出爐：訊飛星火獲得綜合第一

2024-06-11 Comments 0 Comment

隨著今年高考的結束，一場前所未有的「智慧競賽」也在幕後悄悄展開。在今年的高考戰場上，一支非傳統但引人注目的隊伍——國產人工智慧大模型，吸引了廣泛關注。近日，搜狐科技、量子位等十餘家權威媒體對近10款國產人工智慧大模型進行了高考作文、數學、物理三個科目的全面評測，並公佈了令人矚目的成績。

首先進行的是高考作文的評測。在搜狐科技的評測中，三位資深語文教師作為權威專家為各大模型的作文評分。騰訊元寶和百度文心一言以超過50分的成績位居前列，智譜清言、字節豆包與訊飛星火則並列第三。 Kimi、阿里通義、百川、海螺排名相對靠後。

而在瀟湘晨報的「AI寫作」評測中，訊飛星火不僅平均分位居首位，且獲得了全場最高分56分。瀟湘晨報邀請湖南知名作家、編輯作為閱卷老師，對國內五大AI大模型產品——百度文心一言、訊飛星火、阿里通義千問、字節豆包、騰訊元寶的高考作文進行評分，經過四位閱卷老師的綜合評分，訊飛星火以49分的平均分數高居首位。

給訊飛星火打出「全場最高分」56分的閱卷老師表示：「本文觀點清晰，論述集中且層層推進，很多句子都簡潔有力，頗有思想性。如果是某個學生寫的，無疑是難得的佳作。

接下來是數學科目的較量。在搜狐科技的數學評測中，訊飛星火、文心一言、豆包均以63%的正確率位列第一梯隊，智譜清言、阿里通義則以50%的正確率位居第二梯隊，其他大模型相對落後。

在量子位的高考數學評測中，雖然沒有給出詳細成績單，但展示了各家大模型詳細的解題思路，交由網友打分，透過網友的投票打分可以看出，訊飛星火的「識圖+解數學題」能力收到了最高認可，位居其後的分別是Kimi、通義千問、文心一言、豆包等。

最後是高考物理的測試。在量子位的評測中，阿里通義千問與訊飛星火以71.4%的準確率高居第一梯隊，而Kimi、海螺和騰訊元寶則以42.9%的準確率位於第二梯隊。百川百小應和萬知答對一題位於第三梯隊。

文心一言、豆包、天工、智譜清言、商量因為出現了不同程度讀圖失敗的問題，在成功識別的題目中，商量和文心一言的正確率為2/4，即正確率為28.6%；豆包、天工、智譜清言正確率為1/2，即正確率為14.3%。

綜合以上媒體在作文、數學、物理三門科目的成績，我們得出了2024年人工智慧大模型高考「成績單」。來自科大訊飛的訊飛星火以52.49分高居第一名，通義千問、文心一言分別位列第二、第三名，而Kimi、字節豆包、海螺AI等其他大模型也有不錯的表現。

綜合成績：

第一名：52.49 訊飛星火

第二名：46.08 通義千問

第三名：37.67 文心一言

第四名：34.68 Kimi

第五名：33.57 位元組豆包

第六名：31.92 海螺AI

第七名：30.61 騰訊元寶

第八名：30.28 智譜清言

第九名：21.56 百川百小應

WONGCW 網誌

記錄生活經驗與點滴

國產AI大模型高考成績單出爐：訊飛星火獲得綜合第一

2024-06-11 Comments 0 Comment

相關

發表迴響取消回覆

2024 年 6 月
一	二	三	四	五	六	日
					1	2
3	4	5	6	7	8	9
10	11	12	13	14	15	16
17	18	19	20	21	22	23
24	25	26	27	28	29	30

分享此文：

相關

發表迴響取消回覆