騰訊終究還是出了大模型測了下感覺還行

騰訊官宣亮相了混元大模型。6 月中旬，騰訊曾推出了自己面向B 端行業的MaaS（ Model-as-a-service，模型即服務）解決方案，方案中包含了很多行業大模型，但沒有通用大模型。現在，騰訊終究還是忍不住了。

這次，知危編輯部也想辦法獲得了混元大模型的體驗資格，下面就帶大家看看混元的能力。

首先是常規的對話，我們先看看多輪對話：

以上內容僅能展示連續對話，內容真實性無法驗證

正常的問題是可以一直聊下去的（與其他同行相同，混元也有最大連續對話數的限制），回答的內容也尚可，並且它會知道哪些信息可以說、哪些信息不可以說。

下面我們看看它提供方案的能力：

策略上沒有什麼太大的問題，考慮得相對周到，還是有一定參考價值的。

再讓它生成一個演講稿：

覺得有些太正式官方了，讓他調整了一下：

混元的表現尚可，還是可以起到啟發或者生產力工具的作用的。

下面我們再看看它的語義理解能力：

當我們要求進一步解釋時，混元應對的也比較好：

除了常規的對話，混元還給出了比較豐富的“ 特調” 應用，叫作“ 靈感發現”，囊括了各個場景下的諸多功能：

我們測試了一下社群營銷文案，剛好最近中秋節要到了，看到一些社群在發月餅團購文案，就讓混元也試了一下。

作為對比，我們先找了一下盒馬社群關於月餅的社群營銷文案看看大概什麼樣：

混元的表現如下：

感覺味兒還是對的，隨便修修改改就能用。

除此之外，還有專門的代碼模式和代碼解釋器。

我們先讓混元生成了一段2048 遊戲的代碼：

然後再把它生成的代碼扔進它的代碼解釋器功能裡，它解釋的還行：

好了，編輯部的測試大概就是這麼多，總地感覺下來，混元的水平跟國內一線大廠持平，說不上驚艷，但也沒掉隊，執行各種不同領域任務時的表現在GPT-3.5 水平上下浮動。

自打8 月15 日《生成式人工智能服務管理暫行辦法》開始施行後，行業開始有了明晰的規範，已經有一批大廠的大模型獲得了全量面向公眾開放的資格。

這意味著行業迎來了一個成熟的時機：數量不設限的用戶可以更好地給大模型提供訓練資料，讓大模型更快成長。

所以，騰訊大模型的發布，極有可能是看中了這一點。

如此一來，最後一個一線大廠也加入了通用大模型的“ 大亂鬥” 中。

希望未來某一天，它們能卷出點讓人眼前一亮的東西。

來源：知危

WONGCW 網誌