騰訊終究還是出了大模型測了下感覺還行
騰訊官宣亮相了混元大模型。6 月中旬,騰訊曾推出了自己面向B 端行業的MaaS( Model-as-a-service,模型即服務)解決方案,方案中包含了很多行業大模型,但沒有通用大模型。現在,騰訊終究還是忍不住了。
這次,知危編輯部也想辦法獲得了混元大模型的體驗資格,下面就帶大家看看混元的能力。
首先是常規的對話,我們先看看多輪對話:
以上內容僅能展示連續對話,內容真實性無法驗證
正常的問題是可以一直聊下去的( 與其他同行相同,混元也有最大連續對話數的限制),回答的內容也尚可,並且它會知道哪些信息可以說、哪些信息不可以說。
下面我們看看它提供方案的能力:
策略上沒有什麼太大的問題,考慮得相對周到,還是有一定參考價值的。
再讓它生成一個演講稿:
覺得有些太正式官方了,讓他調整了一下:
混元的表現尚可,還是可以起到啟發或者生產力工具的作用的。
下面我們再看看它的語義理解能力:
當我們要求進一步解釋時,混元應對的也比較好:
除了常規的對話,混元還給出了比較豐富的“ 特調” 應用,叫作“ 靈感發現”,囊括了各個場景下的諸多功能:
我們測試了一下社群營銷文案,剛好最近中秋節要到了,看到一些社群在發月餅團購文案,就讓混元也試了一下。
作為對比,我們先找了一下盒馬社群關於月餅的社群營銷文案看看大概什麼樣:
混元的表現如下:
感覺味兒還是對的,隨便修修改改就能用。
除此之外,還有專門的代碼模式和代碼解釋器。
我們先讓混元生成了一段2048 遊戲的代碼:
然後再把它生成的代碼扔進它的代碼解釋器功能裡,它解釋的還行:
好了,編輯部的測試大概就是這麼多,總地感覺下來,混元的水平跟國內一線大廠持平,說不上驚艷,但也沒掉隊,執行各種不同領域任務時的表現在GPT-3.5 水平上下浮動。
自打8 月15 日《 生成式人工智能服務管理暫行辦法》開始施行後,行業開始有了明晰的規範,已經有一批大廠的大模型獲得了全量面向公眾開放的資格。
這意味著行業迎來了一個成熟的時機:數量不設限的用戶可以更好地給大模型提供訓練資料,讓大模型更快成長。
所以,騰訊大模型的發布,極有可能是看中了這一點。
如此一來,最後一個一線大廠也加入了通用大模型的“ 大亂鬥” 中。
希望未來某一天,它們能卷出點讓人眼前一亮的東西。
來源:知危