多款大模型向公眾開放實測“智商”和“情商”
科大訊飛宣布訊飛星火認知大模型面向全民開放。訊飛星火大模型也成為繼百度文心一言和商湯“商量”(SenseChat)之後,又一向公眾開放的主流聊天機器人應用。同日,360智腦大模型也宣布向公眾開放。
“我們要打造每個人的人工智能助手,讓每個人都真正能夠享受到人工智能的紅利,真正解決社會剛需。”科大訊飛董事長劉慶峰表示。
不過,資本市場對於此次開放的大模型反應相對冷淡,9月5日,科大訊飛(002230.SZ)和三六零(601360.SH)股價分別下跌1.8%和1.2%;商湯科技( 00020.HK)股價大跌4.8%,百度(09888.HK)股價下跌1.5%。
隨著人工智能技術日益成為企業競爭的焦點,企業正在瘋狂投入資源、競相開發人工智能相關的大模型產品。
百度CEO李彥宏週二表示,中國已經發布了70多個參數超過10億規模的大型語言模型。百度向公眾開放了AI聊天機器人之後,用戶已超過600萬。
上週,首批根據《生成式人工智能服務管理暫行辦法》完成備案的五家大模型宣布向全社會開放服務,包括文心一言、百川智能、抖音雲雀大模型、質譜清言、商湯商量SenseChat。
對於競爭激烈的互聯網行業而言,率先獲得批准並向公眾開放的公司具有先發優勢,這意味著它們能夠比競爭對手更快地調整產品。
李彥宏就表示,通過廣泛使用文心一言,百度將“收集大量有價值的現實世界人類反饋”,以進一步改進聊天機器人。
這或許也意味著這些企業距離變現更近一步。在OpenAI的聊天機器人產品ChatGPT發布以來,分析機構預計,未來12個月內有望為OpenAI創造超過10億美元的收入。
不過,與ChatGPT相比,目前基於國內大模型開發的AI聊天機器人的“智商”和“情商”還需要更多的訓練。但相比之下,國內幾款已向公眾開放的大模型的“情商”似乎要高於“智商”。
第一財經記者隨機選擇了一道奧數題,分別向百度的文心一言和商湯的SenseChat提問,但都未達到標準答案。
這是一道小學奧數題,問題是:燒水沏茶,洗水壺用1分鐘,燒開水用10分鐘,洗茶壺用2分鐘,洗茶杯用2分鐘,取茶葉用1分鐘,如何安排能盡快喝上茶?
以下是文心一言的答案。它回答道:“這是一個時間規劃的問題,我們需要計算完成所有任務所需的總時間。1 + 10 + min(2,2,1) = 12 分鐘。所以,最少需要12分鐘來完成所有任務。”
訊飛星火的回答是:“為了盡快喝上茶,我們可以按照以下順序進行操作:洗水壺(1分鐘),燒開水(10分鐘),在燒開水的同時,洗茶壺(2分鐘),繼續在燒開水的同時,洗茶杯(2分鐘),繼續在燒開水的同時,取茶葉(1分鐘)。等待水開(剩餘5分鐘),沏茶。所以總共需要15分鐘。”
根據奧數的標準答案:洗水壺一分鐘,在燒開水的10分鐘內,我們已經完成了洗茶壺、洗茶杯和取茶葉的操作。所以,只需要等待水開後,就可以盡快喝上茶了。正確答案是11分鐘!
如果再問一道關於生活建議的題目:為了錢發生爭執時,你會怎麼辦?文心一言和訊飛星火大模型的回答類似。它們都認為,如果為了錢吵架,首先應該冷靜下來,好好地分析一下問題的本質,思考是因為什麼而吵架;然後,嘗試找到解決問題的方法;也可以考慮制定一個明確的財務計劃,幫助雙方更好地理解和管理金錢問題。
訊飛星火的答案
文心一言的答案
文心一言特別還提到,“如果問題依然存在,可以考慮尋求專業的婚姻諮詢師的幫助,他們可以提供專業的建議和指導。”
未來將會看到更多的人工智能大模型向公眾開放。不過,業內人士認為,“百模大戰”的格局可能不會持續。“很多人都在湧入大模型開發的賽道,但隨著向公眾開放審批制度的形成,行業可能很快會觸發整合。”一位人工智能分析師告訴第一財經記者,“未來只有那些擁有數據和技術能力的企業,才最有可能推動行業前進。”