OpenAI「草莓」推理大模型兩週內就要上架？用戶恐將面臨耐心考驗

2024-09-11 Comments 0 Comment

沉寂了數月的全球AI龍頭OpenAI，似乎馬上要有大動作了。根據《資訊報》週二援引多名知情人士報道，OpenAI計劃在大約兩週時間裡，正式推出以推理能力為核心的「草莓」AI模型，並加入ChatGPT服務。由於OpenAI CEO奧爾特曼等人對「草莓」的大力宣傳，疊加公司的確也有一陣子沒有令人興奮的消息了，外界對於這個新產品也算是有一定的期待。

會主動「沉思」的大模型

報導稱，作為以推理為賣點的大模型，「草莓」在面對複雜、多步驟的提問時，會比現在的GPT-4o能力更強、更加易用。

在使用GPT-4o時，如果要提出一個多步驟推理的問題，為了避免機器胡亂回答，用戶往往需要明確告知機器人解答問題時的每一個推理步驟——類似於輸入「思考鏈的提示詞」。使用「草莓」時則沒有那麼麻煩，輸出的結果也會更好。例如，這個模型能夠解答《紐約時報》字謎遊戲。

（圖片來源：《紐約時報》）

因此，除了數學、程式碼外，「草莓」也適合回答更廣泛、更主觀的問題。例如要求它「腦力激盪」一個行銷策略，「草莓」給出的答案更貼近用戶所在的實際場景，也更專注於細節，例如產生一個以周為單位的執行計劃。

造成回答品質差異的核心原因，在於“草莓”模型不會立即回答用戶的提問，而是會進行“思考”，也會向用戶提出追加的問題，從而更加全面地給出答案。

當然，這個步驟也是「草莓」作為網路產品的潛在弱點——報告稱，模型可能需要10-20秒的時間才會開始回答問題。對於日益強調與AI即時交流的產業而言，付費用戶能否接受互動間隔拉大到十秒以上會是個問題。

更致命的問題是，在回答一些GPT-4o也能推理的問題（事實上人類至今都不清楚AI的能力邊界在哪裡），「草莓」可能會出現思考一段時間後，只給出稍微好一些的回答。體驗過這種差異的知情人士稱，結果的提升並不值得等待這麼長時間，能做到「脫口而出」的GPT-4o反而體驗更好。

知情人士同時表示，在內部測試中，「草莓」也出現難以記住對話歷史等問題。同時這個模型目前只能輸入輸出文字，無法處理影像，尚未跨越關鍵的多模態門檻。

商業策略也是看點

即使爆料準確，這件事情的看點除了「草莓」本身的能力外，還有OpenAI對商業策略的考量。

根據早先的報道，OpenAI在內部商討中，考慮為即將推出的推理專長「草莓」大模型，或下一代旗艦模型Orion訂一個更高的價格。更符合實際的操作是，OpenAI可能會在現有的ChatGPT Plus外新增一個付費檔次，提供「草莓」的無限存取或響應速度提升。當然，這一切的前提是有大量用戶認可「草莓」能力的提升。

在目前的定價體系中，個人用戶的ChatGPT Plus每月收費20美元，企業用戶的收費標準介於每月25-60美元/每個帳號不等。

上個月曾經有消息稱，OpenAI每月能透過企業服務和ChatGPT訂閱賺到2.83億美元的收入，但公司層級仍處於淨虧損的狀態。

一	二	三	四	五	六	日
						1
2	3	4	5	6	7	8
9	10	11	12	13	14	15
16	17	18	19	20	21	22
23	24	25	26	27	28	29
30

WONGCW 網誌

記錄生活經驗與點滴

OpenAI「草莓」推理大模型兩週內就要上架？用戶恐將面臨耐心考驗

2024-09-11 Comments 0 Comment

相關

發表迴響取消回覆

分享此文：

相關

發表迴響取消回覆