OpenAI「草莓」推理大模型兩週內就要上架?用戶恐將面臨耐心考驗
沉寂了數月的全球AI龍頭OpenAI,似乎馬上要有大動作了。根據《資訊報》週二援引多名知情人士報道,OpenAI計劃在大約兩週時間裡,正式推出以推理能力為核心的「草莓」AI模型,並加入ChatGPT服務。由於OpenAI CEO奧爾特曼等人對「草莓」的大力宣傳,疊加公司的確也有一陣子沒有令人興奮的消息了,外界對於這個新產品也算是有一定的期待。
會主動「沉思」的大模型
報導稱,作為以推理為賣點的大模型,「草莓」在面對複雜、多步驟的提問時,會比現在的GPT-4o能力更強、更加易用。
在使用GPT-4o時,如果要提出一個多步驟推理的問題,為了避免機器胡亂回答,用戶往往需要明確告知機器人解答問題時的每一個推理步驟——類似於輸入「思考鏈的提示詞」。使用「草莓」時則沒有那麼麻煩,輸出的結果也會更好。例如,這個模型能夠解答《紐約時報》字謎遊戲。
(圖片來源:《紐約時報》)
因此,除了數學、程式碼外,「草莓」也適合回答更廣泛、更主觀的問題。例如要求它「腦力激盪」一個行銷策略,「草莓」給出的答案更貼近用戶所在的實際場景,也更專注於細節,例如產生一個以周為單位的執行計劃。
造成回答品質差異的核心原因,在於“草莓”模型不會立即回答用戶的提問,而是會進行“思考”,也會向用戶提出追加的問題,從而更加全面地給出答案。
當然,這個步驟也是「草莓」作為網路產品的潛在弱點——報告稱,模型可能需要10-20秒的時間才會開始回答問題。對於日益強調與AI即時交流的產業而言,付費用戶能否接受互動間隔拉大到十秒以上會是個問題。
更致命的問題是,在回答一些GPT-4o也能推理的問題(事實上人類至今都不清楚AI的能力邊界在哪裡),「草莓」可能會出現思考一段時間後,只給出稍微好一些的回答。體驗過這種差異的知情人士稱,結果的提升並不值得等待這麼長時間,能做到「脫口而出」的GPT-4o反而體驗更好。
知情人士同時表示,在內部測試中,「草莓」也出現難以記住對話歷史等問題。同時這個模型目前只能輸入輸出文字,無法處理影像,尚未跨越關鍵的多模態門檻。
商業策略也是看點
即使爆料準確,這件事情的看點除了「草莓」本身的能力外,還有OpenAI對商業策略的考量。
根據早先的報道,OpenAI在內部商討中,考慮為即將推出的推理專長「草莓」大模型,或下一代旗艦模型Orion訂一個更高的價格。更符合實際的操作是,OpenAI可能會在現有的ChatGPT Plus外新增一個付費檔次,提供「草莓」的無限存取或響應速度提升。當然,這一切的前提是有大量用戶認可「草莓」能力的提升。
在目前的定價體系中,個人用戶的ChatGPT Plus每月收費20美元,企業用戶的收費標準介於每月25-60美元/每個帳號不等。
上個月曾經有消息稱,OpenAI每月能透過企業服務和ChatGPT訂閱賺到2.83億美元的收入,但公司層級仍處於淨虧損的狀態。