ChatGPT悄悄變懶OpenAI還能加速跑嗎?
無論是公開場合或媒體爆料,儘管OpenAI創始人Sam Altman已多次劇透GPT-5的相關消息,但與這位創始人浮出水面的硬體、算力等野心相比,眼下最棘手的問題是—ChatGPT的一群忠實用戶們,正在發現GPT-4正在變得越來越「懶」。
所謂的「變懶」指的是ChatGPT的個人使用者體驗。近期,在OpenAI線上論壇上,不少用戶正在抱怨GPT-4表現下降,包括推理變差、反應變慢等。一位用戶甚至直言:“ChatGPT已經完全無法使用了,今天我在等待答案的同時居然煮了咖啡。”
與變懶的GPT-4相比,OpenAI對外正在講述更多的「既要又要」的商業化故事,加速變現。
一是在ChatGPT這項對話式產品上,一面尋找更多的個人用戶,如幾天前開放免登入使用,爭搶更多的流量和資料。另一面則是面向企業端的商業化前景。 ChatGPT營運長Brad Lightcap就在近期內透露,已有60萬用戶正在ChatGPT的企業級產品(包括ChatGPT Enterprise和ChatGPT Team)。 Brad Lightcap稱,92%的財富500強公司正在以某種形式使用ChatGPT,每周有1億人積極使用ChatGPT。二是圍繞硬體、算力和全球化上的佈局。
對OpenAI來說,「既要又要」是某種必然,「模型變懶」也是其加速變現和跑馬圈地所帶來的直接結果。只不過,對Sam Altman和他的OpenAI來說,至少在拿出GPT-5之前,需要解決的問題和困擾還有很多。
「我曾經是OpenAI的佈道者,總是告訴大家GPT有多棒以及該如何使用它。但現在我不再推薦它,因為它已經變得很難有效使用。」一位用戶近期在OpenAI在線上論壇上這樣寫道。
一些忠實用戶選擇放棄使用GPT-4 圖源:OpenAI論壇
今年3月中旬,在一篇名為《How to deal with “lazy” GPT-4》的貼文下擠滿了OpenAI變懶的「受害者們」。他們發現在使用ChatGPT的過程中,反應速度越來越慢,回答問題的準確性也不及預期。
一部分個人使用者對OpenAI產生不滿圖源:OpenAI論壇
有的人抱怨,GPT-4沒有遵循他們給出的指令,當使用者需要它給出完整的代碼時,GPT-4會給出帶有佔位符(placeholders)的截斷代碼。當要求它給出用於更新程式碼的範例時,也更容易出錯。有的人則發現,ChatGPT的廢話也越來越多,當被問及它的「來源」、它的背景以及它如何產生答案時,GPT-4現在變得更加難以捉摸。還有的用戶更是直接吐槽起了它的響應速度:“今天我在等待答案的同時居然煮了咖啡。”
開發者抱怨GPT-4變懶圖源:OpenAI論壇
事實上,這並不是ChatGPT第一次變懶。
早在去年7月,許多用戶就在社群媒體和OpenAI開發者論壇裡表達了自己的不滿,變懶、變笨的GPT-4出現了邏輯弱化、錯誤回應、難以遵循指令、只記住最近的提示等問題。今年年初,更多的投訴下,Sam Altman直接承認了GPT-4「一直在偷懶」這一事實,並表示自己「已經發布了修復程序來解決投訴」。
Sam Altman承認GPT-4「偷懶」 圖源:X
眼下,這一輪的「變懶抱怨」似乎沒有等來OpenAI的回覆。社群之內的ChatGPT使用者正在討論GPT-4變懶的原因以及自己尋找解決上述問題的方法。 “它曾經很聰明,現在確實一個徹頭徹尾的白痴”“我感覺自己被騙了”,社區內的憤怒情緒正在增加。
對於「變懶」的原因,使用者甚至猜測OpenAI是不是將背後的模型偷偷換成了GPT-3.5,還有的則認為OpenAI正在將更多的精力放在其「企業級客戶」上,而非「平民」上。
用戶的抱怨和吐槽GPT-4效能下降其實反向印證了兩點,一是目前用戶對GPT-4已累積下用戶心智,他們迫切希望OpenAI推出新的產品。二是,這很有可能是OpenAI發布的GPT-5的重要時機,AI天使投資人Allie K. Miller就表示:「他們(OpenAI)有用戶基礎,有訂閱,如果他們發現用戶下降,或許將發布更新版本的模型,時機是關鍵。”
對OpenAI來說,一個不太好的跡像是,隨著GPT-4變懶,即便是它的忠實用戶們,也開始尋找替代方案。
在上述抱怨OpenAI變懶的貼文下,不少用戶就提到了至少在編碼能力上,Anthropic的Claude Opus 3顯得可靠,在實際使用的性能方面似乎也與GPT-4 不相上下。在截至3月29日的Chatbot Arena排行榜上,Claude Opus 3就打敗了GPT-4,佔據第一個位置。
截至3月29日,Claude Opus 3打敗了GPT-4,排名第一圖來源:Hugging Face
在過去人工智慧的模型競逐中,各類科技企業「追趕GPT-4」成為共識,各類評測與跑分錶中「與GPT-4對比」也成了鐵律。而Chatbot Arena排行榜的來源則來自用戶實打實的投票,在用戶體驗端Claude Opus 3暫時跑贏GPT-4,也說明了至少在個人用戶眼中,OpenAI所謂的用戶護城河並不牢固。
在榜單之上,除了老對手Anthropic的Claude、Google的Gemini外,被稱為“法國OpenAI”,主打MoE架構的Mistral AI 的名字也赫然在列。先前Mistral-Medium這一「中盃版」模型就因開源和強大性能十分受開發者的擁躉,而此前在2月底發布的「大杯版」Mistral Large更是直奔著OpenAI的GPT-4去,順便還官宣了和微軟的閉源合作。
前有狼後有虎,何時發布GPT-5還未有定論,OpenAI手中餘糧還有多少?
OpenAI和Sam Altman自然也沒閒著,剛結束的2024年Q1,這家全球最火熱的人工智慧新創公司的日程表上寫了三件事:一是尋找AI的下一個入口,二是更大的算力野心,三是全球化之路。
首先,尋找AI的下一個入口,也就是OpenAI野心勃勃的硬體計畫。除了先前出圈的人形機器人Figure 01外,根據外媒最新報道,Sam Altman正計劃和前蘋果設計師Jony Ive創立的一家神秘公司,推出一款人工智能驅動的個人設備,更早前,Altman領投了AI硬體新創公司Humane,OpenAI也在討論將其名為GPT-4 with Vision的物體辨識軟體嵌入到Snapchat母公司Spectacles的智慧眼鏡中。
其次,是更大的算力計劃。Altman先前在公開場合多次表明算力是掣肘模型進化的原因,AI伺服器晶片數量嚴重不足。為了尋求更穩定的晶片供應,除了自己下場投資GPU晶片公司和成立晶片公司外,OpenAI和「最鐵的盟友」微軟被曝出計劃砸1000億美元建造名為「星際之門」的AI超級電腦。
不過,在硬體和晶片計畫外,過去一年中,OpenAI也還在下一盤全球化的棋局。
今年1月,Altman開啟自己的韓國之旅,與韓國晶片巨擘三星、SK探討合作的可能。近期,Altman也前往日本與日本首相岸田文雄會面,並表示OpenAI正在考慮將日本作為亞洲首個辦事處。奧爾特曼在東京對當地記者表示:「看到這項技術在日本被採用真是令人驚奇。」根據「矽基研究室」不完全統計,除日本外,OpenAI目前在倫敦和都柏林分別設立了國際辦事處。
不過,在GPT-5以及種種野心計畫外,擺在OpenAI眼前的,還有許多需要解決的新困擾。
如上文提到的“模型變懶”,OpenAI究竟是繼續縫縫補補舊模型,還是提早放出GPT-5的大招,還尚未確定。
另一個新麻煩則是資料問題。影片巨頭YouTube就在近期開戰OpenAI,表示,如果OpenAI在未經許可的情況下使用其影片來開發文生影片模型Sora,將違反YouTube的規則。 OpenAI技術長Mira Murati在接受採訪時表示,她不知道Sora是否接受過YouTube影片訓練,公司也沒有透露資料來自哪裡。
《紐約時報》在近期的一則報導中,揭開了OpenAI上述數據的來源。時間撥回2021年底,OpenAI需要更多的數據,為此研究人員創建了一款名為Whisper的語音識別工具,該工具可以轉錄YouTube視頻中的音頻,生成新的對話文本,儘管一些的OpenAI員工討論了此舉可能違反YouTube的規則,但最終還是轉錄了超過100萬小時的YouTube影片。 OpenAI並未立即回應上述媒體的評論。
大算力與大數據的Scaling Law奠定了OpenAI所有工作的基礎。但如今,資料的取得與使用問題是包括OpenAI在內的人工智慧企業必須面臨的問題,這涉及兩個層面,一是商業層大公司間的競爭,更優質的使用者資料決定模型的效能。二是社會層的用戶隱私問題,這些科技公司必須為用戶隱私的安全性負責。
數據問題外,不可忽視的還有人們對科技公司情緒的改變。根據《The Information》數據,目前人工智慧新創公司估值可能正在從高峰迴落,回歸現實。新創公司市盈率的下降反映出人們對人工智慧新創公司前景並沒有想像中那麼樂觀。更多投資者想要知道的是,隨著業務邊界的拓展,當這些新創公司拿到更多的錢時,除瞭如何花錢外,它們如何賺錢,如何應對更激烈的競爭,這些問題顯得更為重要。
對OpenAI來說,他們或許更需要回應GPT-4變懶的問題,更好的產品體驗依舊是核心護城河。正如論壇內一位用戶所言:“如果有更好的產品,我會像在燃燒的船上一樣跳船。” OpenAI在造一艘更大的船,但它的用戶此刻可能正在選擇離開。