OpenAI降低人們的期望值今年秋季的DevDay不會公佈GPT-5
去年,OpenAI 在舊金山舉行了一場聲勢浩大的新聞發布會,該公司發布了一系列新產品和工具,其中包括類似App Store 的GPT 商店。不過,今年的活動將會更加低調。本週一,OpenAI 表示它將改變DevDay 大會的形式,從大型活動轉變為一系列開發者參與會議。該公司還確認,它不會在DevDay 期間發布下一款主要旗艦機型,而是將重點放在API 和開發者服務的更新上。
OpenAI 的發言人表示:”我們不打算在DevDay 上宣布下一個模型。我們將更專注於向開發者介紹可用的產品,並展示開發者社群的故事。”
OpenAI 今年的DevDay 活動將於10 月1 日在舊金山、10 月30 日在倫敦、11 月1 日在新加坡舉行。所有活動都將包括研討會、分組會議、OpenAI 產品和工程人員的演示以及開發人員聚光燈。報名費為450 美元(符合資格的與會者可獲得獎學金,費用為0 美元),報名將於8 月15 日截止。
近幾個月來,OpenAI 在生成式人工智慧領域採取的循序漸進的措施多於巨大的飛躍,它在訓練其當前領先模型GPT-4o和GPT-4o mini 的後繼者時,選擇了磨練和微調其工具。該公司已經改進了各種方法,以提高模型的整體性能,並防止這些模型像以前那樣頻繁出錯,但OpenAI 似乎已經失去了在生成式人工智慧競賽中的技術領先優勢–至少根據一些基準測試的結果是這樣。
原因之一可能是尋找高品質訓練資料的挑戰越來越大。與大多數生成式人工智慧模型一樣,OpenAI 的模型也是在大量網路數據的基礎上訓練出來的–許多創作者因為擔心自己的數據會被剽竊或得不到信用或報酬而選擇屏蔽這些網路數據。根據Originality.AI提供的數據,目前全球排名前1000位的網站中,有超過35%的網站封鎖了OpenAI的網路爬蟲。麻省理工學院資料來源倡議(Data Provenance Initiative)的一項研究發現,在用於訓練人工智慧模型的主要資料集中,約有25% 的”高品質”來源資料受到了限制。
根據Epoch AI 研究小組預測,如果目前的存取受限趨勢持續下去,開發人員將在2026 年至2032 年之間耗盡用於訓練人工智慧產生模型的資料。由於擔心版權訴訟,OpenAI 不得不與出版商和各種資料經紀商簽訂昂貴的授權協議。
據說,OpenAI 已經開發出一種推理技術,可以改善其模型對某些問題,尤其是數學問題的反應,該公司的首席技術官米拉-穆拉提(Mira Murati)承諾,未來的模型將具備”博士級”的智能。 (OpenAI 在今年5 月的一篇部落格文章中透露,它已經開始訓練下一個”前沿”模型)。這是一個很大的承諾–而且兌現的壓力很大。據報道,OpenAI在訓練其模型和僱用高薪研究人員方面已耗資數十億美元。
OpenAI 仍然面臨著許多爭議,例如使用受版權保護的資料進行訓練、限制性的員工NDA以及有效地將安全研究人員排除在外。產品週期的放緩可能會產生有益的副作用,即反駁OpenAI 為追求能力更強、功能更強大的生成式人工智慧技術而將人工智慧安全工作置於次要地位的說法。