OpenAI的神秘計畫“草莓”,到底是什麼?
「草莓」的目的是讓AI模型擁有類似人類的推理能力,讓大模型不僅能生成查詢答案,還能提前做好計劃,處理複雜科學計數學問題,並能夠自主地瀏覽互聯網進行“深度研究” ,更接近人類智慧。
OpenAI又在搗鼓神祕「黑科技」?
12日,據媒體引述知情人士透露,生成式AI領頭羊OpenAI正開發新的AI大模型項目—-“草莓”(Strawberry),而這個“草莓”非常神秘,很可能與提升AI大模型的推理能力有關。
OpenAI的神祕計畫「草莓」是什麼?根據媒體報道,5月OpenAI的一份內部文件顯示,OpenAI的內部團隊正開發的「草莓」項目,目的是增強OpenAI的模型的推理能力,處理複雜科學和數學問題的能力,讓大模型不僅能產生查詢答案,還能事先規劃,以便自主、可靠地瀏覽互聯網,進行OpenAI 定義的「深度研究」。
根據十幾位人工智慧研究人員的說法,這是目前大語言模型還沒能實現的功能。
很明顯OpenAI現階段還不想公佈關於「草莓」的詳細資料。
當被問及「草莓」的細節時,OpenAI的一位發言人只是繞了個彎表示:「我們希望AI大模型能像人類一樣看待和理解這個世界。不斷研究新的AI能力是業界的普遍做法,畢竟我們都相信AI的推理能力會隨著時間的推移而不斷提高。
畢竟即便在OpenAI 內部,「草莓」的工作原理也是嚴格保密的,目前仍沒有「草莓」的發佈時間消息。
但有媒體透露,「草莓」計畫的前身是Q*演算法模型,Q*能夠解決棘手的科學和數學問題。而數學是生成式AI發展的基礎,如果AI模型掌握了數學能力,將擁有更強的推理能力,甚至與人類智慧相提並論。而這一點也是目前的大語言模型還無法做到的。
去年底Q*在OpenAI的內部信中首次曝光,而CEO奧特曼當時被開除也是因為這個Q*計畫。
一些OpenAI內部人士指出,Q*可能是OpenAI 在追尋通用人工智慧(AGI)路上的一項突破,其發展速度之快讓人感到震驚,並擔心AI過快發展可能會威脅到人類安全。在這種擔憂蔓延之際,奧特曼在沒有告知董事會的情況下,選擇加速推進GPT系列模型的開發及商業化,這激發了OpenAI董事會的不滿並選擇把他踢出局。
OpenAI的野心:利用「草莓」提高大模型的推理能力
雖然無法獲得「草莓」的詳細情況,但從OpenAI近期的種種蛛絲馬跡中可以發現,增強生成式AI大模型的推理能力,是它接下來的發展重心。
OpenAI的CEO奧特曼曾強調,今後AI發展的關鍵將圍繞著推理能力展開。
在本週二的內部全員會議上,OpenAI展示了一個研究項目的演示,稱該項目具有類似人類的推理能力。 OpenAI發言人向媒體證實了這次內部會議,但拒絕透露會議細節,因此無法確定演示的項目是否為「草莓」。
但據知情人士透露,「草莓」計畫包括一種專門的「後訓練」方法,即生成式AI模型已經過大量資料集上進行預訓練後,進一步調整模型以提高其在特定任務上的表現。這類似於史丹佛大學在2022年發展的「自學推理者」(Self-Taught Reasoner,簡稱STaR)方法。
STaR的創造者之一、史丹佛大學教授Noah Goodman曾表示,STaR可以讓AI模型透過反覆創建自己的訓練數據,「引導」自己進入更高的智能水平,理論上可以用來讓語言模型實現超越人類的智能。
這就和OpenAI想要的「推理能力」對上了號。而且,OpenAI在11日也公佈了未來AI發展的五級路線圖:
按照OpenAI的猜想,未來AI會經歷5個階段:
第一級:聊天機器人,具有對話語言的人工智慧
第二級:推理者,人類層次的問題解決
第三級:代理者,可以採取行動的系統
第四級:創新者、可協助發明的人工智慧
第五級:組織者,可以完成組織工作的人工智慧
按照目前蒐集的信息,「草莓」計畫極可能是幫助OpenAI實現第二級AI的關鍵。
據媒體報道,一位OpenAI高層表示,目前AI模型正處第一級別,但預計很快就會達到第二級別,即推理者。 OpenAI目前正在致力於在特定任務上實現博士級別的智能,預計可能在一年或一年半內實現。
另一個OpenAI聚焦的功能是,提高大語言模型執行長時間任務(Long-Horizon Tasks,簡稱LHT)的能力,這指的是需要模型提前規劃,並在較長一段時間內執行一系列任務。
據知情人士透露,為了實現這一目標,OpenAI希望「草莓」能成為創建、訓練和評估「深度研究」的模型,並利用「電腦使用代理」(Computer-Using Agent,簡稱CUA)來自主瀏覽網頁,並根據其發現自主採取行動。
如果OpenAI成功了,「草莓」計畫很可能會重新定義AI的能力,使其能夠進行重大科學發現、開發新的軟體應用程序,並自主執行複雜任務,那人類離AGI又進一步了。