ChatGPT又變強了OpenAI會變成下一個蘋果嗎?
「今天,有大約200萬開發者在使用我們的API進行各種用例的開發。超過92%的財富500強公司正在使用我們的產品進行構建,而現在ChatGPT每週活躍用戶大約有1億。”北京時間11月7日凌晨,在OpenAI的首次開發者大會上,Sam Altman公佈了過去一年中OpenAI的驕人成績。
「今天,有大約200萬開發者在使用我們的API進行各種用例的開發。超過92%的財富500強公司正在使用我們的產品進行構建,而現在ChatGPT每週活躍用戶大約有1億。”
北京時間11月7日凌晨,在OpenAI的首次開發者大會上,Sam Altman公佈了過去一年中OpenAI的驕人成績。
如會前流傳的消息,本次大會上推出了ChatGPT的最新版本GPT-4 Turbo,以及許多全新功能。更重要的是,OpenAI宣布要圍繞GPT打造AI平台,推出GPT Store,並提出了GPTs的概念,使用者可以利用GPT Builder工具,創建自己的GPT。
從ChatGPT被比喻為AI的iPhone時刻,恐怕Sam Altman就已經把目標瞄準蘋果了。不過,他的野心更大,不僅要把ChatGPT做成下一個iOS,還要進一步加強與用戶的綁定,讓每個用戶都有機會成為開發者。
王炸:GPT-4 Turbo
本次發布的LLM(大語言模型)更新主要包括:
- 最新的GPT-4 Turbo,支援128k上下文窗口,且價格更低,輸出更快。
- 全新的Assistants API,使開發人員更容易建立自己的人工智慧應用程式。
- 新的多模態功能,包括視覺、圖像創建(DALL·E 3)和文字轉語音(TTS)。
長情境
長上下文正成為百模大戰的「主戰場」。對比眾多新模型,GPT-4的32k token上下文視窗已不那麼出色。這次GPT-4 Turbo更新的上下文視窗達到128k,是GPT-4的四倍,且超過了競對Anthropic先前推出的100k token的Claude 2。
Sam Altman在示範中稱128k token大約相當於300頁紙的文字量,英國版的《哈利波特與魔法石》差不多就是300頁,魔戒三部曲平均每本是400頁。
不過,GPT-4 Turbo的上下文長度也並非最長。一週前,百川智慧發布的Baichuan2-192K,上下文視窗長度為192K,能夠處理約35萬個漢字。
開發助理
OpenAI此次更新中,著重於開發者推出了Assistant API,使開發者能在應用程式中整合類似代理的AI體驗。
這個API允許AI助理執行具體任務,呼叫模型和工具,並處理一些複雜的程式設計和資料處理工作。它支援多種用途,如自然語言資料分析、編碼輔助、旅行規劃等。
助手API具有持久化執行緒功能,簡化了狀態管理,並允許呼叫開發者定義的函數。此外,它還提供了程式碼解釋器和檢索工具,可在外部資料上運行和檢索資訊。資料保護方面,開發者可自主管理其傳遞給API的資料。現在,開發者可以通過助手API遊樂場,無需編碼進行測試。
此外,OpenAI對函數呼叫進行了更新,現在模型可以在單一訊息中呼叫多個函數,並更準確地傳回正確的函數參數。GPT-4 Turbo在遵循指令產生特定格式時表現更佳,並支援新的JSON模式以確保輸出有效的JSON物件。新增的API參數response_format允許模型輸出語法正確的JSON。此外,透過新的seed參數,模型可以產生可重現的輸出,有助於除錯和編寫單元測試。OpenAI還計劃推出返回輸出令牌對數機率的功能,以便在建立「自動完成」等功能時使用。
知識更新
GPT-4的知識庫更新到2023年4月。目前ChatGPT所使用的GPT-4模型,已經將知識庫更新到了2023年4月,不過GPT-3.5的知識庫仍停留在2022年1月。
新的多模態模型
在多模態能力方面,GPT-4 Turbo的API將整合DALL-E3,以及文生語音模型TTS(text-to-speech)。
開發者可以透過API直接呼叫GPT-4 Turbo with vision中的DALL-E3模型,進行圖片辨識與圖片產生。事實上,DALL·E 3上線之後,ChatGPT Plus用戶就已經可以在GPT-4模組下呼叫DALL·E 3進行圖片創作,以及多模態的圖片辨識了。不過,這次是以API的形式,將多模態的能力開放給開發者。
此外,OpenAI也上線了新的TTS文生語音功能。類似能力,在ChatGPT手機端也已經上線了一段時間(不過目前實測中文還是有一點英語口語),這次也是針對開發者的API開放。目前TTS的語音包共有六種聲音可選,可以輸出Opus、AAC和FLAC三種格式,尚不支援自建聲音。
價格更低,輸出更快
「在模型持續的迭代中,我們的價格也在不斷下降。」Sam Altman介紹說,相較於GPT-4,GPT-4 Turbo的輸入價格只有1/3,0.01美元每1000 token;輸出價格為0.03美元每1000 token,只有原來的1/2。而內容生成的速度,提高了2倍。
又一個iPhone時刻:GPT Store
在ChatGPT插件上線的時候,就有很多人將其比喻為Android市場或是iOS的App Store。如今,OpenAI真的推出了AI版本的App Store——GPT Store。
使用者可以直接建立ChatGPT的自訂版本,在開發者大會現場,兩位OpenAI工作人員現場示範了GPT的建造方法。
OpenAI工作人員Jessica shay現場示範了利用GPT Builder建立一個能與行程表互動的 GPTs。並以對話的形式命令 GPT 給 Sam Altman 發訊息, Altman也在現場接收到了這則訊息。
另一個更專業的演示則是OpenAI 的工作人員現場演示Assistants API的用法:它不僅能列出巴黎旅遊建議,還能在地圖上將計劃中提到的地點按類別標記出來。
Sam Altman表示OpenAI 將會在本月底上線 GPT Store,開發者可以透過GPT Store分享、發表自己的 GPTs。此外,GPT Store產生的收入OpenAI也將以一定比例與開發者分成,不過具體的分配方案尚未公開。
關於錢和微軟
在現場的Assistants API展示過程中,OpenAI工作人員開放了一個現場抽獎,第一波抽獎是隨機選了5個到場工程師每人發了500美元的開發者額度。第二波則直接給到場的900多位軟體開發人員及與會嘉賓每人發了500美元額度。
看似「撒幣」的行為,其實對於OpenAI來說,也沒有特別大方,因為API額度消耗的速度對於正常開發者來說,實在是太快了。多位開發者曾在OpenAI社群中表達了OpenAI發放的120美元的開發者試用優惠額度很快就會用光。
開發者zolika84在測試語音辨識whisper-api時,90分鐘就用掉了120美元額度
過去半年中,OpenAI的估值水漲船高,總融資超過140億美元,但OpenAI的資金消耗速度驚人。
一方面,OpenAI需要支付大量的算力和研發成本;另一方面,也要為未來不確定的法律問題做準備。
本次大會,OpenAI推出了copyright shield功能,用於保護用戶不受到版權問題困擾,不光從技術上規避版權風險,當用戶遇到版權問題時OpenAI也會協助解決。
過去幾個月中,OpenAI一直被美國的眾多版權所有者聯合維權,多家出版集團都在伸手要錢給OpenAI。在版權問題方面,未來的商業化推廣道路需要有龐大的資金支持。在美國的法律環境下,要推出這樣一項服務,OpenAI大機率也已經盤算好了敗訴後的退路。
說到錢,就不得不提到OpenAI一直以來的大老闆:微軟。坊間一直流傳著兩家不合的傳聞。Sam Altman的演講中,只邀請了微軟CEO Satya Nadella一個嘉賓,似乎是在向外界證明OpenAI和微軟的無間合作。
在演講中,Sam Altman直白地問Satya Nadella:微軟和OpenAI的合作關係怎麼樣?
Satya Nadella幽默地回答說:“事實上,我記得你第一次向我伸出手時說,’嘿,你有一些 Azure 積分嗎’,比起那時,我們已經取得了很大的進步。”
微軟始終是基礎建設提供者,賺的是基礎建設的錢。Satya Nadella一再強調:“我們的首要任務是建立最好的系統,以便你可以建立最好的模型,然後將其全部提供給開發人員。”
不過,Satya Nadella並沒有否認微軟開發團隊在AI方面的研究工作,他表示:“我們自己也是開發者,我們也在建立產品。”