短短45分鐘發表會OpenAI如何再次讓AI圈一夜未眠
對於AI 行業從業者來說,剛剛可能是一夜未眠。北京時間11 月7 日凌晨,美國人工智慧公司OpenAI 的開發者大會正式開啟,創辦人Sam Altman 在台上和同事,只用45 分鐘時間,就「轟」出了團隊最新的成果GPT-4 Turbo ,後者不僅更快、有更長的上下文、更好的控制。
同時,OpenAI 下調API 的價格近3 倍,降到了1000 輸入/美分,讓在場開發者歡呼不已。
當然,更重要的是,OpenAI 推出了「GPTs」——讓人們能用自然語言建立客製化GPT,然後,你猜到了——可以把GPT 上傳到即將發布的「GPT Store」!
如果說GPT-4 Turbo 是更好用的“iPhone”,GPT Store 則可能是讓OpenAI成為“蘋果”一樣的巨頭的重要一步。
當競爭對手們依然在「AI 煉丹」時,OpenAI 已經開始建構起一個看起來相當宏偉的生態了。
GPT-4 Turbo,更快,更省錢
發表會一開始,Sam Altman 就宣布了GPT-4 的一次大升級,推出了GPT-4 Turbo,同步在ChatGPT 和API 版本推出。
Sam Altman 表示團隊一直在徵求開發者的建議,對開發者關注的問題做了六大升級,分別是更長的上下文長度、更強的控制、模型的知識升級、多模態、模型微調定制和更高的速率限制。
其中前四條主要關於新模型的性能的提升,而後兩點則主要針對企業開發者的痛點。在提升效能的同時,OpenAI 也宣布了API 價格的下調,可謂「加量不加價」了。
Sam Altman 公佈GPT 的六大升級|OpenAI
六大升級中,第一,就是上下文長度。
OpenAI 原本提供的最長的上下文長度為32k,而此次,GPT-4 Turbo 直接將上下文長度提升至128k,一舉超過了競爭對手Anthropic 的100k 上下文長度。
128k 的上下文大概是什麼概念?大概約等於300 頁標準大小的書所涵蓋的文字量。除了能夠容納更長上下文外,Sam 還表示,新模型還能夠在更長的上下文中,保持更連貫和準確。
第二,是為開發者提供了幾項更強的控製手段,以便更好地進行API和函數呼叫。
首先,新模型提供了一個JSON Mode,可以確保模型以特定JSON 方式提供回答,呼叫API 時也更方便。
另外,新模型也允許同時呼叫多個函數,同時引入了seed parameter,在需要的時候,可以確保模型能夠傳回固定輸出。接下來幾週,模型還將增加新功能,讓開發者能看到log probs。
第三,則是模型內部和外部知識庫的升級。
ChatGPT 橫空出世大概一年後,GPT 的知識庫終於更新到了2023 年4 月。Sam Altman 承諾未來也將繼續更新其知識庫,不使其落伍。「對於GPT 的知識停留在2021 年,我們和你們一樣,甚至比你們更惱火。」Sam Altman 說。
GPT 內部知識庫終於升級到了2023 年4 月|OpenAI
除了內部知識庫的升級,GPT-4 Turbo 也升級了外部知識庫的更新方式,現在可以上傳外部資料庫或文件,來為GPT-4 Turbo 提供外部知識庫的支援。
第四,或許是最不意外的,多模態。
新模型支援了OpenAI 的視覺模型DALL·E 3,也支援了新的文字轉語音模型-開發者可以從六種預設聲音中選擇所需的聲音。
多模態成為GPT 的內建功能|OpenAI
GPT-4 Turbo 現在可以用圖生圖了。同時,在影像問題上,目前OpenAI 推出了防止濫用的安全系統。OpenAI 也表示,它將為所有客戶提供牽涉到的版權問題的法律費用。
在語音系統中,OpenAI 表示,目前的語音模型遠超市場上的同類,並宣布了開源語音辨識模型Whisper V3。
第五,模型微調與客製化。
8 月,OpenAI 曾經發布GPT-3.5 Turbo 的微調服務。當時,有早期測試表明,經過微調的GPT-3.5 Turbo 版本在某些任務中甚至可以超越GPT-4,不過定價相對較高。
而這一次,Sam 宣布GPT-3.5 Turbo 16k 的版本目前也可以進行微調的客製化了,而且價格將比前一代更低。GPT-4 的微調客製化也在申請中了。
同時,OpenAI 也開始接受單一企業的模型客製化了。「包括修改模型訓練過程的每一步,進行額外的特定領域的預訓練,針對特定領域的後訓練等等。」Sam 表示。同時他表示,OpenAI 沒有辦法做很多這樣的模型定制,而且價格不會便宜。
第六,也是最後一點,是更高的速率限制。
GPT-4 用戶,發布會後馬上可以享受到每分鐘的速率限制翻倍的體驗。同時,如果不夠滿意,還可以進一步透過API 帳戶,申請進一步提昇速率限制。
六大升級以外,是API 體系的全線降價。
這次新發表的GPT-4 Turbo,投入方面比GPT-4 降價3 倍,而輸出方面降價2 倍,OpenAI 表示,整體使用上降價約2.75 倍。
新模型的價格是每千輸入token 1 美分,而每千輸出token 3 美分。降價的API 迎來了現場開發者的歡呼。
Sam 也表示,在優先解決價格之後,下一個重點解決的問題將是速度問題,很快,開發者就會發現GPT-4 Turbo 將變快很多。
GPT Store 來了!
早在5 月,OpenAI 就開放了插件系統,首批上線了70 個大模型相關的應用,領域包括猜詞、翻譯、尋找股票資料等等。
GPT Store 風格都很「App Store」|OpenAI
當時,該功能被寄予厚望,不少媒體將其類比於蘋果的App Store 時刻,認為它將改變大模型應用的生態。不過雖然後期插件不斷增加,但插件系統卻遠遠沒有達到蘋果應用商店的影響力。
而這次發布會上,OpenAI 則重新梳理了其應用商店的體系,並將其擴大到了一個全新的範疇——人人都能透過自然語言創建基於自己的知識庫的AI Agent,加入OpenAI的應用商店,並獲得分成。
OpenAI 這次發布的應用,不再稱為插件,而選擇了一個相對比較奇怪的名字,GPT。而整體的應用程式商店,名字叫做GPT Store,將在本月後期正式推出。
根據Sam Altman 的說法,每個GPT 像是ChatGPT 的一個為了特殊目的而做出的定製版本。
OpenAI 的工作人員嘗試讓ChatGPT 管理自己的生活|OpenAI
為了突顯新的GPT 應用,ChatGPT 整個頁面將有小幅度的調整。左上角除了ChatGPT,以下的應用,就是這次推出的GPT 應用。
在演示中,可以看到,較為複雜的插件——例如曾經在OpenAI 上線插件系統時第一批進入插件系統的Zapier,仍然存在於目前的應用商店中,而且仍然可能是未來應用商店裡很重要的一批應用。
在演示中,OpenAI 的Jessica Shay,就利用了Zapier 鏈接了自己的日曆和手機短信,通過與Zapier 這個應用聊天的方式,直接安排了自己的日程,並通知了同事。
不過,Zapier 的功能雖然強大,這樣的應用並不是這次發布的重點。根據Glassdoor 數據顯示,Zapier 公司擁有500-1000 名員工,而財富網站報道,Zapier 估值已達50 億美金。指望這樣的應用來填充OpenAI 的羽翼未豐的應用商店,使其成為一個豐富的生態顯然不太現實。
因此,在此次發布中,OpenAI 推出一個重磅發布:讓不懂程式碼的人也能輕鬆定義一個GPT。
Sam Altman 為此進行了現場展示。
“在YC 工作過很多年,我總是遇到開發者向我諮詢商業意見。”Sam Altman 講到,“我一直想,如果有一天有個機器人能幫我回答這些問題就好了。”
接著,Sam Altman 打開了GPT Builder,先打上一段對這個GPT 的定義,類似於幫助新創公司的創始人思考他們的業務創意並獲得建議,接著,在對話中,GPT Builder 自己生成了這個GPT 的名字、圖標,並透過與Sam 對話的形式,詢問Sam 是否要對對生成的名字和圖標等進行調整。
Sam Altman 正在創建一個「創業導師GPT」|OpenAI
接下來,GPT Builder 主動向他詢問這個應用程式該如何與使用者交互,Sam 表示可以從我的過往演講中選擇合適且有建設性的回答,然後上傳了一段自己過往的演講。
即使加上講解,整個應用程式也在三分鐘內就完成了。造訪這個GPT 的人,會收到GPT 自動產生的對話開頭,可以與這個GPT 對話諮詢創業相關的內容,而得到的,將是一個類似於Sam Altman 本人的回答。
Sam 表示,創作者還可以進一步為GPT 增加action(動作)。
創建一個這樣的GPT,本質上,使用者能夠自訂的功能其實並不多:指令(預設的prompt),週邊的知識庫和動作。但是,能把三者絲滑地結合起來,讓一個不懂程式碼的人也能更簡單地創建應用,確實是這次Open AI的創舉。
GPT 發布後,應用程式可以選擇私有,專屬企業擁有和公開所有三種方式。而Open AI 表示,將為受歡迎的應用提供利潤分享。
很明顯,OpenAI 在這裡的發布,並沒有希望普通用戶能夠透過自然語言創建出多麼複雜的應用,其中的想像空間,更重要的在於個人和企業能夠將自己的知識庫上傳到OpenAI,一鍵構建專屬應用。
例如作為一個擁有貨運價格表的代理,可以將檔案上傳到OpenAI 後,一鍵部署出自己的詢價助理,這樣簡潔絲滑的應用部署,在之前還不存在。而如果發布最終能夠得到用戶認可的話,類似的應用程式也將能夠填充OpenAI 的應用程式商店,使其成為各種資訊的寶庫。
零代碼創建AI Agent
如果你覺得上述的0 程式碼的GPT 很酷,這次OpenAI 也推出了讓開發者更容易使用OpenAI API 的開發方式-Assistants API。
Sam Altman 表示,市面上基於API 建立agent 的體驗很棒。例如,Shopify 的Sidekick 可以讓用戶在平台上採取行動,Discord 的Clyde 可以讓管理員幫忙創建自訂人物,Snap 的My AI 是一個自訂聊天機器人,可以添加到群組聊天中並提出建議。
但問題是,這些agent 很難建立。有時需要幾個月的時間,由數十名工程師組成的團隊,處理很多事情才能使這種客製化助手體驗。這些事情包括狀態管理(state management)、提示和上下文管理(prompt and context management)、擴充功能(extend capabilities)和檢索(retrievel)。
在OpenAI 開發者大會上,這些事情被API 化—— OpenAI 推出Assistants API,讓開發人員在他們的應用程式中建立「助手」。
使用Assistants API,OpenAI 客戶可以建立一個具有特定指令、利用外部知識並可以呼叫OpenAI生成式AI模型和工具來執行任務的「助手」。像這樣的案例範圍包含,從基於自然語言的數據分析應用程式到編碼助手,甚至是人工智慧驅動的假期規劃器。
Assistants API封裝的能力包括:
持久的線程(persistent threads),人們不必弄清楚如何處理長的對話歷史;
內建的檢索(Retrieval),利用來自OpenAI 模型外部的知識(例如公司員工提供的產品資訊或文件)來增強開發人員創建的助手;提供新的Stateful API 管理上下文;
內建的程式碼解釋器(Code Interpreter),可在沙盒執行環境中編寫和執行Python 程式碼。這項功能於3 月針對ChatGPT 推出,可產生圖形和圖表並處理文件,讓使用Assistants API 創建的助手迭代運行程式碼來解決程式碼和數學問題;
改進的函數調用,使助手能夠調用開發人員定義的程式函數並將回應合併到他們的訊息中。
Assistants API 處於測試階段,從今天開始可供所有開發人員使用。開發者可以前往Assistants Playground 來嘗試Assistants API 測試版,而無需編寫任何程式碼。
Assistants API 被OpenAI 視為幫助開發者在其應用程式中建立「類agent 體驗」的第一步。有了Assistants API,建立agent 應用程式將變得更容易。OpenAI 表示,隨著時間的推移,將會持續提高它們的能力。並且,未來計畫允許客戶提供自己的copilot 工具,以補充其平台上的Code Interpreter、檢索元件和函數呼叫。
OpenAI 開發者大會上的產品升級,再次告訴人們,距離每個人都能有一個甚至多個專屬私人助理、使用自然語言就能開發軟體、還能像瀏覽應用一樣,付費/免費購買流行的私人助理,這樣的一個未來,正在加速向人們走來。
從GPT-4 到GPT-4 Turbo 和GPT Store,OpenAI只花了半年多一點的時間。而在6 個月之內,全球的科技和AI 產業,已經是天上人間。
Sam Altman 總結發布會亮點|OpenAI
當多模態、長文字輸入、更便宜、個人化…這些旨在和OpenAI 大模型錯位競爭的特點,都被OpenAI 搶先拿來自我革命;當OpenAI 的產品在B 端和C 端都體現出強大的吸引力、並且也將利用GPT Store 率先籠絡全球AI開發者時,不知道全球的AI 對手們的心情如何。
但OpenAI 的技術進步是令人興奮的,而團隊所採用的商業策略,又有著超越一般創業公司的成熟——我們目睹著一個產業的潮起,也可能正在見證一個巨頭的誕生。