OpenAI連甩5款新模型!價格暴降功力大漲還治好了GPT-4的“懶病”
美國時間週四, OpenAI宣布了一系列重大更新。這些更新不僅關乎它們備受歡迎的大模型,還包括API存取價格的調整、效能最佳化以及全新嵌入性模型的發布。這些動作旨在吸引更多開發者的注意,也有望為未來的消費者市場設立新的標竿。
1月26日報道,昨夜,OpenAI發布了一系列重磅大模型更新,連發了五個新模型以及新的API使用管理工具,總體來說可以說是“加量不加價”, OpenAI的友商們一覺醒來壓力又大了不少。
首先,來看看新品和新功能:
1.新的GPT-3.5 Turbo模型,輸入價格暴降50%,輸出價格降低25%,同時修復各種BUG,回應準確度更高,舊用戶兩週後還可自動升級!
2.新的GPT-4 Turbo預覽模型,生成程式碼能力更強,模型「變懶」情況減少,修復各種BUG,帶有視覺功能的GPT-4 Turbo也會在未來幾個月內推出!
3.新的小型文字嵌入模型text-embedding-3-small,性能小幅提升,價格直接“打骨折”,暴降至上代的五分之一。
4.新的大型文字嵌入模型text-embedding-3-large,核心就是性能強,可創建多達3072維的嵌入,部分測試性能提升70%以上,價格略貴一點點。同時,OpenAI也搞了一個新技術,直接讓開發者在略微損失精度的情況下縮短嵌入,實現效能和成本的平衡,彈性極大提升。
5.新的審查模型text-moderation-007,OpenAI將其稱之為「迄今為止最強大的審查模型」。
新的API使用管理工具我們不在此贅述。
喔對了,最後OpenAI還很貼心地提示說,預設情況下,發送到OpenAI API的資料將不會被用於訓練或改進OpenAI模型。話不多說,我們具體來看看今天各個重磅新品的升級細節。
一、五分之一的價格,更強的效能,模型使用彈性顯著提升
首先來看看OpenAI這次新推出的兩個嵌入模型,更小且有效率的text-embedding-3-small模型,以及更大且更強的text-embedding-3-large模型。
在看模型之前,首先要理解下什麼是“嵌入(embedding)”,簡單來說,嵌入是一系列數字,而這些數字代表了自然語言或程式碼等內容中的概念。
▲嵌入(embedding)示意圖
嵌入讓機器學習模型和其他演算法能夠理解內容之間的關係,並執行如聚類或檢索等任務,為ChatGPT和Assistants API中的知識檢索,以及許多檢索增強生成(RAG)開發者工具提供了支持。
新的小型文字嵌入模型text-embedding-3-small相比於2022年12月發布的前代模型text-embedding-ada-002主要有兩方面升級:更強的性能、更低的價格。
在效能方面,在一個常用的多語言檢索基準(MIRACL)測試中,text-embedding-3-small平均分數從31.4%增加到了44.0%,在一個常用的英語任務基準(MTEB)測試中,其平均分數從61.0%增加到62.3%。
▲text-embedding-3-small測驗成績
價格方面,text-embedding-3-small的價格僅為上代的五分之一,每1000個tokens的價格從0.0001美元降低到0.00002美元。
另外一個新的大型文字嵌入模型text-embedding-3-large,據稱可以創建多達3072維(dimensions)的嵌入,其主要提昇在於性能。
效能方面,text-embedding-3-large在MIRACL測試的平均分數從31.4%增加到54.9%,而在MTEB測試中,其平均分數從61.0%增加到64.6%。售價為0.00013美元/1000 tokens。
眾所周知,用更大的嵌入,會消耗更多的運算、記憶體和儲存資源,比使用更小的嵌入成本更高。
為此OpenAI推出了一種新的技術,讓開發者可以在使用嵌入的效能和成本之間進行權衡。具體來說,開發者可以透過調整維度API參數(dimensions API parameter)來縮短嵌入,同時確保嵌入不會失去其表示概念的屬性。
例如,在MTEB基準測試中,一個text-embedding-3-large嵌入可以縮短到256的大小,但其測試成績仍然優於一個未縮短的、大小為1536的text-embedding-ada-002嵌入。
▲縮短到256大小的text-embedding-3-large與未縮短的、大小為1536的text-embedding-ada-002測驗成績對比
這樣的特性可以讓使用變得非常靈活。例如當開發者使用最多只支援1024維嵌入的向量資料儲存時,他仍然可以使用效能最強的text-embedding-3-large模型,他只需要為維度API參數指定一個1024的值,將嵌入從3072維縮短,當然精度會略有損失。
二、兩大經典產品重磅升級,模型更勤快,程式碼能力增強,後續還會支援視覺功能
1.新的GPT-3.5 Turbo模型-輸入輸出價格大幅下降,老用戶升級方便
除了兩個嵌入模型,這次OpenAI還宣布將在下週推出一個新的GPT-3.5 Turbo模型——gpt-3.5-turbo-0125,並且進一步降低其使用價格,這已經是過去一年時間OpenAI對其進行的第三次降價了。
到底有多便宜呢?gpt-3.5-turbo-0125輸入的價格降低了50%,為0.0005美元/1000 tokens,輸出價格也降低了25%,為0.0015美元/1000 tokens。
當然,gpt-3.5-turbo-0125還會有各種升級,例如在以請求的格式回應時,會有更高準確性,同時OpenAI也修復了一些BUG。
另一個好消息是,使用pinned gpt-3.5-turbo模型alias的老客戶將在新模型發布後的兩週內自動升級。
2.新的GPT-4 Turbo預覽模型-程式碼更強,減少“變懶”
除了GPT-3.5 Turbo,OpenAI這次也發表了新的GPT-4 Turbo預覽模型-gpt-4-0125-preview。
這個模型可以比之前的預覽模型更完整地完成像程式碼產生這樣的任務,並且可以減少模型「變懶(laziness)」不完成任務的情況。去年年底,GPT-4被發現「變懶」問題愈發嚴重,出現回應速度慢、回答敷衍、不聽指令、寫代碼愛省略甚至拒絕回答、中斷會話等情況。當然,新模型也修復了一些BUG。
對於新的GPT-4 Turbo預覽模型,OpenAI也引入了相關自動升級機制,如果用戶訂購了相關服務,他就會一直能夠使用最新版的GPT-4 Turbo預覽模型。
值得一提的是,OpenAI也提到他們計劃在未來幾個月內推出視覺功能的GPT-4 Turbo。
3、“迄今為止最強大的審查模型”
最後一個新產品是一個新的審查模型——text-moderation-007,OpenAI稱之為“迄今為止最強大的審查模型”,免費的審查API可以允許開發者識別可能有害的文本。
4.兩項平台改進,提升開發者API使用管理體驗
此外,OpenAI正在推出兩項平台改進,讓API金鑰的使用有更好的透明度,同時讓開發者對API金鑰有更多的控制權。
第一項改進是,開發者可以從API金鑰頁面為API金鑰分配權限。第二項改進是,使用儀表板和使用匯出功能在開啟追蹤後可以顯示API金鑰等級的量測。
▲儀錶板可以顯示API金鑰等級的度量
這樣一來,只需要為每個功能、團隊、產品或專案分配單獨的API金鑰,就可以簡單地查看每個層級的使用情況。
結論:性能更強價格更低,OpenAI大模型繼續鞏固優勢
這次OpenAI發布的多款大模型新品,都在上代產品基礎上實現了一定的性能提升,在開發者使用的便捷程度、靈活程度上有一定改進,同時在價格方面給予了不小的優惠。
對於OpenAI來說,大模型生態的完善離不開開發者,今天的一系列「加量不加價」的操作也勢必會增加OpenAI產品的競爭力。OpenAI的對手們將會做與應對、未來視覺大模型的出現又會為產業帶來哪些新變量,我們拭目以待。