OpenAI公佈GPT-4:更強更可靠可在考試中超過90%的人類
人工智能研究公司OpenAI公佈了其大型語言模型的最新版本——GPT-4。該公司表示,GPT-4在許多專業測試中表現出超過絕大多數人類的水平。
OpenAI於2020年發布了GPT(生成型預訓練變換模型)-3(生成型預訓練變換模型),並將其與GPT-3.5分別用於創建Dall-E和聊天機器人ChatGPT,這兩款產品極大地吸引了公眾的關注,並刺激其他科技公司更積極地追求人工智能(AI)。
OpenAI週二表示,在內部評估中,相較於GPT-3.5,GPT-4產生正確回應的可能性要高出40%。而且GPT-4是多模態的,同時支持文本和圖像輸入功能。
OpenAI稱,GPT-4比以前的版本“更大”,這意味著其已經在更多的數據上進行了訓練,並且在模型文件中有更多的權重,這使得它的運行成本更高。
據OpenAI介紹,在某些情況下,GPT-4比之前的GPT-3.5版本有了巨大改進,新模型將產生更少的錯誤答案,更少地偏離談話軌道,更少地談論禁忌話題,甚至在許多標準化測試中比人類表現得更好。
例如,GPT-4在模擬律師資格考試的成績在考生中排名前10%左右,在SAT閱讀考試中排名前7%左右,在SAT數學考試中排名前11%左右。
OpenAI表示,雖然兩個版本在日常對話中看起來很相似,但當任務複雜到一定程度時,差異就表現出來了,GPT-4更可靠、更有創造力,能夠處理更微妙的指令。
不過,OpenAI也警告稱,GPT-4還不完美,在許多情況下,它的能力不如人類。該公司表示:“GPT-4仍有許多已知的局限性,我們正在努力解決,比如社會偏見、幻覺和對抗性提示。”
OpenAI透露,摩根士丹利正在使用GPT-4來組織數據,而電子支付公司Stripe正在測試GPT-4是否有助於打擊欺詐。其他客戶還包括語言學習公司Duolingo、Khan Academy和冰島政府。
OpenAI合作夥伴微軟週二表示,新版必應搜索引擎將使用GPT-4。