OpenAI公佈GPT-4：更強更可靠可在考試中超過90%的人類

人工智能研究公司OpenAI公佈了其大型語言模型的最新版本——GPT-4。該公司表示，GPT-4在許多專業測試中表現出超過絕大多數人類的水平。

OpenAI於2020年發布了GPT（生成型預訓練變換模型）-3（生成型預訓練變換模型），並將其與GPT-3.5分別用於創建Dall-E和聊天機器人ChatGPT，這兩款產品極大地吸引了公眾的關注，並刺激其他科技公司更積極地追求人工智能（AI）。

OpenAI週二表示，在內部評估中，相較於GPT-3.5，GPT-4產生正確回應的可能性要高出40%。而且GPT-4是多模態的，同時支持文本和圖像輸入功能。

OpenAI稱，GPT-4比以前的版本“更大”，這意味著其已經在更多的數據上進行了訓練，並且在模型文件中有更多的權重，這使得它的運行成本更高。

據OpenAI介紹，在某些情況下，GPT-4比之前的GPT-3.5版本有了巨大改進，新模型將產生更少的錯誤答案，更少地偏離談話軌道，更少地談論禁忌話題，甚至在許多標準化測試中比人類表現得更好。

例如，GPT-4在模擬律師資格考試的成績在考生中排名前10%左右，在SAT閱讀考試中排名前7%左右，在SAT數學考試中排名前11%左右。

OpenAI表示，雖然兩個版本在日常對話中看起來很相似，但當任務複雜到一定程度時，差異就表現出來了，GPT-4更可靠、更有創造力，能夠處理更微妙的指令。

不過，OpenAI也警告稱，GPT-4還不完美，在許多情況下，它的能力不如人類。該公司表示：“GPT-4仍有許多已知的局限性，我們正在努力解決，比如社會偏見、幻覺和對抗性提示。”

OpenAI透露，摩根士丹利正在使用GPT-4來組織數據，而電子支付公司Stripe正在測試GPT-4是否有助於打擊欺詐。其他客戶還包括語言學習公司Duolingo、Khan Academy和冰島政府。

OpenAI合作夥伴微軟週二表示，新版必應搜索引擎將使用GPT-4。

WONGCW 網誌