Anthropic 推出改進版入門級LLM AI模型
由前開放人工智能公司(OpenAI)高管共同創立的人工智能初創公司Anthropic 發布了其更快、更便宜、可通過API 生成文本的模型Claude Instant 的升級版本。
據Anthropic 稱,更新版Claude Instant(Claude Instant 1.2)吸收了Anthropic 最近發布的旗艦模型Claude 2 的優點,在數學、編碼、推理和安全性等方面都有”顯著”提高。在內部測試中,Claude Instant 1.2 的編碼基準得分率為58.7%,而Claude Instant 1.1 的得分率為52.8%;在一組數學問題中,Claude Instant 1.2 的得分率為86.7%,而Claude Instant 1.1 的得分率為80.9%。
Anthropic 在一篇博文中寫道:”Claude Instant 生成的回答更詳盡、更有條理,而且能更好地遵循格式說明。Instant1.2在引用提取、多語言功能和問題解答方面也有改進”。
Anthropic 聲稱,Claude Instant 1.2 並不容易出現胡言亂語的”幻覺”狀態,對刻意設定的”越獄”提示也有相當的抵抗能力,在Claude這樣的大型語言模型中,”幻覺”是指模型生成的文本不正確或無意義,而越獄則是一種利用巧妙編寫的提示繞過大型語言模型創建者為其設置的安全功能的技術。
Claude Instant 1.2 的上下文窗口大小與Claude 2 相同–100000 個令牌。上下文窗口指的是模型在生成額外文本之前所考慮的文本,而標記則代表原始文本(例如,”fantastic”(奇妙)一詞會被拆分成”fan”(粉絲)、”tas”(塔斯)和”tic”(抽搐)等標記)。Claude Instant 1.2 和Claude 2 可以分析大約75000 個單詞,大約相當於《了不起的蓋茨比》的長度。
一般來說,具有較大上下文窗口的模型不太可能”遺忘”最近的對話內容。
正如我們之前所報導的,Anthropic 公司的目標是創建一種”用於人工智能自學的下一代算法”,這是它在給投資者的宣傳材料中的描述。這種算法可以用來構建虛擬助理,它們可以回復電子郵件、進行研究、生成藝術作品和書籍等等–我們已經通過GPT-4 和其他大型語言模型嚐到了其中的一些甜頭。
但Claude Instant 並不是這種算法。相反,它的目標是與OpenAI 以及Cohere 和AI21 Labs 等初創公司推出的類似入門級產品競爭,這些公司都在開發自己的文本生成(有時是圖像生成)人工智能係統,並將其產品化。
迄今為止,由前OpenAI 研究副總裁達里奧-阿莫迪(Dario Amodei)領導的Anthropic 公司於2021 年成立,已融資14.5 億美元,估值達到個位數十億。雖然這聽起來似乎很多,但與該公司估計的未來兩年創建其設想的聊天機器人所需的50 億美元相比,還相差甚遠。
Anthropic 聲稱目前擁有”成千上萬”的客戶和合作夥伴,其中包括Quora,該公司通過基於訂閱的生成式人工智能應用Poe 提供對Claude 和Claude Instant 的訪問權限。Claude為DuckDuckGo 最近推出的DuckAssist 工具提供支持,該工具與OpenAI 的ChatGPT 結合,可直接回答用戶的直接搜索查詢。在Notion,Claude 是Notion AI 技術後端的一部分,這是一個與Notion 工作區集成的人工智能寫作助手。