一年狂攬73億美元投資Anthropic點燃矽谷大模型“戰火”
ora帶給科技圈的衝擊還未平靜,Claude 3又來了。3月4日晚,被稱之為是OpenAI最強競爭對手的Anthropic發布了其最新大模型系列Claude 3。此系列包含三個模型,能力由強至弱分別是Claude 3 Opus(著作)、Claude 3 Sonnet(十四行詩) 和Claude 3 Haiku(俳句)。
Anthropic發布的跑分顯示,Opus在多項基準測試中得分都超過了GPT-4 和Gemini 1.0 Ultra,擁有接近人類本科生水平的知識,「在數學、程式設計、多語言理解、視覺等多個維度樹立了新的行業基準」。
自去年3月GPT-4發布後,其一直是行業的最高標準以及追趕目標,此次Claude 3的出現,意味著其Top 1地位可能不保,不少人發出“GPT-4時代已過”的感嘆。
不過,天使投資人、資深人工智慧專家郭濤對第一財經表示,這可能是一種過於過激的說法,GPT-4在許多應用中可能會比Claude 3 更適合。開源大模型生態社區OpenCSG的創始人陳冉也不認可“時代已過”,他表示,這是一個層級和另外一個層級比,畢竟GPT-4已經出來很長一段時間了。
在Claude 3之後,大家自然地將目光投向了OpenAI,GPT-5或許已經不遠,這是「暴風雨前的寧靜」。
全面超越GPT-4?
根據Anthropic官方發布的跑分結果,Claude 3 Opus在本科級別專業知識(MMLU)、研究生級別專家推理(GPQA)、基礎數學(GSM8K)等領域都超過了GPT-4在內的領先模型。
事實真的是如此嗎?在Claude 3發布後,陳冉進行了試用和測評,在用他自己的一套方法測試了Opus的邏輯推理、代碼等能力後,他認為,Claude 3的整體性能相比GPT-4平均提升了50%以上,包括「幻覺」、正確率和非正確率方面的表現等。
從大模型胡亂回答問題的「幻覺」這一來看,Claude3相比GPT-4好很多,另外,在GPT-4中,有些問題不會被回答,但在Claude 3中其回答的正確率提高了。在程式碼能力和推理上,陳冉測試了貪吃蛇遊戲、撲克遊戲等,他對第一財經表示,在這些方面GPT-4都失敗了,但Claude 3 Opus做到了。
在陳冉看來,這次Anthropic的發布策略很好,一次推出三個不同性能的大模型,最出色的大模型打分都比GPT-4高,較小的模型打分也不低,而在成本上相對輕量的兩個模型會比GPT-4便宜。
Anthropic此次發表的Opus、Sonnet和Haiku分別針對不同的效能需求和成本效益。根據官方介紹,Opus是最聰明的模型,可以處理複雜的分析、具有多個步驟的較長任務以及高階數學和編碼任務;Sonnet是性能和速度的最佳組合,可實現高效、大體量的任務;Haiku是最快且最具成本效益的模型,可以執行輕量級操作,具有業界領先的速度。
在成本上,能力最好的Claude 3 Opus比GPT-4 Turbo 還要貴得多:GPT-4 Turbo 每百萬token的輸入/輸出費用為10/30 美元,而Claude 3 Opus為15/75 美元。不過,也有更具性價比的選擇,Claude 3系列中,Sonnet的輸入/輸出定價是3 美元/15 美元,Haiku是0.25 美元/1.25 美元。
值得一提的是,此次發布的Claude 3系列模型都支援200k的上下文窗口, Anthropic也特別表示,在這個基礎上,所有三個模型都能夠接受超過100 萬tokens的輸入,會提供給有特定需要的客戶。
作為對比,2023年更新的GPT-4視窗文字容量限制是32k,而2023年11月更新的GPT-4 turbo版能夠接收128k的輸入,相當於10萬字的小說長度。
對大模型來說,上下文視窗的文字長度越大,意味著其能更好地理解長篇文章或對話。此前,上海人工智慧實驗室領軍科學家林達華對第一財經介紹,有了長語境交互,大模型能夠讀幾百頁的財報,將裡面一些非常細緻的信息精準提取出來形成摘要,或者聽一場幾個小時的會議轉錄,並將會議的關鍵資訊摘取出來,對於大模型的落地很有用。
基於Claude 3在多項能力上超越了GPT-4,業界這兩天也出現了「GPT4時代已過」的聲音,不過,郭濤認為,Claude 3 在某些基準測試中超過了GPT-4,並不意味著GPT-4 的時代已經過去,一方面基準測試並不能全面反映一個模型的全部能力,例如創意寫作、情感理解或特定領域知識方面的表現;另一方面,GPT-4在許多應用中可能會比Claude 3 更適合,“而OpenAI也在不斷研發新的技術和模型,很難說GPT-4 的時代已經過去。”
能與OpenAI一較高下嗎
對於Claude3這次的超越,在驚嘆其表現之餘,業界沒有太多的意外,Anthropic過去一直被視為OpenAI最大的競爭對手之一。
Anthropic的核心團隊來自OpenAI,其創始人達裡奧·阿莫迪(Dario Amodei)曾是OpenAI的研究副總裁,也是一位與高效利他主義社區有聯繫的研究員,因對OpenAI的未來方向有一些分歧而離開,並在2021年成立了Anthropic,計畫以可信、安全可控的方式發展AI。
Anthropic是目前除OpenAI外最被看好的大模型新創公司之一。在過去一年,Anthropic狂攬約73億美元的投資,其中,亞馬遜、Google作為最主要的投資者,分別投資了40億美元和20億美元,韓國電信巨頭SK下注約1億美元。就在過去一個月,Anthropic再次獲得7.5億美元的投資,來自矽谷創投機構Menlo Ventures。
在未來與OpenAI的競爭中,陳冉認為Anthropic的勝面不小,一方面,其團隊在演算法上與OpenAI幾乎沒有差距,且Anthropic背後有亞馬遜、Google這樣的靠山,算力方面也不缺,其次,作為背後投資者亞馬遜擁有許多生態和場景,相應也能提供許多高品質的數據。陳冉認為,現在大模型競爭最關鍵的是數據,數據的品質越高越能訓練好模型。
「最終Claude有可能會贏。因為特色是合規和安全。」在Claude3發布後次日,陳冉在朋友圈表示。相較於GPT-4等模型,Claude對安全的強調特別明顯。
在技術文件中,Anthropic表示,Claude在訓練過程中重點是有幫助、無害和誠實,Anthropic透過給模型一個想法來做到這一點,即一套倫理和行為原則,模型使用這些原則來指導其產出,以避免性別歧視、種族主義和有害的產出,以及避免幫助人類從事非法或不道德的活動。此外,Anthropic還會有安全評估,信任和安全團隊會監控違反原則的有害、惡意用例的提示和輸出。
對於Anthropic未來是否能和OpenAI 一較高下,郭濤認為這主要取決於幾個方面的因素。一方面,持續的研發和創新是保持競爭力的關鍵。如果Anthropic 能夠持續推出先進的技術和改進,它有可能在市場上與OpenAI 競爭。另一方面,AI 大模型的成功不僅取決於核心技術,還取決於能夠建立廣泛的生態系統和合作夥伴關係,他認為,OpenAI 在這方面有著較強的影響力和網絡效應。此外,如何在商業模式和市場策略上進行創新和調整,也是決定未來競爭格局的重要因素。
「大家有共識目前Claude 3已經在部分能力上超越GPT-4,但具體未來能不能比GPT系列好,拭目以待。」陳冉說。
Claude 3出現了,GPT-5還會遠嗎?在Claude 3發布後不久,英偉達高級科學家Jim Fan就在X上發文調侃,「正在等待幾個小時後精心安排的GPT-5的發布」。
Jim Fan隨後表示,「我喜歡Claude在GPT和Gemini主導的競技場上掀起熱度。但請記住,GPT-4V這個每個人都迫切想要超越的高水位線,是在2022年完成訓練的。這是暴風雨前的寧靜。”