Anthropic新模型發佈在即程式設計能力超o3-mini
美東時間2月13日,根據The Information報道,人工智慧新創公司Anthropic計畫在未來幾週內推出一款創新的混合AI模式。這款模型的獨特之處在於,它可以在深度推理和快速回復之間動態切換,為開發人員提供一個多功能工具。根據一位使用過該模型的人士透露,Anthropic的新模型在處理複雜問題時,可以調動更多計算資源進行深入推理,而面對簡單任務時,模型又能夠像傳統大語言模型一樣快速處理,無需額外計算。
最重要的是,它提供一種新穎的「滑動比例」功能,開發者可以透過滑動條精準控制模型在處理查詢時使用的運算資源量,從而調整推理深度和模型的「思考」時間。例如,將滑動條設為「0」時,模型將作為普通的非推理AI運行,類似於OpenAI的GPT-4o。
這為開發者提高了成本效益,使他們能夠根據具體需求平衡成本、速度和效能。相較之下,OpenAI在推理能力上的設計選擇較為簡單。公司目前提供的是「低」、「中」和「高」三個固定設定。一些開發者反映,預測模型在不同層級下實際處理的tokens數量仍然充滿不確定性,這使得他們很難估算單次查詢的成本。
從產品設計來看,OpenAI似乎更注重面向普通消費者和個人專業用戶,因此採用簡單易懂的「低-中-高」命名方式,而Anthropic則更專注於企業市場,其推出的精細化控制功能,允許開發者透過滑動條來調節AI模型的運算資源,使得企業能夠在成本、速度和效能之間找到最佳平衡點。
社群媒體X上有用戶表示:
“鑑於Claude已經引起轟動,這可能會改變遊戲規則。”

“準備好被另一個人工智能模型震撼吧!Anthropic即將推出一個混合天才,他可以深度思考,反應速度比你說“創新”還快。”

Anthropic程式設計能力超過OpenAI的o3-mini?
去年秋季,OpenAI率先發布了具有推理能力的模型,隨後谷歌、阿里巴巴和高飛資本管理等公司紛紛跟進,推動了推理模型的競賽。
而在這場競賽中,Anthropic則保持低調,選擇了一條不同的技術路線。如今,它終於揭開了這一謎底,並計劃透過這款新模型實現雄心勃勃的營收目標。根據The Information的報導,Anthropic的目標是超越OpenAI,成為應用程式開發者的首選AI供應商。
根據OpenAI執行長Sam Altman在社群媒體X上的最新透露,OpenAI將推出GPT-4.5,這將是一個傳統的非推理模型。接下來,OpenAI計畫將GPT模型與「o」推理模型整合為單一AI系統,這項舉措似乎借鑒了Anthropic的研發路徑。
值得一提的是,Anthropic的新模型在编程方面取得了显著进步。生成式AI在企业应用中,编程已成为最强大的应用领域之一。一位使用过该模型的人士表示,当模型被允许以最长时间“思考”时,在某些编程基准测试中,其表现超过了目前客户可以使用的最先进的OpenAI推理模型(即设置为“高”推理级别的o3-mini模型)。
與OpenAI的推理模型更擅長處理學術性程式設計問題不同,Anthropic的模式更適合企業工程師的日常程式設計任務。特別是在處理複雜的程式碼庫時,Anthropic的模型能更能理解由數千個檔案組成的複雜程式碼庫,並且能夠產生首次即可運行的完整程式碼行。
這一特性尤其值得關注,因為AI模型在面對複雜程式設計問題時往往會“偷懶”,僅提供註解而非實際程式碼。
目前,關於Anthropic新模型的定價問題仍未明確。業界普遍關注其是否能比OpenAI最近發布的o3-mini推理模型更加經濟實惠,後者已被認為具有較高的性價比,吸引了大量開發者。
隨著像DeepSeek和Google最新的Gemini模型等低價AI產品的推出,整個市場是否會趨向低價化,仍然是業界關注的熱門議題。目前,AI模型市場可能分為兩個陣營,一是前沿開發,即持續改進推理或程式設計能力的模型仍具有定價優勢。二是「夠好」模型,它們在價格上可能會相互壓低,形成激烈的競爭。