亞馬遜投了OpenAI最大敵人
亞馬遜在公司官網公佈,向大模型公司Anthropic 投資至多40 億美元,後者以擁有對標ChatGPT 的聊天機器人Claude 而聞名。雲端運算公司大筆投資大模型公司,微軟已經在今年2 月開了個好頭,以100 億美元獲得OpenAI 這個微軟雲端Azure 的大客戶,以及ChatGPT 的優先使用權。現在看來,這筆交易對微軟而言,穩賺不賠,2 月以來,微軟市值已抬升40%。
但半年後的現在,大模型領域上下游的關係正在變得複雜,亞馬遜投資Anthropic 絕不是為AWS「鎖定」客戶,甚至不一定是為了大模型。
官方合作細則顯示:Anthropic 將使用AWS Trainium 和Inferentia 晶片來建構、訓練和部署其未來的基礎模型。並且,兩家公司也將合作開發未來的Trainium 和Inferentia 技術。值得注意的是,AWS Trainium 是2020 年底,AWS 推出的客製化ML(機器學習)訓練晶片,Inferentia 晶片是由AWS 在2019 年推出的高性能機器學習推理晶片。
透過投資Anthropic 加深合作,亞馬遜旨在加速開發自研的AI晶片。
幾天前,The information 獨家爆料英偉達想從三大雲廠商中「收取一道手續費」-英偉達想從雲廠商手中租賃英偉達伺服器,從而可以透過雲,而不是伺服器或晶片的方式向AI 應用者直接提供服務,這些應用者也包括三大雲端廠商。
但,只有亞馬遜拒絕了這項提議。
現在看來,亞馬遜拒絕英偉達的底氣在於,想辦法加快升級自研AI 晶片。大模型時代,亞馬遜穩住雲端運算市場第一寶座的核心競爭力在於,AI 晶片。
第一雲平台出手OpenAI 最大敵人
對於這份合作,亞馬遜表示,將初步投資12.5 億美元購買Anthropic 的少數股權。作為交易的一部分,亞馬遜表示可以選擇將對Anthropic 的投資增加至40 億美元。
作為擴大合作的一部分:
Anthropic 將使用AWS Trainium 和Inferentia 晶片來建構、訓練和部署其未來的基礎模型,並受益於AWS 的價格、效能、規模和安全性。兩家公司也將合作開發未來的Trainium 和Inferentia 技術。
AWS 將成為Anthropic 的主要任務關鍵型工作負載雲供應商,包括安全研究和未來基礎模型開發。Anthropic 計劃在AWS 上運行大部分工作負載,進一步為Anthropic 提供全球領先雲端供應商的先進技術。
Anthropic 做出長期承諾,為世界各地的AWS 客戶提供透過Amazon Bedrock 存取其下一代基礎模型的權限,Amazon Bedrock 是AWS 的完全託管服務,可提供對業界頂級基礎模型的安全存取。此外,Anthropic 還將為AWS 客戶提供早期存取模型客製化和微調功能的獨特功能。
亞馬遜開發人員和工程師將能夠透過Amazon Bedrock 使用Anthropic 模型進行構建,這樣他們就可以將生成式AI 功能融入他們的工作中,增強現有應用程序,並在整個亞馬遜業務中創造全新的客戶體驗。
兩家公司並未透露亞馬遜投資Anthropic 的估值。
Dario and Daniela Amodei|圖片來源:時代
Anthropic 由OpenAI 前員工Daniela Amodei 和Dario Amodei 創辦,他們是OpenAI GPT2 和GPT3 的核心研發人員。目前,Anthropic 擁有最受歡迎的聊天機器人之一,Claude。
作為ChatGPT 製造商OpenAI 的挑戰者,Anthropic 今年稍早獲得了Google 4 億美元的投資,並在3 月Spark Capital 的一輪融資後估值超過40 億美元。
亞馬遜想幹嘛?
向Anthropic 至多投資40 億美元,亞馬遜到底想幹嘛?
一個顯而易見的原因是,為了「搶」客戶。大模型廠商和AI 應用企業作為雲端運算(未來)最大的客戶,成為各大雲端廠商的必爭之地。
今年以來,Google、微軟、AWS、甲骨文和英偉達心照不宣、不約而同都做了一件事——透過策略性投資「鎖定」客戶(花錢買客戶),儘管這項作業在財務上備受爭議。
但事實上,Anthropic 自2021 年以來就一直是AWS 的客戶,AWS 透過40 億美元加深與Anthropic 的合作,旨在更深的合作權益:大模型,以及最重要的——自研AI晶片。
換句話說,透過策略性投資這筆學費,亞馬遜學習怎麼做大模型。也透過和與OpenAI 對壘的對手切磋,研發甚至顛覆英偉達GPU的AI晶片。畢竟,GPU 並不是為訓練神經網路而生,靠CUDA 和各種技術一個場景一個場景「魔改」是一種選擇,但不是最優解。
亞馬遜執行長安迪·賈西(Andy Jassy) 的發言側面印證了這一點,他表示:“相信我們可以透過更深入的合作幫助改善許多短期和長期的客戶體驗。”
短期和長期的客戶體驗,對應亞馬遜的大模型和自研AI 晶片。
他進一步補充,「客戶對Amazon Bedrock 以及AWS 的AI 訓練晶片AWS Trainium 感到非常興奮,Amazon Bedrock 是AWS 的新託管服務,使公司能夠使用各種基礎模型來建立生成式AI 應用程式;而AWS Trainium 是AWS 的AI 訓練晶片,我們與Anthropic 的合作應該可以幫助客戶獲得這兩項功能更多的價值。”
事實上,上半年,亞馬遜推出了自己的大模型Titan,並對外宣布了這一大模型的典型客戶,但幾天后便被這一典型客戶跳腳,向媒體被吐露亞馬遜大模型不好用。
可見,亞馬遜在自研大模型的準備上,並不充分。因此,亞馬遜轉而向市場大力推廣大模型平台Amazon Bedrock,客戶可以在該平台調用其他主流大型模型廠商的服務,包括Anthropic。
另一方面,亞馬遜需要穩住雲端運算的基本碟。
在大模型時代,雲端運算面臨不同的工作負載,需要探索新的技術來實現更快的推理能力。在這方面,亞馬遜其實也是先行者。自研資料中心晶片和伺服器,曾一度被視為AWS 為「區別於微軟和Google」所做的「最重要的事情之一」 ,其伺服器擁有更高的速度,並且省電。
在AI 專有晶片和伺服器上,亞馬遜也是三大雲端廠商中(微軟雲端、Google雲端)中佈局最早的。但其AI 晶片的進展和效能一直沒有單獨對外釋放訊息,而是透過捆綁在伺服器中,透過雲端服務向客戶提供服務。因此,客戶直接感知到的只有雲端運算的效能,而沒有其中晶片的效能。
現在,亞馬遜需要了解哪些工作負載在哪種處理器上最適合,和Anthropic 的合作是實現手段之一。
目前,根據The information 生成式AI 資料庫的69 家公司中,有32 家使用Amazon,26 家使用Google,13 家使用Microsoft 作為雲端提供者。當然,有些公司使用多個雲端提供者。
大模型時代,雲端運算、大模型和AI 應用的合作與競爭正在變得更加複雜。歷久未有大變局的雲端運算產業,也終於迎來的變革的契機。