奧特曼曬「星際之門」首期工廠:全美狂建20座超算70萬塊GPU 老黃爆賺375億
「星際之門」更多內幕被曝光了!據稱,首期投入1,000億美金,將在德州阿比林興建10座資料中心,未來將在全美打造20個超算。同時,奧特曼秀出了首期工廠的全景,無比震撼。一大早,奧特曼直播剛下線,就炫出了「星際之門」首期工廠。
而我們以上看到的,還只是「星際之門」的1號基地。
據稱,德州阿比林(Abilene)已經獲批875英畝地(約354萬㎡),面積堪比紐約中央公園,計畫打造10個資料中心。未來,4年耗資共5,000億美金,在全美興建共20座超算中心。
奧特曼最新的帖子,是對馬斯克昨日嘲諷做出的有力回應。
奧特曼與馬斯克正面開懟,手撕對方
馬斯克所說的一切,真的只是噱頭嗎?
「星際之門」自周二官方宣布以來,備受各界關注,尤其是5000美金投資直接引爆了全科技圈的熱議。據稱,這筆金額相當於達到了「曼哈頓計畫+阿波羅計畫」總額。
這令人瞠目結舌的數字,不得不引發各界的猜想。
正如馬斯克昨日battle的所言,軟硬實際上獲得的融資遠低於100億美金。
那麼,真實情況到底是怎麼樣的呢?
SemiAnalysis獨家透露,事實上,「星際之門」的第一階段已經確定,並在德克薩斯州阿比林資料中心基地展開。
不過,他們確認了馬斯克的話——軟銀的確沒有足夠資金來建造如此規模的算力集群。
下文中,他們將詳細剖析「星際之門」的實際情況、微軟目前面臨的危機、專案架構和成本,以及這個算力集群的真實情況。
千億美元集群已鎖定
除了奧特曼放出的實景,SemiAnalysis也製作了一張德州集群建設的宏觀圖。
在確定的第一階段,也只是已承諾的1000億美元投資的一部分。至少可以說,這個數字最終數字(5,000億美元)的計算方式著實令人玩味。
4個月前,著名分析師便在「Multi-Datacenter Training」報告中,已經公開討論了位於德州阿比林資料中心基地第一階段規劃。
「星際之門」背後真實數據
他們認為,這個計畫是按總擁有成本(TCO, Total Cost of Ownership),而非資本支出來計量的。
換言之,1,000億美元和5,000億美元指的是TCO,其中包括資料中心、伺服器、網路設施、電力供應的資本支出,以及債務融資在內的許多營運成本。
此外,目前只有首期1000億美元項目,已經確定了資料中心選址和電力供應。 「星際之門」計畫整體資金仍未完全到位。
還有一個容易產生誤解的細節是,這個大型計畫的第一個算力集群,其實就是去年宣布的Oracle和OpenAI合作計畫。
該項目完全由Lancium、Crusoe和Oracle負責建造。據分析師了解,軟銀和MGX等其他方並未參與其中。
全美20座超算,10個已開工
事實上,OpenAI週二官員宣博文中,已經明確了「星際之門」是一家新成立的合資企業公司。
在這個項目中,他們計劃在未來4年內斥資5000億美元,用於AI基礎設施建設,其中1000億美元將立即投入使用。
这是第二届特朗普政府宣布的首个重大AI计划,由于监管政策显著放宽,未来可能会推出更多类似计划。
星際之門計畫的股權創始方包括軟銀、甲骨文、MGX和OpenAI,其中前三家公司負責前期注資。
軟銀和OpenAI是核心合作夥伴,軟銀負責財務管理,而OpenAI主導營運工作,包括幾乎所有的算力集群管理軟體。
如前所述,該專案計畫共興建20個資料中心,其中10個已在德州阿比林開工,每個佔地約46,500平方公尺(50萬平方英尺)。
首期1000億美元支出明細
最初的Oracle/Crusoe計畫作為其中一個資料中心,將與其他超級園區互聯,實現規模比現有任何訓練運行,都大數個量級的分散式訓練。
先前,奧特曼提到的「已經在建設中」的星際之門計畫園區,即為Oracle/Crusoe阿比林園區。
該園區將容納OpenAI使用的10萬台GB200算力集群。這個開發項目以及計劃在第二季和第三季交付的GB200伺服器,將部署在Oracle/Crusoe的資料中心內。
下面是2024年12月29日,拍攝的園區高清照片。
4個約11,150平方公尺的「模組」組成了一棟44,600平方公尺的建築,目前僅有兩棟建築在建,關鍵IT負載容量約為180兆瓦。
為了讓大家理解這規模,整個由20棟建築組成的園區將包含80個這樣的「模組」!
根據「加速器模型與資料中心模型」中,分析師為OpenAI/微軟/甲骨文規劃的建設計劃,OpenAI無需建造新園區就能部署全部1000億美元的總擁有成本(TCO)。
因此,他們認為「星際之門」計畫合資企業的首期1000億美元將全部投入這個園區。
在Lancium的官方網站中,這個園區被稱為“Abilene Clean Campus”,並聲稱將在2025年實現1GW供電能力。
然而,透過多個產業消息來源和文件,該園區已額外獲得1GW容量,總供電能力達到2.2GW。
據此可以估算,該園區的關鍵IT負載容量為1.8GW,能源使用效率(PUE)約為1.25。
雖然他們可能透過優化使PUE接近2GW IT容量,但考慮到GB300特別是VR200的功率密度提升,這個目標將很難實現。
70萬塊GPU,老黃首期爆賺375億刀
除了正在部署的10萬台GB200算力集群外,分析師估計,他們還將在整個園區部署另外20萬台GB300和約40萬台VR200(英偉達計劃在2026年推出的超算,分別對應Vera CPU和Rubin GPU)。
他們根據園區1,000億美元總擁有成本(TCO)投資,以及人工智慧TCO模型中的單位成本,計算出了Vera Rubin處理器的隱含數量。
約70萬台GPU的總IT功率為1.8GW,與Oracle/Crusoe阿比林園區1,800兆瓦的容量相符。
簡而言之,OpenAI預計為首個GB200叢集支付的成本,約為每GPU每小時2.8美元,全規模叢集的TCO為每小時2.38美元。
這些數字會隨著未來英偉達GPU的部署而隨之調整。
OpenAI的支出將超過1,000億美元,但這並非前期資本投入。
分析師也估計英偉達從中獲得的收入和IT設備資本支出相對較為適中,分別約為375億美元和490億美元。這將佔用整個1.8GW Crusoe Lancium站點的容量。
隨著向GB300和VR200演進,每一代GPU的數量都將翻倍,單一GPU的功率需求也在增加。
雖然70萬塊GPU對於1,000億美元的投資而言規模似乎不大,但需要注意的是,這相當於數百萬台Hopper(英偉達高效能運算架構)GPU的算力。
刷存在感的軟銀
甲骨文和軟銀是知名的股權提供者。
MGX是一個新成立的阿布達比科技投資平台,由Mubadala和G42共同創立。該基金由Sheikh Tahnoon bin Zayed al-Nahyan擔任主席,據報導他監管超過1.5兆美元的投資基金。
鑑於馬斯克聲稱軟銀籌資不到100億美元,需要特別指出的是,該合資企業還將透過專案融資籌集「債務資本」。
目前「股權融資」和「債務融資」的具體比例尚未確定,但甲骨文和MGX憑藉其雄厚的資產負債表,可以為專案提供大量資金支持。
也就是說,即便軟銀沒錢,還有甲骨文和MGX。
據悉,OpenAI和軟銀各自在帳面上,承諾投入190億美元。軟銀目前雖然沒有這麼多流動資金,但預計可能會透過出售部分ARM股份來籌集所需的股權投資。
OpenAI同樣缺乏這筆資金,但他們可以在新產品o3發布後進行融資,而且不必直接全額籌集,可以透過向聯合體其他成員發行「混合資本工具」來實現。
需要承認的是,馬斯克的判斷是正確的,他們目前確實還沒有籌集到這筆資金。
關鍵問題在於專案融資風險能否與母機構分開。這種風險隔離十分重要,因為OpenAI需要籌集資金來支付相關費用。
對OpenAI而言,一個有利因素是這筆資金不需要立即到位。
OpenAI現有資金足以支付今年10萬台GB200集群的租金,但他們需要確保能夠支付2026年及以後大幅上漲的租金。
雖然OpenAI可能無法直接籌集到所需資金,但高級分析師相信,他們的技術和產品發展將能夠支撐這一規模的支出。
誰是最大贏家?
我們看到,在「星際之門」合資計畫的公告中,出現了許多科技巨頭的名字,例如英偉達、Arm、微軟、甲骨文以及前面提到的投資方。
這些都是令人印象深刻的知名企業,但現實情況是,既有輸家,又有贏家。
若說誰是最大的輸家,恐怕就是微軟了。
微軟,最大loser
當OpenAI選擇了另一個基礎設施合作夥伴時,微軟實際上被擠到了邊緣位置。
同時,納德拉的態度已經非常明確:僅守住800億美金投資!
週二,微軟部落格陳述了合作關係的事實,以及微軟擁有優先購買權。
但現實是,這對微軟的長期發展將產生逐步顯現的負面影響,因為他們不願意承擔這項投資的風險。
此外,更令人咋舌的是,負責OpenAI合作關係的Chris Young也在公告發布後突然離職。
樂觀態度的分析師會說,微軟正將其AI計劃的部分資本密集型業務轉移給甲骨文,但SemiAnalysis認為這種短期收益無法抵消失去OpenAI收入和控制權帶來的長期潛在損害。
雖然馬斯克和納德拉提出了同樣的疑問——“實際的收益在哪裡”,但馬斯克已製定計劃,要讓他們的田納西州孟菲斯基地以不低於OpenAI的速度發展;
而納德拉則沒有在內部建造前沿AI模型的計劃。
Arm:技術夥伴,還是虛假新聞
Arm股價因被列為技術合作夥伴而上漲約16%,但這僅僅是因為其Grace和Vera CPU與英偉達的Blackwell和Rubin GPU配套使用。
軟銀可能力推讓Arm加入公關陣營,表面上確實效果不錯。但實際上Arm並未發揮實質作用。
對Arm股東而言,現實情況如上所述,軟銀可能不得不出售其在公司的部分股份,以為「星際之門」股權投資提供部分資金。
我們認為投資人大多忽略了這一點,錯誤地將這個公告視為實質的利多消息。
甲骨文承擔了管理資料中心和供應鏈物流的重任;管理1.8GW集群並按照另一家公司的要求採購所有必要設備是一項極具挑戰性的任務。
英偉達顯然深度參與其中,因為主要依賴的是他們的硬體。
而OpenAI將保持營運控制權,並運行幾乎所有自己的叢集管理軟體。
全部用於一次訓練
這個項目的規模令人印象深刻,但正如分析師最近在Fabricated Knowledge中所分析的那樣,這似乎是AI發展熱潮中的另一個重要里程碑。
我們知道,首批1,000億美元將投資於阿比林基地,而剩餘的4,000億美元將用於開發更多資料中心基地。
更值得注意的是,所有這些資料中心基地都將持續建設,旨在實現AI分散式訓練的目標。
值得注意的是,僅僅複製4個相當於阿比林規模的基地,就能產生9GW的核心IT算力,而這些算力將全部用於一次AI訓練。
在SemiAnalysis分析中的,隨著資料中心互聯(DCI)建設的持續推進,Marvell和Ciena將成為最大贏家,Fabrinet將獲得可觀收益,而Coherent和Lumentum則會獲得相對較小的收益。