人工智慧、資料中心和雲端運算的背後:不斷變化的伺服器業務
最近人們都在談論人工智慧、資料中心和雲端運算,記住GPU 和CPU 等處理器只佔伺服器前期成本的20% 左右是很有幫助的。這些處理器往往最受關注,因為必須先選擇處理器,而正是這項決定推動了伺服器中其他一切的選擇,但它們只是總成本的一部分,記憶體則佔20%。但是,一台伺服器一半以上的成本還是來自於較普通的產品。
那就是:印刷電路板(PCB)、被動元件、電纜、電源、硬碟和放置它們的機架,我們應該加上網絡,它的成本可能比所有其他元件都要高,但我們還是留到下次再說吧。那麼,誰來銷售所有這些設備,價值又從何而來?
特邀作者喬納森-戈德堡(Jonathan Goldberg)是多功能顧問公司D2D Advisory 的創辦人。
這裡有兩類供應商–原始設備製造商和原始設計製造商–我們不打算拼寫首字母縮略詞,因為這實際上會混淆視聽。一般來說,原始設備製造商擁有品牌和最終客戶關係。原廠委託設計代工提供採購和製造,即所有設備的實際生產和組裝。在兩者之間,設計和系統整合領域有相當多的重疊,重要的是,原始設備製造商和原始設計製造商之間的界限是模糊的,在許多領域都有很大的交叉。
一段歷史。 1990 年代,隨著個人電腦製造商將生產基地從美國轉移到亞洲,這種模式應運而生。個人電腦品牌,即原始設備製造商將業務外包給主要位於台灣的合約製造商。這些公司在台灣生產設備,後來大量轉向中國。隨著時間的推移,合約製造商向價值鏈上游移動,增加了設計能力。合約製造商變成了原始設計製造商,然後其中許多公司分拆成獨立公司,銷售自己的品牌產品,成為自己的原始設備製造商。這種模式逐漸演變成今天大多數大批量電子產品的生產方式。
伺服器的發展速度略有不同。這些產品的產量較低,價格較高,因此OEM(品牌所有者)可以更長時間地保留設計功能(有時是製造功能)。多年來,原始設備製造商與英特爾公司合作設計了一系列伺服器。然後,他們將這些產品銷售給客戶。雖然它們提供各種配置,但這些基本上都是目錄系統–客戶從可選項中挑選。
十餘年後,雲改變了這一切。
最關鍵的是,公有雲供應商(又稱超大規模提供者)開始主導市場,不僅集中了經濟實力,也集中了技術能力。隨著時間的推移,超大規模企業在很大程度上拋棄了原始設備製造商,直接與原始設計製造商合作,採購他們自己設計的系統。
如今,原始設備製造商主要包括惠普、戴爾和聯想。原始設計製造商有數百家,但最大的都在台灣,包括仁寶、富士康、英業達、廣達和緯創。這些公司都非常多樣化,在供應鏈中分佈著數十家子公司。此外,還有一些其他委託設計代工公司,它們往往專注於特定的利基市場,例如時下的熱門股超微公司(SuperMicro),它們的專長是GPU 伺服器。
如今,超大規模企業與其他所有人之間存在著鴻溝。試想一家大型企業,如銀行、快餐連鎖店或汽車製造商,他們可能仍然希望擁有自己的伺服器,甚至是資料中心。他們將與原始設備製造商合作,後者將為他們提供可供選擇的系統目錄。然後,原始設備製造商通常會充當系統整合商的角色–與所有供應商合作採購零件、組裝印刷電路板,然後將所有設備連接在一起並安裝軟體。原始設備製造商在這裡扮演著重要的角色,因為許多採購決策都是由他們做出的。
相較之下,超大規模企業經營數十個資料中心。他們的業務建立在龐大的規模經濟基礎上,如果能降低5%的伺服器成本,就能節省數億美元。除此之外,他們還擁有集中的技術人才。簡單地說,他們有能力僱用團隊來設計針對其特定需求進行最佳化的伺服器。而其他大公司則沒有這樣的團隊,也不需要這樣的團隊,只是營運規模不同而已。然後,超大型企業直接與原始設計製造商合作,由後者收集所有組件,組裝系統並佈線。在這裡,幾乎所有組件的購買決定都是由最終客戶做出的。
這給所有元件供應商帶來了一個大問題。試想一家晶片供應商。他們需要說服客戶購買他們的晶片,但客戶要的不是晶片,而是一個完整的工作系統。在他們同意任何大額訂單之前,客戶會希望測試該系統,確保它能很好地運行他們的軟體。因此,晶片供應商必須與OEM 或ODM 合作設計該系統。而這些設計是要花錢的。由5-10 人組成的團隊需要一兩個月的時間來佈置一切、驗證效能並確保韌體和軟體的兼容性。然後,還得有人購買元件來製造一些原型。
這些成本增加得很快,每個系統動輒幾十萬,通常達到七位數。因此,晶片供應商在銷售單一晶片之前,必須投入大量資金。客戶都希望伺服器盡可能接近他們的需求,這意味著必須有人生產多個版本的伺服器,因此成本會急劇上升。而這一切,都要在人們知道該平台的銷售情況之前。
這個問題越來越嚴重。當只有英特爾和AMD 在銷售伺服器CPU 時,供應鏈的決策空間有限,而且都是成熟的供應商。而現在,CPU設計者多達十幾家,組合難度大大增加。任何想進入人工智慧加速器市場的人都必須面對所有這些成本。而對於較小的供應商來說,他們必須非常謹慎地對待自己的賭注。
投資熱門晶片的支持,回報可能是巨大的,但投資於錯誤的平台,回報是巨大的損失。在向超級電腦銷售時,問題就更加突出了。他們需要的遠不止幾個原型。他們有嚴格的測試週期,從十幾個系統到數百個系統,再到數千個系統。他們可能會為此付費(也可能不付費),但任何設計晶片的公司都需要比這更大的產量,才能證明測試系統的成本是合理的,更不用說整個晶片的成本了。
當然,也有各種各樣的計劃來實現這些方面的標準化。開放運算專案的核心任務是實現伺服器設計的標準化。雖然開放運算專案為業界做出了一些重大貢獻,但我們認為沒有人會將其描述為通用標準。所有這些都將變得更加複雜。
資料中心日益多樣化,從純CPU 到異質運算,這迫使所有供應商(不僅僅是晶片設計商)開始承擔一些重大風險。許多廠商會追逐每一筆交易,其他廠商則可能會重蹈覆轍,專注於AMD、英特爾以及現在的NVIDIA。聰明的廠商會採取投資組合的方式來經營業務,並以類似對沖基金經理人或創投的方式監控自己的選擇。我們無意危言聳聽,這在很大程度上是電子產品週期性的自然法則。隨著時間的推移,該行業將找到一些新的平衡點,但未來幾年將更加混亂。