微軟內部遭遇AI硬件短缺被迫實施配額制
據報導,知情人士透露,雖然微軟即將宣布一整套使用GPT-4人工智能(AI)軟件的Office 365工具,但該公司現在卻面臨內部AI服務器硬件短缺的窘境。這迫使微軟不得不對硬件資源採取配額供應的方式,限制其他內部AI工具開發團隊的使用量,從而確保基於GPT-4的新版必應聊天機器人和即將發布的新款Office工具獲得足夠的資源。
這種硬件短缺的現狀還對微軟的客戶產生了影響:至少有一個客戶表示,需要等待很長時間,才能使用已經通過微軟Azure雲服務提供的OpenAI軟件。
微軟表示正在加緊添置更多硬件,以便增加AI計算能力,但如果速度不夠快,就有可能限制其Azure OpenAI服務對新客戶的吸引力。這些客戶會藉助此項服務將AI功能添加到自己的應用中。微軟原本在這種新的AI工具的商業化方面已經領先於谷歌,但如果遲遲不能解決硬件短缺問題,這種優勢也將難以發揮出來。
谷歌搶在微軟之前於本週發布了自己的AI輔助寫作工具,包括能夠根據簡短的提示,在谷歌Docs和Sheets中自動編寫文本的軟件。
服務器短缺正值OpenAI和微軟試圖快速擴大銷售範圍之際,客戶可以使用自己的數據對這種AI軟件進行微調,從而開發圖片生成、文檔總結、搜索引擎和聊天機器人等定制化AI工具。
微軟已經向OpenAI投資了數十億美元,有權通過Azure OpenAI服務向創業公司銷售軟件。OpenAI也將軟件直接授權給客戶使用——而作為與微軟合作的一部分,所有OpenAI機器學習模型都必須運行在Azure服務器上。這兩項服務的定價相同,每次請求收費都不到一美分。
這兩家公司在過去3個月推出的服務吸引了企業用戶的廣泛興趣,他們都希望將OpenAI的ChatGPT聊天機器人的底層技術整合到自家產品中。但是微軟Azure OpenAI服務的新客戶卻要面臨很長的等待時間。
硬件資源短缺的核心問題在於,GPT-4等新的AI大模型需要在GPU上運行,這種服務器芯片可以一次性處理大量數據。為了處理這個模型的龐大計算需求,微軟已將數万個GPU整合成一個個群集,分散到各個數據中心裡。
在明確用戶需求量之前,微軟目前不得不將現有的大量GPU資源預留給新的必應GPT-4聊天機器人和即將推出的GPT-4 Office工具。
知情人士表示,微軟2月剛剛推出這項必應智能聊天功能,目前還在加緊測算平均每天有多少人願意使用這項服務。知情人士表示,這就導致工程師很難預測該功能所需的計算資源。
而即將推出的Office GPT-4工具也可能導致微軟客戶對OpenAI聊天機器人技術的需求大幅激增。這些新功能包括AI文檔總結、個性化寫作建議以及編輯建議等。
其他從事AI開發的微軟團隊不得不讓位於必應和Office,包括為各種機器學習模型的開發團隊,其中就包括微軟的圖靈自然語言生成模型,它可以理解文本,之前曾為電子郵件和Office應用中的搜索工具提供底層技術。
知情人士表示,當這些團隊想要使用GPU開發新的AI工具或測試現有AI軟件時,必須向一位公司副總裁提交特別申請,獲批後才能使用硬件。
知情人士稱,有些申請需要等待幾天甚至幾週才能獲批。自2022年末,微軟就一直對內部的GPU資源實施配額供給,但1月以來的等待時間越來越長。
微軟發言人在聲明中補充道,該公司正在為Azure等服務增加更多AI資源,並且遵循“優先滿足客戶需求並根據需求進行調整的流程”。他們還補充道,微軟並不擔心AI資源。
至少有一個微軟客戶透露,他們也經歷了延遲訪問的問題。市場營銷軟件創業公司TouchCast創始人兼CEO Edo Segal說:“幾乎不可能立刻使用程序”。Edo的公司正在為多家車企開發基於GPT的互動式用戶手冊,而這項技術正是通過微軟Azure授權的。
現有的AzureAI客戶幾乎未受影響。無人駕駛汽車開發商Cruise和AI搜索創業公司Perplexity的發言人都表示,他們在使用Azure的GPU資源時並未遇到困難。
去年11月,微軟和GPU生產商英偉達共同宣布,微軟將新增數万個處理器來擴大AI處理能力,但目前還不清楚採購進度。
這兩家公司還在周一共同宣布,Azure的客戶很快就能搶先使用英偉達的新款H100 GPU——這款產品尚未廣泛發布。而知情人士稱,已經有少部分微軟內部團隊開始使用H100,但多數部門尚未獲得這項權限。