富士通為AI伺服器和HPC推出動態資源分配技術
富士通的業務傳統上專注於銷售運算產品、大型主機伺服器和高效能運算設備。 現在,該公司正致力於利用其”運算最佳化專長”,提供基於軟體的創新解決方案,以滿足尖端人工智慧應用對GPU 日益增長的需求。
在 2023 年推出”计算代理”解决方案之后,富士通现在已经确认,该产品最终可以在日本和全球其他市场购买。 这家总部位于川崎的公司旨在通过软件实现传统上由硬件处理的功能,从而显著提高资源优化和 GPU 利用率。
這項新技術以中介軟體的形式呈現,旨在按GPU 動態分配資源,優化多個平台和人工智慧應用的利用率和高階記憶體管理。 計算代理可即時分配CPU 和GPU 運算資源,優先處理執行效率更高的進程。 即使進程已經在GPU 上運行,它也能重新分配。
據報道,在發布前的測試中,富士通的GPU 處理效能最多提高了2.25 倍。 該技術還提供了令人印象深刻的記憶體管理能力,因為它可處理150GB 的人工智慧工作負載,約為測試GPU 實體記憶體容量的五倍。
富士通最初表示,開發人員需要使用其專有框架才能充分利用新計算代理技術的功能。 然而,最新發布的公告並未提及這項要求。 該公司目前正在努力進一步增強該技術,旨在支援資料中心環境中安裝在多台伺服器上的多個GPU。
富士通表示,自2024年5月以來,已有多家公司對計算代理中間件進行了測試。 據報道,日本金融科技企業Tradom 已在生產中採用了該技術,而雲端服務供應商Sakura 正在評估該技術在優化資料中心營運方面的潛力。
富士通強調了資源最佳化在降低基於GPU 的人工智慧應用能耗方面的價值。 隨著生成式人工智慧服務繼續主導技術領域,企業級GPU 仍然是最炙手可熱的硬體組件之一。 該公司認為,提高這些系統的運作效率對於滿足日益增長的需求至關重要。