富士通新技術可優化人工智慧和高效能運算工作負載的CPU和GPU分配

富士通是日本跨國企業集團，主要銷售個人和企業運算產品以及x86 和大型伺服器。該公司在高效能運算（HPC）領域也很活躍，當然也像地球上其他科技公司一樣，對利用最新的人工智慧熱潮很感興趣。

富士通開發了兩項新技術，旨在優化強大的高效能運算系統上的CPU 和GPU 工作負載。該公司正致力於即時分配資源，以更好地管理具有高執行效率的進程，同時優化多個程式的平行處理。富士通表示，新解決方案旨在解決生成學習和其他人工智慧相關技術的爆炸性需求所導致的全球GPU短缺問題。

這些最佳化技術包括一個”自適應GPU分配器”（Adaptive GPU Allocator），它似乎可以偵測程式是需要在GPU加速器上執行還是在CPU上執行。分配器是作為一個獨立的伺服器實現的，旨在測量程式碼執行效能。

如果程式希望在HPC 系統中使用GPU，則分配器伺服器就會批准訪問，同時檢查GPU 和CPU 上迷你批次作業的處理時間。如果GPU 批次測試無法充分縮短處理時間，分配器就會繼續在CPU 上重新分配作業。不幸的是，程式需要專門編寫，以便透過專用框架使用新的分配器伺服器，富士通公司證實了這一點。

另一種優化高效能運算工作負載的解決方案是互動式高效能運算（Interactive HPC），富士通將其描述為世界上第一種”在高效能運算系統上即時切換多個程式執行”的技術。富士通解釋說，傳統的控制方法採用單播通信，將程式執行”逐個”切換到每台伺服器上。

互動式HPC 採用廣播通訊方法，向HPC 系統中的每個運算節點發送切換指令。富士通表示，在256節點的高效能運算環境中運作時，新方法似乎足以將進程切換時間從幾秒縮短到100毫秒。

富士通對新GPU分配技術的計畫主要集中在AI平台”Kozuchi”上，該公司的人工智慧平台旨在為客戶提供測試”先進人工智慧技術”的快速方法。這項HPC 優化技術也將應用於富士通的40 量子位元量子電腦模擬器。在運算即服務的高效能運算環境中的進一步應用似乎也在考慮之中。

WONGCW 網誌