美國政府限時半價對外出租Perlmutter超算的GPU算力
私營公司迫切需要額外的GPU 計算能力來訓練其新的生成式人工智能服務,但他們在獲得這些能力方面遇到了重大挑戰。相比之下,參與美國超級計算項目的研究人員目前可以以大幅折扣獲得強大的NVIDIA GPU 節點,儘管時間有限。
與國家能源研究科學計算中心(NERSC) 和美國能源部合作的用戶現在可以在Perlmutter 的GPU 節點上執行任務,而成本僅為幾週前的一半。此特別優惠有效期至九月底。NERSC 的Rebecca Hartman-Baker 表示,這為暑假後開始計算密集型研究提供了絕佳的機會。
Perlmutter 是NERSC 的主要高性能計算系統,由一台配備3072 個AMD “Milan”EPYC CPU 和1792 個NVIDIA A100 GPU 加速節點的超級計算機組成。該系統融合了多項技術創新,旨在提高使用NERSC 服務的研究人員的科學生產力。
重要的是,它專門用於科學研究目的。“Perlmutter”這個名字是為了紀念傑出的美國天體物理學家索爾·珀爾穆特(Saul Perlmutter),他領導的團隊因證實宇宙加速膨脹的開創性證據而獲得諾貝爾獎。
NERSC 的50% 折扣優惠是目前在Perlmutter GPU 節點上運行科學作業的激勵措施,從而避免了典型的“年底緊縮”,其特點是查詢時間延長和作業周轉延遲。Hartman-Baker 在一封電子郵件公告中表示,利用HPC 系統目前使整個NERSC 社區受益,因為它有助於全年更均勻地分配計算需求。
從9 月6 日到10 月1 日開始的任何工作或其中的部分將只收取標準費用的一半。Hartman-Baker 解釋說,由於這種限時折扣率,在7 個GPU 節點上執行3 小時的作業只需花費10.5 個GPU 節點小時,而如果沒有折扣,同樣的作業將產生21 個GPU 節點的費用。
NERSC 還通過Perlmutter GPU“虛擬辦公時間”為用戶提供額外幫助,為超級計算機GPU 節點的入門提供支持,解決分配不足、性能不佳等問題。Perlmutter 第一階段的整體處理能力於2022 年5 月27 日結束,達到70.9 PFLOPS。
正如第一個報導NERSC 特別優惠的微軟HPC 存儲專家Glenn K. Lockwood 所強調的那樣,人工智能行業目前正在努力應對“GPU 緊縮”的問題,而且不太可能很快得到解決。如果美國能源部將其“閒置”計算能力出租給商業工作負載,美國政府可能會產生可觀的收入來源。