單顆物理GPU太貴?阿里雲發布雲上首個輕量級GPU實例
當地時間3月18日,在矽谷舉辦的2019年NVIDIA GPU技術大會(GTC)上,阿里雲發布了國內首個公共雲上的輕量級GPU異構計算產品——VGN5i實例,該實例打破了傳統直通模式的局限,可以提供比單顆物理GPU更細粒度的服務,從而讓客戶以更低成本、更高彈性開展業務。
訪問:
在該實例發布之前,業內均採用以單顆物理GPU為單位的雲端異構計算服務。然而,在不少使用異構計算服務的場景中,“計算資源過剩”問題也尤為明顯。
以雲遊戲為例,企業通常僅需要一顆物理GPU幾分之一的計算能力即可流暢完成圖形或視覺計算;人工智能領域也存在類似問題,深度學習推理場景對GPU的計算資源消耗可能僅僅是訓練階段的數十分之一,甚至更少。對於這類應用場景而言,輕量級計算異構產品可以提升系統靈活性,並大幅降低成本。
而阿里雲本次首家提供雲上輕量級GPU實例,意味著用戶可以用更細粒度的計算資源開啟業務。該產品基於NVIDIA Tesla P4 GPU,支持多種規格,企業可以按需選擇實例規格或者在雲市場選擇NVIDIA Quadro虛擬工作站,適用於雲遊戲、AR/VR以及圖形處理等隨需應變的GPU計算場景。
阿里雲表示,5月還將發布基於NVIDIA T4的GPU異構計算產品VGN6i實例,NVIDIA T4採用最新的Turing架構,在虛擬化環境中更為靈活,可加速深度學習和推理工作流程的Tensor Core,以及可加速光線追踪和批量渲染的RT Core。
該產品由阿里雲與NVIDIA合作研發,集成了阿里雲智能資源調度技術,用戶可以按需選擇適量的計算資源;同時,還採用了安全隔離技術,實現不同用戶之間的強隔離,有效防止信息洩漏;除此之外,QoS控制技術保障了每個用戶的GPU資源不被其他租戶搶占。
阿里雲智能異構計算產品專家張新濤表示,“隨著輕量級GPU異構計算產品的推出,阿里雲實現了GPU的異構計算場景全覆蓋,可以為用戶提供從從輕量到高性能計算的服務。”