GPU運算爆發誰還記得遊戲顯示卡鼻祖GeForce 256?
GPU運算驅動AI。 2024 年8 月,國產遊戲《黑神話:悟空》正式開賣。作為近期熱度最高的國產遊戲,《黑神話》憑藉出色的劇情發展、場景設計和配樂成功“出圈”,不僅遊戲愛好者們“人手一份”,不少已經“戒遊戲”的老玩家也選擇趁機升級電腦,換張新顯示卡好好享受遊戲。
儘管這種為了遊戲而換顯卡的行為看起來有「衝動消費」的意思,但回顧近幾年的遊戲史,我們不難發現,每次現象級遊戲走火,同時也有大量玩家為此升級顯示卡。例如用豐富遊戲性推動GTX 1060 顯示卡的《PUBG》和《鬥陣特攻》,用優秀行銷、畫質推動RTX 時代的《賽博龐克2077》,成為RTX 4060「帶貨王」的《Apex》。可以說每一款成功遊戲的背後,都有一張「現象級N 卡」。
圖片來源:英偉達
那麼問題也隨之而來──英偉達第一張遊戲顯示卡面世時,遊戲產業是怎麼樣的呢?
1999 年,英偉達發布了第一張遊戲顯示卡-GeForce 256。但在GeForce 256 發布之前,市場上已經存在多個顯示卡(GPU)品牌,例如3dfx 的Voodoo(巫毒)系列、Matrox(邁創)、S3 Graphics、ATI 的Rage 系列。
和現代的GPU 一樣,這些GPU 同樣基於3D 加速技術,但可惜的是,這些GPU 產品缺乏統一的3D 加速制式。這意味著遊戲開發者必須針對不同顯示卡優化遊戲,顯著增加了開發成本和難度。此外受產品效能的限制,這些GPU 也無法支撐複雜的3D 遊戲。
同時,《古墓奇兵》、《雷神之鎚2》、《星海爭霸》等遊戲的流行也推動了玩家對3D 遊戲的期望。也就在這時,英偉達GeForce 256 出現了。
GPU運算爆發,都有哪些先行者?
GeForce 256 是全球首款被稱為GPU 的產品,源自於其首次將圖形處理的多個功能整合於單一晶片,這一行為定義了GPU 這一概念,同時也將複雜的3D 渲染任務從CPU 中解放出來,賦予GPU 專門的運算職責。從GPU 的歷史進程來看,這也為後來GPU 的廣泛應用奠定了基礎。
圖片來源:英偉達
此外,GeForce 256 也將T&L(Transform & Lighting、變換與光照)硬體加速整合到GPU 中,使3D 場景的變換和光照計算由GPU 專門負責。這是圖形處理史上的重大突破,以前這類運算任務通常由CPU 執行,不僅效率低下,也限制了遊戲畫面的表現力。透過GeForce 256,遊戲畫面的複雜性和細節大幅提升,推動了3D 遊戲時代的到來。
而GeForce 256 出色的表現也將GPU 這個概念帶到遊戲產業之外。別急,此時的英偉達還沒拿出CUDA 這種改變GPU 產業生態的大殺器。但GeForce 256 優異的效能,確實為GPU 在科學運算、金融分析等領域的應用奠定了基礎。
如果說GeForce 256 開啟了GPU 圖形運算的時代,那英偉達在2008 年發布的GeForce 8800 GTX,則真正解放了GPU 的效能。很顯然這張顯示卡的效能放在現在早已不值一提,但這張顯示卡上,英偉達提出了CUDA(統一運算架構)這個概念。
CUDA 的出現讓GPU 不僅可以用來處理圖形運算,還可以用來執行、加速基於CUDA 的通用運算,讓電腦成為真正的通用工具。
圖片來源:英偉達
而在提出了CUDA 後,英偉達也在2018 年進一步對GPU 的算力進行細化,引入了RT Core、Tensor Core 的概念,讓光線追蹤和專門的ML 計算成為可能——Tensor Core 透過高效執行大規模矩陣運算,顯著加快了AI 模型的訓練和執行速度。
根據英偉達的介紹,現階段RTX AI 已經對10 種不同的AI 場景實現覆蓋,包括遊戲、影視、自動駕駛和科學計算等領域。深受英偉達用戶喜愛、可以顯著提高遊戲FPS 的DLSS,就基於Tensor Core 來實現,可以說是廣大遊戲玩家最早接觸到的真AI 用例了。
圖片來源:英偉達
在影視製作領域,RTX AI 加速渲染速度,使複雜的光線和反射效果在短時間內完成,從而縮短了製作週期。在自動駕駛方面,RTX GPU 處理大量影像和感測器數據,支援即時決策,提高車輛的安全性與精準性。此外,AI 也用於醫療影像處理、金融預測和科學模擬,加速資料分析和預測模型的訓練。
不誇張的說,RTX AI 的出現不僅推動了高階視覺效果和AI 運算的整合,也降低了企業使用AI 的門檻。它正逐漸成為各產業提升效率、創新業務的關鍵引擎,引領未來科技的發展趨勢。
GPU運算驅動AI,但AI運算不全靠GPU
但話說回來,儘管GPU 的算力提升讓AI 能以驚人的速度普及,現階段英偉達確實是AI 算力的代名詞,以及個人AI 計算機的唯一選擇。但這是否意味著美歐強勁GPU 的設備,就無緣AI 時代呢?
答案是否定的。
在2024 雲棲大會上,阿里集團CEO、阿里智慧雲董事長兼CEO 吳泳銘表示:
生成式AI 改變運算架構,從CPU 主導的運算體係到GPU 主導的AI 運算遷移。 AI 時代將是「GPU 算力為主,CPU 算力為輔」的運算模式。 2024 年市場新增算力,超過50% 的需求AI 驅動產生,此趨勢將持續擴大。
不可否認,即使是阿里雲提供的AI 雲算力,背後也主要由GPU 驅動。但從另一個方面想,將GPU 算力集中在雲端,配合裝置本地的CPU、NPU 進行混合AI 運算,其實也不失為一個好主意。
首先,這可以緩解算力瓶頸,提升運算彈性。 GPU 在AI 運算中的核心地位毋庸置疑,但個人開發者和消費者通常難以承受購買和維護大量GPU 的成本。將GPU 算力集中在雲端,讓使用者按需租用雲端GPU 資源,可以避免一次性高額投入。這種模式也提供了極大的彈性,可根據任務需求隨時擴展或縮減算力。
其次,許多終端設備受限於尺寸和耗電量,無法配備高效能GPU。透過在雲端完成複雜的AI 運算,並將結果傳輸至本機裝置執行簡單任務,裝置可以保持輕量化且功耗低。這種混合運算模式,特別適合邊緣設備和移動終端。
圖片來源:英偉達
而且在本地CPU 和NPU 的配合下,雲端GPU 的運算能力可以最大化利用:設備本地的NPU 可以快速處理延遲敏感的任務,如語音辨識和即時影像分析;而複雜的模型訓練和推理則交由雲端GPU 完成。這種模式有效縮短了計算回應時間,提升了使用者體驗。
短時間來看,英偉達在AI 算力市場的優勢仍然巨大,但是長遠來看,群狼環伺之下的AI 市場,英偉達雙拳難敵四手。諸如行動PC、智慧終端等英偉達的弱勢市場,很快就會被其他廠商瓜分乾淨,而關鍵的伺服器市場也並非高枕無憂,AMD 的MI300 系列AI 顯卡份額增長迅速,已經足夠引起英偉達的警覺。
不過,競爭所帶來的創新與發展,才是科技進步的關鍵,隨著AI 領域的競爭加劇,其實也推動AI 成本的下降,讓AI 技術得到更快、更廣泛的應用。就像吳泳銘說的:
AI 驅動的數位世界連結具備AI 能力的實體世界,將會大幅提升整個世界的生產力,對實體世界的運作效率產生革命性的影響。
一個圍繞著AI 而生的新生態,此時此刻就在我們面前。