NVIDIA新一代Ada GPU內核圖曝光:RTX 4090性能翻番無壓力
NVIDIA將亮相台北電腦展舉辦專題演講,雖然老黃缺席,但GeForce業務高級副總裁在列,還是有希望公佈RTX 40系顯卡的消息甚至是提前發布。在此之前,爆料達人Kopte7kimi分享了號稱是AD102 GPU的內核設計圖。
AD102也就是Ada Lovelace家族的次頂配核心,也是RTX 40系遊戲旗艦卡的配置,大概率對應RTX 4090 Ti、RTX 4090顯卡。
分析來看,AD102內建多大12組GPC(顯示計算簇),比上代GA102多出70%。每組GPC包括6個TPC(2個SM),每個SM單元包括4個子核心,這都與安培相同,但不同的是,每個SM子核心包含128組FP32單元,加上IN32整數單元合計達到192。
完整AD102包括24組SM,所有就是12288個FP32單元加上6144 INT32,說通俗易懂點就是18432個CUDA。
緩存方面,AD102核心中,每組SM享有192KB L1,比安培增加50%,共計4.5MB。L2增加到96MB,是安培的16倍。
相應的,ROP和RT光追單元規模自然也是水漲船高,AD102最多384個ROP,RTX 3090 Ti不過112個。另外,光追單元升級到第三代,Tensor單元升級到第四代。
基於此,RTX 4090最終實現性能翻番似乎並不是可望不可及的虛妄,就FP32單精度浮點來說,外界預期能到90T,而RTX 3090 Ti不過40T,代價就是超600W的功耗……