NVIDIA GeForce RTX 50 系列因放棄32 位元支援而面臨運算效能問題
PassMark 軟體已經確定了NVIDIA 新一代GeForce RTX 5090、RTX 5080 和RTX 5070 Ti GPU 意外降低運算效能的根本原因。 究其原因是英偉達在其”Blackwell “架構中悄悄停止了對32 位元OpenCL 和CUDA 的支持,從而導致與現有基準測試工具和應用程式的兼容性問題。
當PassMark 的DirectCompute 基準在RTX 5000 系列顯示卡上傳回錯誤代碼”CL_OUT_OF_RESOURCES (-5) “時,問題就顯現出來了。

經過調查,開發人員確認,雖然該基準的主要應用程式多年來一直是64 位元的,但幾個計算子基準仍然使用32 位元程式碼,而這些程式碼以前在RTX 4000 和更早的GPU 上可以正常運行。 英偉達並沒有明確記錄這一架構變化,儘管取消了實際支持,但英偉達的開發者網站仍繼續顯示32 位元程式碼範例和文件。
因此,基於傳統CUDA 基礎架構(包括PhysX 等技術)建立的應用程式將經歷顯著的效能下降,因為運算任務將退回到CPU 處理,而不是利用GPU 的平行架構。 雖然這種回退機制允許舊版應用程式在RTX 40 系列和先前的硬體上運行,但RTX 5000 系列完全透過CPU 處理這些任務,從而導致效能大幅降低。
PassMark 正在努力將受影響的OpenCL 程式碼移植到64 位,以便對新GPU 的運算能力進行適當的測試。 不過,他們警告說,如果不修改原始程式碼,許多包含32 位元OpenCL 元件的現有應用程式可能永遠無法在RTX 5000 系列顯示卡上正常運作。
該基準測試開發人員也指出,這項變更並不能完全解釋DirectX9 效能不佳的原因,顯示其他架構變化可能會影響傳統的渲染路徑。
PassMark 今天更新了其軟體,但傳統基準仍可能受到影響。 以下是在未使用最新PassMark V11.1 build 1004 補丁的情況下運行的舊版基準測試,顯示了最新一代產品在沒有適當軟體支援的情況下所受到的影響。
