AMD頂級APU展現實力銳龍AI Max+ 395跑DeepSeek R1:比RTX 5080快3倍以上
AMD展示了其最新的銳龍AI MAX+ 395 “Strix Halo” APU在DeepSeek R1 AI基準測試中的表現,比NVIDIA RTX 5080桌面版顯示卡高出3倍以上。銳龍AI MAX+ 395 “Strix Halo” APU整合了16核心、32執行緒的Zen 5架構處理器、50 TOPS的XDNA 2神經處理單元(NPU)和整合式顯示卡。

RTX 5080显卡仅配备16GB的VRAM,这在处理大型语言模型时成为明显的瓶颈,而Strix Halo APU的128GB统一内存可以灵活分配,最多可将96GB内存转换为显存,使其在处理大型AI模型时具备显著优势。
在實際測試中,AMD使用了包括llama.cpp驅動的應用程式LM Studio在內的多種消費者AI工作負載進行基準測試。

結果顯示,當LLM模型大小超過16GB VRAM時,Ryzen AI MAX+ 395的效能優勢特別明顯,其效能比RTX 5080高出3.05倍。


即使與更高階的RTX 5090(32GB記憶體)相比,Strix Halo APU的128GB統一記憶體仍使其在處理大型機型時佔據絕對優勢。

AMD表示,銳龍AI MAX+ 395相較於Copilot+競品的優勢主要如下:
性能:
與英特爾Arc 140V相比,最高提升2.2倍的token吞吐量
最高可達4倍於Llama 3.2 3b Instruct等小型模型的首個token生成時間
最高可達9.1倍於7-8B參數模型的速度
14B參數模型最高比英特爾酷睿Ultra 258V快12.2倍
記憶體:
提供高達128GB的統一內存,而競爭對手的最大僅為32GB
可將高達96GB轉換為顯存
可運行其他APU無法處理的更大模型,如GoogleGemma 3 27B Vision
