加速3.8倍AMD GPU終於優化Stable Diffusion
NVIDIA AI之強大,不僅在於硬體效能好,更離不開生態優化適配,可以發揮最佳效率,AMD相較之下就差了很多,但也在努力追趕。現在,Stability AI發表了ONNX框架優化的Stable Diffusion模型,在相容的AMD Radeon顯示卡、銳龍集顯上最多可以提速達3.8倍。

AMD表示,過去一年來,一直在與OSV、OEM、ISV廠商合作,優化AMD硬體上的AI應用,包括硬體設計、驅動程式、編譯器、機器學習模型等等。
根據官方公佈的數據,經過優化之後,SDXL 1.0、SDXL Turbo在AMD硬體上的推理性能,對比基礎的PyTroch模型最高提升3.8倍,SD3.5則可提升最多2.6倍。
實際圖片、影片產生應用中,SDXL 1.0、SDXL Turbo、SD3.5 Large、SD3.5 Large Turbo在RX 9070 XT顯示卡上的效率分別提升了3.1倍、1.5倍、3.3倍、2.1倍。
SDXL 1.0、SD3.5 Large、SD3.5 Large Turbo在銳龍AI MAX+ 395上的效率,則分別提升了1.4倍、3.3倍、3.0倍。

AMD硬體優化版的Stable Diffusion模型有一個特殊的「_amdgpu」後綴標記(例如stable-diffusion-3.5-large_amdgpu),現在已經可以在Stability AI或Hugging Face上下載了。
你也可以使用AMD、TensorStack AI聯合打造的最新版Amuse 3.0。
注意,AMD GPU驅動版本不要低於24.30.31.05預覽版,或等待即將發布的25.4.1正式版。
