Stability AI推出適用於一般電腦的文字產生圖像模型SD3 Medium
Stability AI 推出Stable Diffusion 3 Medium 版,可以在自己的筆記型電腦/ 桌上型電腦上快速產生圖片。此模型參數只有20 億,佔用的顯存空間較小可以在NVIDIA RTX 和AMD 新顯示卡上使用。
Stable Diffusion 系列文字產生圖形模型開發商Stability AI 今天宣布基於SD3 推出了新版本SD3 Medium 版,該版本尺寸體積非常小只有2B 參數,因此適合在消費級筆記型電腦、桌上型電腦和企業級GPU 上運行。
和先前的SD 系列模型一樣,SD3 Medium 版也是免費提供的,屬於開放但非開源的模型,如果需要商業性使用則應購買授權。
Stable Diffusion 3 Medium 版有以下特點:
- 參數規模僅20 億
- 照片級真實感:克服手部和臉部常見的瑕疵,無需複雜的工作流程即可產生高品質影像
- 遵守複雜的提示詞:可以理解涉及空間關係、構圖元素、動作和風格的複雜提示詞
- 內容排版:在Diffusion Transformer 架構的幫助下,大幅改善生成文字內容時的偽影和拼字錯誤問題
- 高效利用資源:佔用的顯存非常小,非常適合在消費級PC 和筆記型電腦上運行並且不會降低效能
- 微調:能夠從小資料集中吸收細微的細節,因此也適合進行客製化
哪些消費級顯示卡/ 企業級顯示卡支援SD3 Medium 版:
Stability AI 與英偉達和AMD 合作,在部分消費級和企業級顯示卡上優化SD3 Medium 的推理,其中也為英偉達推出了特別版本。
支援的英偉達顯示卡主要是NVIDIA RTX 系列,Stability AI 利用RTX 顯示卡和TensorRT 來提升效能,其中TensorRT 優化版本提供更好的效能,用戶可以下載英偉達專版的SD3 Medium。
AMD 方面支援AMD 最新的APU、消費級GPU 和米蘭300X 系列企業級GPU,經過AMD 優化後也可以使用SD3 Medium,不過性能方面可能要比英偉達專版的要低些。
從哪裡取得SD3 Medium 版本:
其中英偉達專版的TensorRT 版SD3 Medium 可以在這裡下載:https://huggingface.co/stabilityai/stable-diffusion-3-medium-tensorrt
適用於AMD 的通用版本可以在這裡下載:https://huggingface.co/stabilityai/stable-diffusion-3-medium