Stable Diffusion背後團隊發布開源大語言模型可用於本地部署

2023-04-21 Comments 0 Comment

開發AI圖像生成工具Stable Diffusion的創業公司Stability AI宣布，發布並開源該團隊訓練的大語言模型StableLM。根據該團隊的公告，目前StableLM的“阿爾法版本”中擁有30億和70億參數的模型已經可以從GitHub等開源平台上下載，後續還將推出150億至650億參數的版本。

（來源：Stability AI）

與Stable Diffusion類似，StableLM同樣支持知識共享4.0協議，開發者可以在遵守協議的情況下，將這個模型用於商業或研究活動。

這家公司在去年發布的Stable Diffusion，使得AI“文生圖”賽道成為AIGC領域商業化前景最為明朗的行業。

Stability AI介紹稱，StableLM可以生成文本和代碼，並將助力一系列下游應用。這個模型建立在經典訓練集The Pile的新實驗訓練集上，token數量翻了3倍至1.5萬億，公司也將在適當的時候發布數據集的詳細信息。儘管公佈出來的模型參數量很少，但數據集的豐富性使StableLM在會話和編程任務中表現出驚人的高性能，展現了小型高效模型如何通過適當的訓練提供高性能。

（效果演示，來源：Stability AI）

與GPT-4等超級大模型不同，Stability AI的產品可供每一個人下載並部署在本地。這種做法也曾遭到一些非議，因為徹底開源意味著這些模型極有可能被用於惡意目的，例如撰寫釣魚鏈接的文案和協同軟件攻擊等。

對此，Stability AI在周三的公告中也予以回應，強調開源模型是為了促進透明度和培養信任。研究人員可以“深入了解”以驗證性能、研究可解釋的技術、識別潛在風險並幫助制定保障措施。公共和私營部門可以針對自己的應用程序“微調”這些開源模型，無需共享敏感數據或放棄對AI功能的控制。

當然，如此“大方開源”的背後，Stability AI也背負著沉重的營收壓力。據新興財經媒體Semafor 4月初報導，Stability AI去年底剛剛融到1億美元的資金正接近“快速燒完”，公司CEO Emad Mostaque的領導風格也遭到內部質疑。

一	二	三	四	五	六	日
					1	2
3	4	5	6	7	8	9
10	11	12	13	14	15	16
17	18	19	20	21	22	23
24	25	26	27	28	29	30

WONGCW 網誌

記錄生活經驗與點滴

Stable Diffusion背後團隊發布開源大語言模型可用於本地部署

2023-04-21 Comments 0 Comment

相關

發表迴響取消回覆

分享此文：

相關

發表迴響取消回覆