DeepMind今日發布並開源其最先進AI蛋白質預測工具AlphaFold3程式碼
「遲來總比沒有好」! Google DeepMind今天向充滿期待的學術界公開了其最新人工智慧蛋白質預測軟體的原始碼。儘管部分科學家對DeepMind耗費六個月才公佈代碼表示不滿,但絕大多數科學研究人員對此表示歡迎。
5月8日,DeepMind在《自然》雜誌上發表文章,宣布推出了AlphaFold3,該技術不僅能夠預測蛋白質結構,還能預測其與DNA、RNA和其他蛋白質的相互作用,這對於藥物發現等領域具有重大意義。
然而,他們對技術的發布方式提出了批評:儘管《自然》雜誌的編輯指南要求發表的研究必須提供計算代碼,但該論文僅提供了“偽代碼” ——即程序運行步驟的描述——以及一個每天只允許有限次數預測的線上入口網站連結。這與DeepMind在2021年《自然》雜誌上發表的提供完整程式碼的AlphaFold2形成了鮮明對比,違背了公認的開放性、可重複性和同行評審的標準。在一封獲得數百人簽名支持的公開信中,研究人員明確指出了這一點。
面對抵制,DeepMind承諾在論文發表後六個月內向非商業用戶公開全部程式碼。如今,它履行了這項承諾。
此計算模型已在程式碼儲存庫GitHub上以非商業許可證的形式公開發布,而用於調整AI模型的「權重」(數值)也可供完成簡短申請表的學者使用。
DeepMind科學副總裁Pushmeet Kohli表示:「我們感謝社區的耐心等待。」儘管他和他的團隊堅信他們發布的程序是正確的,但Kohli承認社區希望直接使用代碼。他補充說,為了今天的公開發布,他們花了數月時間準備和測試模型。
對此,研究人員表示歡迎。斯德哥爾摩大學的生物物理學家埃里克·林達爾,也是公開信的簽署人之一,表示:「我很高興看到DeepMind團隊履行承諾,公開代碼,這意味著對一篇重要論文的深入審查終於可以開始了。重要意義。
AlphaFold3是最新的AlphaFold版本,它是一種基於氨基酸序列的蛋白質結構預測AI,今年早些時候,它憑藉這項技術為DeepMind的兩位研究員約翰·朱默和德米斯·哈薩比斯贏得了諾貝爾化學獎的提名。然而,直到今天,研究人員只能透過DeepMind的線上入口網站使用該程序,每天僅限10個(現為20個)請求,且只能處理有限的分子集合。
《自然》雜誌主編瑪格達萊娜·斯基珀在今年5月的聲明中沒有具體說明為何放棄了分享完整代碼的要求,但她提到編輯們考慮了“生物安全的潛在影響以及由此帶來的倫理挑戰」。同時,《自然》雜誌的一篇新聞報導引用科赫的話稱,團隊限制了AlphaFold3的訪問權限,以避免影響DeepMind的商業子公司Isomorphic Labs的藥物研發計劃。科利向《科學》雜誌透露,DeepMind團隊優先開發了這個門戶,而不是發布程式碼,「以確保我們為最多的人提供了最簡單的介面。」朱默表示,透過這個門戶,研究人員已經完成了一些“令人難以置信的工作”,而這項工作在今天的新聞發布後並未改變。他懷疑大多數科學家將繼續以這種方式工作,因為這對那些計算能力有限的團隊來說更為實用。
DeepMind的研究人員也反駁了一些批評者的說法,並表示《自然》雜誌上的論文是可以重複的,因為有多個團隊已經基於偽代碼開發了自己的AlphaFold3版本。百度、Ligo Biosciences和Chai Discovery等專注於AI的公司已經發布了這些努力的結果。倫敦大學學院的生物資訊研究員丹尼爾·布坎指出,這些替代「實現」方案在AlphaFold 3的代碼現已公開的情況下,仍可能很有用。 「能夠重現方法是件好事,也是很重要的,」他說。萬科維茲補充稱,比較和對比這些模型可能會在未來帶來改進。研究人員表示,尤其重要的是那些不受限制的使用者授權的實施方案,例如非營利組織OpenFold聯盟正在開發的方案。否則,「如果我幫助一位同事設計出一種可能成為潛在抗癌藥物的全新配體,而某天他們想與製藥公司合作將其商業化,事情就會變得非常複雜,」福克斯蔡斯癌症中心的計算結構生物學家羅蘭鄧布拉克說。他最初被要求為《自然》雜誌審閱DeepMind的手稿,但從未收到代碼進行審閱。已經有一些研究團隊計劃與AlphaFold3的程式碼合作。
今天發表在《自然計算科學》雜誌上的一篇論文的作者表示,他們希望將AlphaFold3整合到自己的軟體中。這款名為MassiveFold的程式可以幫助用戶利用平行運算來縮短在AlphaFold2運行大量預測所需的時間——從數月縮短至數小時。
法國國家科學研究中心的生物資訊研究員、MassiveFold開發者Guillaume Brysbaert表示,透過整合DeepMind的新程式碼,「使用者可以從AlphaFold2或AlphaFold3獲得最佳預測結果」。朱默說,DeepMind團隊期待今天公開發布的成果。 「在AlphaFold2中,我們看到了很多創造力,」他說。 “我真的很興奮地想看看社區會發現AlphaFold3是如何運作的——它如何應用於新的問題?”