AlphaFold宣布免費開放:龐大數據庫有望顛覆科學研究
由DeepMind 創始人兼首席執行官Demis Hassabis 與EMBL 合作開發的AlphaFold 數據庫,包含了人類已知的幾乎所有蛋白質形狀的AI 建模預測。擴展數據庫中儲存了大約2 億種蛋白質(比如人體可產生的一整套蛋白質),幾乎涵蓋了地球上通過基因組測序進行編目的所有生物。
(圖自:Karen Arnott / EMBL-EBI)
Demis Hassabis 表示:“AlphaFold 已成為全球數十萬實驗室和大學科學項目不可或缺的一款工具,這著實讓我們感到驚訝”。
在去年首次推出時,AlphaFold 僅包含了一組35 萬個蛋白質結構預測,然後很快增加到了100 萬(最近該數字已至2 億)。
數據庫中模擬了多種生物體的蛋白質,涵蓋了植物、細菌、動物等生命形式。
截止目前,已有來自190 個國家或地區的50 萬研究人員,在其工作過程中訪問了AlphaFold 。
自推出以來,來自AlphaFold 的信息也有被超過1000 篇論文所收錄。
在嘗試解決某些對人類來說相當緊迫的問題時,科學家們將極大地受益於此。
比如數據庫中的17 種蛋白質,就與某些“被忽視的熱帶疾病”有關—— 而這些疾病,又影響著全世界超過10 億人的生活。
據“被忽視疾病藥物倡議”(DNDI)組織預測,AlphaFold 可幫助研究人員較以往更快地發現有望用於此類疾病治療的分子。
與此同時,DNDI 本身也在使用該數據庫來應對“恰加斯病”(Chagas disease)和“利甚曼病”(Leishmaniasis)。
隨著DeepMind 和EMBL 決定免費開放該數據庫,這對發展中國家的科學家和研究人員們來說也是一個巨大的利好。
某些地區可能受到了特定疾病“不成比例”的影響,而AlphaFold 正好有望在此過程中提供力所能及的幫助,尤其是那些缺乏經費支撐的關鍵研究工作。
加速科學發現 Alphafold 項目 – DNDi(通過)
DeepMind 研究科學家兼AlphaFold 負責人John Jumper 對此寄予了厚望,表示發布該數據庫的初衷,就是希望其它團隊也可在當前已取得進展的基礎上再接再厲。
這是一個屬於結構生物學的嶄新時代,基於人工智能的方法將推動令人難以置信的進步。
此外許多其它AI 研究組織現也進入了該領域,並正利用AlphaFold 來創造進一步的突破。