DeepMind解決蛋白質折疊難題:運算時間縮至數小時
谷歌人工智能部門DeepMind在預測蛋白質結構方面邁出了一大步。公司表示,其已經解決了關鍵的“蛋白質折疊問題”,並將解決問題的運算時間從數月縮短至數小時,這有助於加快藥物發現速度,有可能破解一個類似於繪製人類基因組的問題。
DeepMind開發的AlphaFold系統在最近結構預測關鍵評估(CASP)競賽中所展現出的能力達到了“解決”問題的水平。該活動始於1994年,每兩年舉辦一次,以加速這一課題的研究。
蛋白質的不同折疊程度決定了它如何與其他分子相互作用,了解蛋白質結構變化對發現新冠肺炎等病毒如何侵入人體細胞、設計酶分解污染物和提高作物產量具有重要意義。
DeepMind在2014年被谷歌收購,成為谷歌子公司。其開發的遊戲人工智能廣為人知。DeepMind所開發的人工智能係統能夠通過自我訓練,還在圍棋比賽中擊敗了李世石等世界知名圍棋選手。公司目標是開發可以應用於更廣泛問題的人工智能,目前為止,DeepMind已經開發出的人工智能係統能夠使谷歌的數據中心更加節能,通過掃描識別眼疾,並自動將文字生成語音。
DeepMind首席執行官傑米斯·哈薩比斯(Demis Hassabis)在電話採訪中表示:“這些算法現在已經足夠強大,強大到可以應用於解決科學問題。”“經過4年的發展,我們有了一個足夠精確的系統,對生物學研究人員來說具有實際的生物學意義和相關性。”
哈薩比斯表示,DeepMind目前正在研究以“可擴展方式”為科學家提供訪問AlphaFold系統的途徑。
參與CASP的科學家們分析了大約100種蛋白質的氨基酸序列形狀。參賽者被告知排列順序,並負責預測蛋白質的形狀。AlphaFold對其中三分之二蛋白質結構的評估與CASP的分析幾乎完全一致,而其他團隊的評估契合度約為10%。這也比DeepMind工具兩年前首次參加CASP競賽時的結果要好,當時競賽中涉及43種蛋白質結構,DeepMind準確預測出其中的25種。
哈薩比斯說,他開發AlphaFold系統的靈感來自CASP試圖找到未知蛋白質結構的嘗試,比如Foldit就是以謎題的形式向業餘志願者展示問題。在最初的兩年裡,人類玩家被證明在解開謎題方面更具優勢,最終還發現了一種讓科學家們困惑不已的蛋白質結構,並就此設計了一種新的酶,後來在實驗室得到了證實。歐洲生物信息學研究所(European Bioinformatics Institute)名譽主任珍妮特·桑頓(Janet Thornton)說:“確定單個蛋白質結構通常需要多年的實驗努力。”桑頓是使用計算方法分析蛋白質結構的先驅之一。“更好地理解蛋白質結構、能夠使用計算機預測它們意味著更好地理解生命進化歷程,當然,也能夠更好理解還有有關人類健康和疾病的諸多問題。”