效率提升1200倍麻省理工開發AI製藥新模型
據外媒Tech Xplore報導,麻省理工學院的研究人員最近開發了一種叫做EquBind的新模型,這個模型可以提前預測新蛋白質分子的結構,提升藥物開發的效率。目前這項技術已經得到了業界內的認可,闡述這項技術的論文也將在7月被國際機器學習會議(ICML)接收。
一、速度提升1200倍,EquBind模型能迅速篩選類藥物分子
目前,藥物研發是一件漫長而又昂貴的事情。其中最主要的原因就是開發藥物的成本十分昂貴。這種成本不僅包括數十億美元的資金投入,還包括長達數十年的研究時間。
而且在研發的過程中,90%的藥物都會因為無效或副作用太多而研發失敗,只有10%的藥物能夠順利通過食品和藥物管理局的檢查,被批准上市。
因此,製藥公司會提高研發成功藥品的價格,來彌補研發失敗藥品造成的損失,所以目前有些藥物的價格居高不下。
▲一些蛋白質分子結構
如果研究人員想要進行藥物開發,就要先找到有開發潛力的類藥物分子(drug-like molecules)。藥物研發進程緩慢還有另一個重要的原因,那就是現存的類藥物分子數量龐大。數據顯示,目前現存的類藥物分子多達10 16種,這個數字遠遠超出了現有的分子計算模型的計算上限。
為了處理數據如此龐大的分子,加快藥物開發的進程,麻省理工學院電子工程和計算機科學系的研一學生Hannes Stärk開發了一種叫做“EquBind”的幾何深度學習模型。EquBind比現存最快的分子計算對接模型運行速度快1200倍,能夠更快地找到類藥物分子。
二、EquBind模型能精準預測蛋白質結構,提升藥物研發效率
目前大多數傳統的分子計算對接模型都是通過一種叫做“配體-蛋白質”(ligand-to-protein binding)的方法尋找類藥物分子。具體而言,模型需要先接收大量的樣本分子,然後讓配體與各種分子進行結合,然後模型再對不同分子進行評分,再以最後的排名來篩選出最合適的分子。但是這種做法流程繁複,模型尋找類藥物分子的效率較低。
Hannes Stärk對這個過程做了一個形象的比喻,他說:“以前的典型的’配體-蛋白質’方法就好像是試圖讓模型把鑰匙插入有很多鑰匙孔的鎖,模型要花費大量的時間為鑰匙和每一個鎖孔的適配度打分,再選出最合適的那個。”
他繼續解釋道:“而EquBind可以跳過最花費時間的步驟,可以在遇到新分子時提前預測最合適的’鎖孔’,這就是所謂的’盲配對’(blind docking)。EquBind有內置的幾何推理算法,能夠幫助模型學習分子的基本結構。這個算法可以讓EquBind在遇到新的分子時直接預測出最合適的位置,而不用花費大量的時間嘗試不同的位置並打分。”
▲麻省理工學院
三、EquBind模型已在業界成功應用,作者期待更多反饋
這個模型引起了治療公司Relay的首席數據官帕特·沃爾特斯(Pat Walters)的注意。沃爾斯特建議Hannes Stärk的研究小組用這種模型來進行用於治療肺癌、白血病和胃腸道腫瘤的藥物開發。通常而言,用於這些領域藥物的蛋白質配體很難用大多數傳統的方法對接,但是EquBind卻能讓它們成功對接。
▲兩種治療肺癌的抑製劑藥物
沃爾特斯說:“EquBind為蛋白質對接問題提供了一種獨特的解決方案,它解決了結構預測和綁定位點識別等問題。這種方法可以很好地利用數千種公開的晶體結構信息,EquBind可能會以新的方式影響這個領域。”
發表這項技術的論文將在7月被國際機器學習會議(ICML)接收,該論文的作者Hannes Stärk表示:“我很期待能在這次會議上收到一些關於EquBind模型的改進意見。”
結語:AI與製藥適配度極佳,發展勢頭正盛
AI製藥是一個2020年才走進公眾視野的新興領域。
製藥領域是一個天然的AI場景。新藥研發的長周期、高成本、低成功率,給AI留下了龐大的用武之地:機器可以自主學習數據、挖掘數據,總結歸納專家經驗外的藥物研發規律,繼而優化藥物研發流程中的各個環節,這不僅可以提升藥物研發效率與成功率,還有望降低研發費用和試錯成本。
因為這樣的特性和發展潛力,目前AI製藥勢頭正盛。但也有業內人士唱衰,說AI在製藥過程中扮演的終歸只是輔助角色,繞不開行業固有的流程和機制,不可能用兩三年的時間做完十年的事。
但是整體而言,目前AI製藥領域還是不斷有新的技術突破,發展蒸蒸日上。
來源:Tech Xplore