Facebook聲稱AI可以預測治療複雜疾病的藥物組合
Facebook今天詳細介紹了它聲稱的第一個能夠預測藥物組合、劑量、時間和其他類型的干預措施(如基因刪除)效果的單一AI模型。Facebook表示,該模型是與慕尼黑赫爾姆霍茲中心合作開發的,它可以加速識別藥物組合和其他治療方法的過程,這些方法可能會導致疾病的更好結果。
事實證明,發現重新利用現有藥物的方法是治療包括癌症在內的疾病的有力工具。近年來,醫生們已經看到”藥物雞尾酒”對抗惡性疾病的成功,並繼續探索為患者提供個性化的治療方法。但是,以合適的劑量找到現有藥物的有效組合是極具挑戰性的,部分原因是有近乎無限的可能性。研究人員必須嘗試5000到190億種解決方案,才能在100種藥物的池子裡找到最佳方案。
Facebook的開源模型–Compositional Perturbation Autoencoder(CPA),可以觀察用藥物組合處理的細胞,並預測新組合的效果。與從標籤數據集學習的監督模型不同,Facebook的通過暴露數據各部分之間的關係從數據中生成標籤,這一步被認為是實現人類級智能的關鍵。根據Facebook的說法,CPA的預測需要幾個小時,而傳統方法可能需要幾年的時間,這使得研究人員可以選擇最有希望的結果進行驗證和跟踪。
在生物學中,RNA測序被用作在分子水平上測量細胞的基因表達,並研究包括藥物組合在內的擾動的影響。學術界和工業界已經發布了包含多達數百萬個細胞和每個細胞2萬個讀數的RNA測序數據集,以促進生物醫學研究。
Facebook利用這些數據集來訓練CPA,使用一種稱為自動編碼的方法,其中數據被壓縮和解壓,直到總結成對預測有用的模式。CPA首先分離並學習關於細胞的關鍵屬性,例如某種藥物、組合、劑量、時間、基因刪除或細胞類型的影響。然後,它獨立地重新組合這些屬性,以預測它們對細胞基因表達的影響。例如,如果其中一個數據集有關於藥物如何影響不同類型的細胞A、B、C和A+B的信息,CPA將以細胞類型特定的方式學習每種藥物的影響,然後將每種藥物重新組合,以推斷A+C、B+C和A+B之間的相互作用。
為了測試CPA,Facebook表示,它將該模型應用於五個公開的RNA序列數據集,其中包含藥物、劑量和其他混雜因素對癌細胞的測量和結果。以代表基因表達預測準確性的R2指標為基準,Facebook稱CPA在訓練和測試之間”保持一致”–這是穩健性的表現。此外,CPA對藥物組合和劑量對癌細胞影響的預測與測試數據集中發現的效果”可靠”地匹配。
Facebook認為,CPA可以”極大地”加速確定最佳治療組合的過程,並為藥物開發的新機會鋪平道路。為此,該公司正在提供API和一個軟件包,旨在讓研究人員插入數據集並通過預測運行。
雖然Facebook聲稱CPA的架構很新穎,但它並不是第一個為預測藥物相互作用而設計的算法。2018年7月,斯坦福大學的研究人員詳細介紹了一個人工智能係統,該系統可以通過模擬體內19000多種蛋白質的相互作用和與藥物的相互作用來預測藥物組合的效果。