科學家開發出一種機器學習方法幫助設計更好的抗體藥物
據外媒報導,抗體不僅由我們的免疫細胞產生,以對抗體內的病毒和其他病原體。幾十年來,醫學界也一直在使用生物技術生產的抗體作為藥物。這是因為抗體非常善於根據“鎖鑰原理”專門與分子結構結合。它們的用途包括從腫瘤學到治療自身免疫性疾病和神經退行性疾病等。
然而,開發這種抗體藥物並不簡單。基本要求是抗體以最佳方式與其目標分子結合。同時,一種抗體藥物必須滿足一系列的額外標準。例如,它不應該在體內引發免疫反應,它應該利用生物技術有效地生產,並且它應該在很長一段時間內保持穩定。
一旦科學家們找到了與所需分子目標結構結合的抗體,開發過程就遠遠沒有結束。相反,這標誌著一個階段的開始,在這個階段中,研究人員利用生物工程來嘗試改善抗體的特性。由蘇黎世聯邦理工學院(ETH)生物系統科學和工程系教授Sai Reddy領導的科學家們現在已經開發出一種機器學習方法,支持這一優化階段,幫助開發更有效的抗體藥物。
機器人無法管理超過幾千個
當研究人員以治療形式優化整個抗體分子時(即不僅僅是抗體的一個片段),過去是以一個與所需目標結構合理結合的候選抗體開始。然後研究人員隨機突變攜帶抗體藍圖的基因,以便在實驗室中產生幾千個相關的候選抗體。下一步是在它們之間進行搜索,以找到與目標結構結合最好的抗體。”通過自動化流程,你可以在實驗室中測試幾千個候選治療藥物。但要篩選出比這更多的東西其實並不可行,”Reddy說。通常情況下,這種篩選中最好的十幾種抗體將進入下一步,並測試它們滿足額外標準的程度。他說:”最終,這種方法可以讓你從幾千人的群體中找出最好的抗體。
通過機器學習大量增加候選者庫
Reddy和他的同事們現在正在使用機器學習,將待測的初始抗體集增加到幾百萬。Reddy說:“可供選擇的候選藥物越多,找到真正符合藥物開發所需的所有標準的機會就越大。”
ETH的研究人員利用羅氏的抗體癌症藥物赫賽汀為他們的新方法提供了概念證明,該藥物已經上市20年了。”但我們並不希望就如何改進它提出建議–你不能只是追溯性地改變一種已批准的藥物,”Reddy解釋說。”我們選擇這種抗體的原因是它在科學界是眾所周知的,而且它的結構已在開放的數據庫中發表。”
計算機預測
從赫賽汀抗體的DNA序列開始,ETH研究人員使用他們幾年前開發的CRISPR突變方法創建了大約4萬個相關抗體。實驗表明,其中1萬個抗體能很好地與有關的目標蛋白,即一種特定的細胞表面蛋白結合。科學家們使用這4萬種抗體的DNA序列來訓練一種機器學習算法。
然後他們將訓練好的算法用於搜索一個包含7000萬個潛在抗體DNA序列的數據庫。對於這7000萬個候選抗體,該算法預測了相應的抗體與目標蛋白結合的程度,從而得出了一個預計會結合的數百萬序列的列表。
利用進一步的計算機模型,科學家們預測了這幾百萬個序列將如何滿足藥物開發的額外標準(耐受性、生產、物理特性)。這將候選序列的數量減少到8000個。
科學家們從他們計算機上的優化候選序列列表中選擇了55個序列,在實驗室中生產抗體並描述其特性。隨後的實驗表明,其中幾個序列與目標蛋白的結合甚至比赫賽汀本身更好,而且比赫賽汀更容易生產和更穩定。Reddy說:“一種新的變體甚至可能比赫賽汀在體內的耐受性更好。眾所周知,赫賽汀會引發一種微弱的免疫反應,但在這種情況下,這通常不是一個問題。”然而,對於許多其他抗體來說,這是一個問題,而且對於藥物開發來說是必須要預防的。”
ETH的科學家們現在正在應用他們的人工智能方法來優化正在進行臨床開發的抗體藥物。為此,他們最近成立了ETH衍生公司deepCDR Biologics,該公司與早期和成熟的生物技術和製藥公司合作進行抗體藥物開發。