疫苗研究的革命性變革:新演算法成為中堅力量
免疫學研究人員推出了一種計算工具,透過比較不同的實驗數據來改善大流行的防備工作。這種演算法利用機器學習來發現資料集中的模式,從而加深對免疫反應的理解。它有望在疫苗設計和免疫學研究方面取得重大進展,並在各種生物學背景下具有廣泛的應用潛力。
計算生物學家利用機器學習來理解免疫系統數據。免疫系統研究人員設計了一種計算工具來提高大流行的防範能力。科學家可以利用這種新演算法來比較截然不同的實驗數據,更好地預測個體可能對疾病的反應。
拉霍亞免疫學研究所(LJI)助理教授、《細胞報告方法》(Cell Reports Methods)雜誌上這項新研究的共同負責人、博士塔爾-艾納夫(Tal Einav)說:”我們正試圖了解個體如何抵抗不同的病毒,但我們方法的美妙之處在於,你可以將它普遍應用於其他生物環境,例如不同藥物或不同癌細胞系的比較。”
這項工作解決了醫學研究中的一大難題。研究傳染病的實驗室–即使是研究相同病毒的實驗室–收集的資料種類千差萬別。艾納夫說:”每個資料集都是獨立的孤島。”
有些研究人員可能研究動物模型,有些研究人員可能研究人類患者。有些實驗室關注兒童,有些則收集免疫力低下的老年人的樣本。地點也很重要。從澳洲病人身上採集的細胞與從德國病人群體中採集的細胞相比,可能會對病毒產生不同的反應,而這僅僅是基於這些地區過去的病毒暴露情況。
「生物學的複雜性又增加了一層。病毒一直在進化,這也會改變數據,」艾納夫說。”即使兩家實驗室在同一年檢測了相同的患者,他們的檢測結果也可能略有不同。”
拉霍亞免疫學研究所(LJI)助理教授、博士塔爾-艾納夫(Tal Einav) 資料來源:拉霍亞免疫學研究所馬修-埃倫博根(Matthew Ellenbogen)。
統一的計算方法
艾納夫與史丹佛大學博士後學者馬榮(Rong Ma)博士密切合作,著手開發一種幫助比較大型資料集的演算法。他的靈感來自他的物理學背景,在這門學科中,無論實驗多麼創新,科學家都可以確信數據將符合已知的物理定律。E永遠等於mc2。
艾納夫說:”作為一名物理學家,我喜歡做的事情就是把所有東西收集在一起,找出統一的原理。”
新的計算方法不需要精確地知道每個資料集是在哪裡或如何獲得的。相反,艾納夫和馬利用機器學習來確定哪些資料集遵循相同的基本模式。
“你不必告訴我某些資料來自兒童、成人或青少年。我們只需要問機器’這些資料彼此有多相似’,然後把相似的資料集合併成一個超集,訓練出更好的演算法,”艾納夫說。隨著時間的推移,這些比較可能會揭示免疫反應中的一致原則–這些原則很難在免疫學中大量分散的資料集中發現。
對疫苗設計和免疫學的潛在影響
例如,研究人員可以透過準確了解人類抗體如何靶向病毒蛋白來設計更好的疫苗。這又是生物學變得複雜的地方。問題在於,人類可以製造大約五百萬種獨特的抗體。同時,一種病毒蛋白質的變異可能比宇宙中的原子還要多。
艾納夫說:”這就是為什麼人們正在收集越來越大的數據集,試圖探索生物學這個近乎無限的遊樂場。”
但科學家沒有無限的時間,因此他們需要一些方法來預測他們無法實際收集到的大量數據。艾納夫和馬已經證明,他們的新計算方法可以幫助科學家填補這些空白。他們證明,他們比較大型資料集的方法可以揭示無數新的免疫學規則,然後將這些規則應用於其他資料集,預測缺失的資料應該是什麼樣子。
這種新方法也夠全面,能為科學家的預測提供可信度。在統計學中,”信賴區間”是一種量化科學家對預測的確定程度的方法。
艾納夫說:「這些預測的原理有點像Netflix 演算法,它能預測你可能會喜歡看哪部電影。Netflix 演算法會從你過去選擇的電影中尋找模式。你為這些預測工具添加的電影(或數據)越多,預測就會越準確。我們永遠無法收集到所有的數據,但我們可以透過少量的測量來做很多事情。我們不僅能估算出預測的置信度,還能告訴你哪些進一步的實驗能最大限度地提高置信度。對我來說,真正的勝利一直是深入了解一個生物系統,而這個框架的目的正是如此。”
未來方向與合作
在弗雷德-哈奇癌症中心傑西-布魯姆(Jesse Bloom)博士的實驗室完成博士後培訓後,艾納夫最近加入了LJI的教師團隊。當他繼續在LJI的工作時,他計劃把重點放在使用計算工具來更多地了解人類對許多病毒的免疫反應上,首先從流感開始。他期待與LJI的頂尖免疫學家和資料科學家合作,其中包括Bjoern Peters教授(博士),他也是一位訓練有素的物理學家。
艾納夫說:”當你擁有來自不同背景的人時,你會得到很好的協同效應。有了合適的團隊,解決這些開放性的大問題終於成為可能”。
編譯來源:ScitechDaily