人工智能可能是防止下一次傳染病全球大流行的秘密武器
早在2016年,也就是在一場呼吸道傳染性疾病大流行讓世界陷入停滯的四年前,聯合國環境規劃署(UNEP)就對人畜共患病敲響了警鐘,將其確定為全球關注的關鍵新興問題。現在,根據世界衛生組織的數據,每年約有10億個病例和數百萬人死亡是人畜共患病造成的,其中病原體從脊椎動物跳到人類身上。而在過去30年中被發現的30種新型人類病毒中,有75%源自其他動物。
但是蒙特利爾大學的科學家們相信他們新的人工智能模型有能力突出和預測新出現的病毒”熱點”,這可以在可能爆發的動物到人類的感染中搶占先機,最好能防止類似COVID-19的事情再次發生。
該算法花費了研究人員三年的時間和一萬個小時的計算,能夠識別病毒和宿主之間的8萬個新的潛在互動,以及它們在世界上最值得關注的地方。
蒙特利爾大學生物科學系教授Timothée Poisot說:”我們從2020年的頭幾個月開始就一直在研究這個項目,在大流行病爆發之前。”
通過機器學習,而不是人工在數據中建立聯繫,該算法能夠評估數以千計的哺乳動物物種和數以千計的病毒,併計算出所有可行的組合。
Poisot說:”基本的問題是,我們只知道病毒和哺乳動物之間的1%到2%的互動,這些網絡是分散的,相互作用很少,只集中在少數幾個物種中。我們想知道哪種病毒有可能感染哪種哺乳動物,這樣我們就可以確定哪些相互作用最有可能發生”。
該團隊使用了最大的開放數據集CLOVER,它描述了829種病毒和1081種哺乳動物宿主之間的5494種相互作用,其中大部分集中在野生動物身上,還有其他幾個數據集,包括宿主-病原體系統發育項目(HP3)、增強型傳染病數據庫(EID2)和全球哺乳動物寄生蟲數據庫V2.0(GHMPD2)。
“我們擁有的一些數據集比較舊:它們包含過時的特定物種名稱,或者它們有錯誤,因為數據是手工輸入的,”Poisot談到機器學習所需的耗時過程時說。”在那之後,主要的任務是確定我們對模型的預測能力有多大的信心。”
然後,研究人員專注於20種被認為是值得關注的病毒,這些病毒有可能會蔓延到人類身上。
“我們在團隊中進行了很多討論,因為起初一些結果對我們來說似乎很奇怪,”Poisot說,他驚訝地看到與小鼠有關的Ectromelia病毒被確定為一個值得關注的病毒。”我們持懷疑態度,但是當我們搜索文獻時,我們發現在人類中曾有過這樣的案例。”
研究人員還能夠通過該模型確定區域,這一點可以幫助科學家以更有針對性的方式進行病毒和疫苗研究。
“我們的模型進行了空間預測,但更準確地說,該模型具體指出了在哪一組哺乳動物中以及在哪個位置可能會發現某些類型的病毒,”Poisot說。
結果顯示了兩個特別值得關注的地區:亞馬遜流域,那裡的病毒和宿主的相互作用更加原始,而且最有可能出現新的相互作用;以及撒哈拉以南非洲,在那裡,該算法確定了可能攜帶人畜共患病毒的新宿主。
網絡歸納法揭示了亞馬遜地區獨特的宿主-病毒關聯熱點
Poisot解釋說:”我們正在真正轉移我們需要去研究哺乳動物以發現新病毒的地方。”
雖然人畜共患的病原體可以有多種形式–細菌、寄生蟲、病毒–但隨著人類和非人類動物繼續佔據更多的相同空間,它們的流行程度預計會越來越普遍。
該團隊希望其模型不僅可以為研究提供新的起點,而且可以提供現實世界的監控。下一步將是把這個人工智能提升到一個新的水平,並包括更多的微生物、免疫學和生態學機制,以便更完整地觀察全球病毒群。
“該算法將我們已經知道的網絡,投射到一個新的空間,有點像皮影戲:它以一種新的方式投射到相互作用上,”Poisot說。”我們現在知道要監測哪些物種,在哪裡,以及什麼類型的病毒。”
這項研究發表在《模式》雜誌上。