研究人員在一些意想不到的地方發現了冠狀病毒的新物種
一位前UBC博士後研究員帶領一個國際研究小組重新分析了所有公開的RNA測序數據,結果發現了比以前已知的RNA病毒多出近9倍的病毒,其中包括在一些意想不到的地方出現的幾個新冠狀病毒的物種。
這個地球規模的RNA病毒數據庫可以為快速識別病毒溢出到人類以及那些影響牲畜、農作物和瀕危物種的病毒鋪平道路。
Artem Babaian博士為Serratus項目合作的幕後推手。該項目於上週在著名的科學雜誌《自然》上發表了究成果。
Babaian稱,通過跟雲創新中心(Cloud Innovation Centre,UBC和亞馬遜網絡服務之間的公共/私人合作)的合作,Serratus項目得以在AWS上建立了一個非常強大的超級計算機,其功率相當於22,500個CPU。
這台超級計算機讀取了來自世界各地570萬個生物樣本的2000萬GB的公開基因序列數據並蒐索了表明存在RNA病毒的特定基因。這些樣本已經收集了13年並在世界研究界內自由分享,其中包括從冰芯樣本到動物糞便的一切。
Serratus項目的研究人員發現了132,000種RNA病毒(以前只知道15,000種)和九個新的冠狀病毒物種。Babaian估計,如果沒有CIC和AWS雲端,傳統的超級計算機需要花費一年多的時間和數十萬美元來完成這項分析工作。Serratus在11天內以24,000美元完成了這一任務。
“我們正在進入一個了解自然界中病毒的遺傳和空間多樣性以及各種各樣的動物如何跟這些病毒接觸的新時代。而希望是如果像SARS-CoV-2–導致COVID-19的新型冠狀病毒–再次出現,我們不會措手不及。這些病毒可以更容易地被識別且可以更快地被找到它們的自然庫。真正的目標是這些感染被及早識別,這樣它們永遠不會成為大流行病,”Babaian說道,“如果一個病人出現不明原因的發燒,一旦血液被測序,你現在就可以把人體內的未知病毒跟一個更大的現有病毒數據庫聯繫起來。如如果一個病人在聖路易斯出現了來源不明的病毒感染,那麼你現在可以在約兩分鐘內通過數據庫進行搜索並將該病毒跟如2012年在撒哈拉以南非洲取樣的一隻駱駝聯繫起來。”
32歲的Babaian一直在跟不列顛哥倫比亞省癌症協會進行癌症基因研究,當COVID-19大流行病發生時他轉換了工作方向。
Babaian稱,如果沒有UBC雲計算創新中心的支持他不可能完成這項工作。