GISAID平台上匯聚分享的全球新冠基因組測序數據已破百萬大關
作為一個流行的線上數據分享平台,GISAID匯聚了全球諸多科研團隊的COVID-19溯源努力。最新消息是,其已拿到了來自全球172個國家和地區、超過120萬組的SARS-CoV-2基因序列。Nature指出,這些數據對科學家們追溯新冠病毒起源、COVID-19爆發的流行病學研究、以及相關變異毒株的全球傳播都有著至關重要的作用。
(來自:GISAID)
非營利組織“全球禽流感數據共享倡議”(簡稱GISAID)科學顧問、來自新加坡的Sebastian Maurer-Stroh 表示:
根據世界各地提交的最新數據,我們可以構建出一套追溯新冠病毒如何在全球範圍內傳播的監測系統,以了解相關防疫措施和疫苗是否仍然有效。
早在2006 年,科學界就已經提出了GISAID 的倡議。起初許多地方政府都出於各種原因(比如單純的利益考量),而未選擇向外界分享禽流感的基因組信息。
直到兩年後,隨著政府與科學家們完成了艱苦的數據共享協議談判,GISAID 項目才得以正式啟動。
儘管GISAID 不是唯一用於基因組序列分享的數據庫,但它依然在COVID-19 大流行時期發揮了重要的作用。
截止上週末,GISAID 上分享的SARS-CoV-2 基因組序列已經超過了百萬份。
Maruer-Stroh 指出,當COVID-19 開始傳播時,GISAID 團隊立即與世界各地的研究人員和有關部門取得了聯繫,以掃除獲取分享SARS-CoV-2 基因組數據的相關障礙。
之後當西非地區的研究人員告知其缺乏生物學信息培訓時,塞內加爾的一名GISAID 科學家就伸出了援手。
在高質量數據的支持下,通過比較當地流行毒株與其它地方SARS-CoV-2 之間的關係,就能夠及時發現有哪些新的編譯。
其中某些發達國家/ 地區上傳了大量的新冠基因組序列,並在數據庫中佔據了相當大的份額。截止4 月20 日的時候,美國和英國就分別貢獻了303359 / 379510 份序列。
即便如此,GISAID 的數據庫遠未完善,比如坦桑尼亞就一直在否認新冠流行(為上傳分享任何序列)。
此外幾個大爆發的國家的檢測能力也狠狠地拖了後腿,比如薩爾瓦多(678541 例/ 僅上傳6 個序列)和黎巴嫩(513006 例/ 僅上傳49 個序列)。