華南海鮮市場不是病毒來源地?基因組數據繼續追踪
新型冠狀病毒到底源自何處?這是許多科學家急於尋找的答案。只有找到源頭才能徹底弄清楚新冠病毒的傳播機制,以防後患。之前的流行病學調查認為,雖然有一部分病例與華南海鮮市場有關,但那裡可能並不一定是病毒從野生動物到人類社會的“第一站”。最近這個推測得到了基因組數據的證實。
中國科學院西雙版納熱帶植物園、華南農業大學和北京腦科中心的科研人員從基因組數據中挖掘新冠病毒的源頭和傳播路徑。研究者收集了4大洲12個國家的93個新型冠狀病毒的基因組數據,分析表明,華南海鮮市場的新冠病毒是從其他地方輸入的。
相關研究結果已提交到中國科學院科技論文預發布平台(戳“閱讀原文”),可供疾控防疫相關部門參考。
從單倍型看新冠病毒的發展軌跡
數據分析顯示這93個病毒樣本中包含58種單倍型。什麼是單倍型?簡單說就是決定同一性狀的基因組合。病毒的特性由很多基因決定,單個基因不能發揮作用,需要一個組合。舉個例子,一個公司有好多部門,比如市場部、研發部、人事部等,每一個部位職責不同,相互配合,每一個部門就好比一個個單倍型。公司部門成立的時間不同,權力的大小不同。同樣單倍型形成的時間不同,傳播的能力也不同。
新冠病毒就像是一個家族企業,從目前確定的58種單倍型中,我們可以發現其發展的軌跡。
新冠病毒不同單倍型的進化關係圖譜
最開始的是單倍型是mv1,它可能來自中間宿主或者第一個被感染的人。就是這個mv1和蝙蝠體內的bat-RaTG13-CoV有著密切勾結。mv1衍生了H38,和它同一輩分的還有H13。H38和H13是病毒的第一代創始人,我們稱之為爺爺輩單倍型。之後的H3成為病毒的第二代掌門人,我們稱其為父輩。H3衍生出孫子輩H1,是為病毒的第三代掌門人。
爺爺輩的H13、H38,可能有兩條進化路線(圖片來源:參考文獻1)
按照正常邏輯,爺爺輩的單倍型所在地就是病毒的祖籍。然而在武漢病毒樣本中並沒有發現爺爺輩單倍型(H13,H38)。H13僅在深圳的患者攜帶的病毒中發現。另一個H38在一名美國患者攜帶的病毒中發現。是不是說明深圳和美國就是新冠病毒的發源地?事情沒有那麼簡單。這需要追踪患者的感染時間和活動軌跡。兩位患者的旅行記錄顯示他們於2019年12月底到1月初在武漢活動期間感染。然而,在武漢地區的新冠病毒中卻沒有找到這2種單倍型。這是為何呢?
原因可能和採集病毒樣品的時間有關。武漢的病毒樣品採集時間是2019年12月24日和2020年1月5日。採集時間較晚,此時爺爺輩的單倍型很有可能被父輩、孫子輩的單倍型替換。當前,如果能在武漢找到更早期的病毒,對於尋找病毒來源有很多幫助。
我們再看父輩的單倍型H3,果然在武漢的患者攜帶的病毒中找到一例,但也不是來自華南海鮮市場。來自華南海鮮市場的病毒中的單倍型是孫子輩的單倍型H1以及它的衍生型(H2, H8-H12)。這表明華南海鮮市場並不是病毒的起源地,它的傳染源來自於其他地方。由於華南海鮮市場人流量大,擁擠的市場促進了病毒的傳播。
新冠病毒種群如何擴張?
前面說過病毒是一個公司,公司的發展可以從公司的各個部門中體現出來。比如,開始市場部10個人,隨著公司擴展現在有1萬個人。反過來看,公司的銷售部從10個人發展到1萬個人,毫無疑問是公司發展了。那麼我們看病毒的基因組一樣可以看出病毒的擴張趨勢。根據基因組推算,新冠病毒發生了2次大規模擴張:
1)一次在2019年12月8日,由此推斷病毒至少在12月初甚至11月下旬開始人傳人了。這很好理解,如果病毒只在一個人身上,是不可能發生擴張的。病毒種群越大,說明感染的人越多
2)病毒第二次擴張是在2020年的1月6號。說明這個期間病毒感染的人數較多,可能和元旦假期的人流有關。
新冠病毒的傳播趨勢和擴散路徑
如同公司一樣,病毒“做大”之後也開始擴散,隨著人群的流動,它們的足跡開始遍布全球。
新冠病毒的擴散(圖片來源:參考文獻1)
1、早期傳播路徑:
分為兩條路線,分佈是武漢-廣東(深圳),武漢-美國。
2、國內傳播路徑:
中國地區包括54個病毒樣本,湖北(武漢)病毒樣本中發現13個單倍型屬於父輩H3和孫子輩H1。廣東地區含有15個單倍型,只有H14,H15,H17是廣東本地的二代,說明來源有多條。台灣地區的單倍型H3和H24有2個來源。重慶地區的3個單倍型(H1,H40,H45)也有兩個來源地。浙江的單倍型(H1和H24)只有一個來源地——武漢。
3、國外傳播路徑:
中國之外的病毒總共含有31個單倍型,分別屬於5個組,其中27個單倍型是本地特有的。
亞洲: 12個病毒樣本包含10個單倍型,其中7個單倍型和武漢相關,3個單倍型和廣東相關。因此,亞洲5個國家分別是從武漢和廣東(深圳)傳入的。
大洋洲: 5個病毒樣本中含有6個單倍型,都和武漢相關。
歐洲:來自4個國家8個病毒樣本中含有7個單倍型,其中比利時和德國和武漢相關,英國和武漢間接相關。法國的單倍型來自重慶、武漢和一個中間傳播者。
美洲:傳播途徑比較複雜,存在多條路線,包括武漢-美國(H1,H19,H38);廣東-美國(H19,H35,H42,H41,H58);越南-美國,澳大利亞-美國。
以上根據基因組判斷的新冠病毒傳播路徑和我們之前根據大數據計算的病毒擴散趨勢基本吻合。
新冠病毒在不同的擴散階段其擴散趨勢不同:在開始階段,其傳播量與2019年12月30日—2020年1月20日武漢輸出人口密切相關,相關係數為0.71。該相關係數以航空出行的人數為例,根據2019年12月30日—2020年1月20日從武漢天河國際機場國內航班出行人數和2020年1月22日全國各城市新冠肺炎確診病例數進行相關性分析得出;如果算上從武漢離開的所有交通方式,其相關係數會更高。全國各地城市(除武漢外)71%的感染病例和從武漢輸出的人口相關。2020年1月24日,這個相關係數降到0.56,之後逐漸下降,全國各省、自治區、直轄市的人口與確診數的關係逐漸增強,確診病例與城市人口規模呈顯著的正相關。與此同時,新冠病毒呈現本地擴散的趨勢,以武漢為中心向湖北境內各個城市快速擴散。在病毒基因組中的本地特有的單倍型就是本地擴散導致的結果。
從武漢輸出的人口和本地人口對於各個省份(湖北除外)確診病例數的解釋度(圖片來源:參考文獻3)
基因組沒有發生重組
目前基因組分析得到的一個好消息就是,新冠病毒的基因組還沒有發生重組。簡單講,公司的部門沒有重組,說明公司還是那個公司。如果基因組發生重組就會引起新的突變,那個時候對抗這種病毒更加困難。雖然沒有重組,但是病毒還是發生了細微的變化:93個基因組之間有120核苷酸發生了突變。相當於公司部門沒變,領導沒變,下面具部門的員工發生的調整。這些調整雖然不會影響病毒的整體運轉,但是病毒的細微作用會產生改變。具體產生了哪些變化,要結合結構生物學和臨床表現進行對比分析。
總之一句話:根據基因組分析,新冠病毒的源頭並不在華南海鮮市場,其源頭究竟在哪?還需要相關研究者的繼續追踪。