新冠基因組變異分析不支持華南海鮮市場是源頭
自新冠肺炎疫情發生起來,病毒溯源工作基本圍繞武漢華南海鮮市場,疫情初期的大多病例和該市場有關聯。不過,新冠病毒起源地目前仍充滿爭議。之前,《柳葉刀》刊發的最早一批41例患者中的部分患者,以及2019年12月1日發現的第一例患者,並沒有證明和該市場有關。
值得注意的是,根據中國學者最新的基因組變異研究,關於新冠病毒是如何進入人類社會的,有了新的見解。其結論包括:一、華南海鮮市場的新型冠狀病毒可能是從其他地方傳入的,在市場中發生快速傳播蔓延到市場之外;二、新型冠狀病毒在2月12日(論文數據截止時間)之前發生過2次明顯的種群擴張;三、現擴散的病例至少來自於3個途徑;四、新冠病毒基因組尚未發生明顯重組事件。
這些結論來自中國科學院西雙版納熱帶植物園、中國科學院核心植物園、韶關大學英東生物與農業學院、華南農業大學、北京腦科學與類腦研究中心(CIBR)團隊。他們另闢蹊徑,從病毒基因演化角度試圖描繪出病毒傳播路徑,並找出誰有可能是“零號病人”。
該項研究通訊作者為中國科學院西雙版納熱帶植物園副研究員郁文斌,論文標題為“使用整個基因組數據解碼新冠病毒的進化和傳播”。研究最早於2月19日發表在中國科學院科技論文預發布平台ChinaXiv上,2月21日更新發布第二版。
武漢樣本中沒有祖先單倍型,或從其他地方傳入
在這項研究中,研究團隊使用了來自GISAID EpiFluTM數據庫的93個完整的新冠病毒基因組,其中中國患者樣本有54個,包括重慶3個樣本、廣東18個樣本、湖北22個樣本、中國台灣2個樣本、浙江4個樣本,另外其他5個省份有1個樣本。中國境外包括亞洲其他國家、歐洲、大洋洲、北美洲的39個樣本。樣本採集時間為2019年12月24日至2020年1月5日。
通過對93個樣本的全基因組數據解析,新冠病毒的基因組大小在29782bp-29903bp之間,來自GISAID的EPI_ISL_402131基因組(即bat-RaTG13-CoV)也被列入,目前它的序列被認為最接近新冠病毒。研究團隊基於8個編碼區120個變異位點(包括79個非同義替換和40個同義替換,42個非同義替換改變了氨基酸的生化性質),得到58種單倍型(基因類型)。未檢測到明顯的重組事件。
圖1新冠病毒的基因組單倍型,紅色圓圈表示華南市場樣品,藍色圓圈表示與市場無關樣品。
具體來說,這58種單倍型其中被分為5組。其中三個中心單倍型為H1、H3、H13,分別為A組、B組、C組,這三種單倍型被認為是古老超級傳播者。D組和E組的中心分別是兩種新的超級傳播者單倍型,即H56和mv2。
58種單倍型中,H13和H38都可能是祖先單倍型,是系統發育中最基礎的分支。兩者均通過H3衍生出H1,即兩條主要的演化路徑為H13-H3-H1,或者H38-H3-H1。論文提到,兩種情況都表明,H3是祖先單倍型到H1之間的關鍵。
但值得注意的是,武漢的樣本中都沒有H13和H38這兩種祖先單倍型。
作者們認為,H13和H38可能通過一個假設的中間單倍型mv1與蝙蝠冠狀病毒RaTG13相關聯,由於目前的樣品中沒有第一例感染者的樣本和12月初的早期感染者的樣本,最早的祖先單倍型可能還沒有被發現。演化網絡表明,假設的單倍型mv1可能來自中間宿主或第一個被感染的人。
武漢現有的樣本中沒有一份編碼A組中的單倍型。A組的單倍型在遺傳上只與來自武漢的單倍型H3有聯繫(只有1份EPI_ISL_406801),但該病例與華南市場沒有聯繫。值得注意的是,華南海鮮市場的所有的樣品均有H1單倍型或其衍生(H2, H8-H12),說明該市場在短期內即發生了傳播感染。
作者們認為,可能的情況是,華南海鮮市場的新冠病毒是從其他地方傳播過來,或者至少華南海鮮市場不是新冠病毒的原始來源。有可能是受感染的人將新冠病毒傳染給了市場的工作人員,然後在市場上迅速傳播。擁擠的市場增加了新冠病毒對去過該市場人群的傳播,並於2019年12月初傳播到整個城市,這與估計的種群擴張時間相一致。
而祖先單倍型H38的樣品來自美國華盛頓州的病患(美國首例),該患者於1月15日結束武漢探親回到華盛頓州。
研究團隊認為,現有武漢樣本中沒有檢測到H13和H38單倍型,可能是因為現有樣品主要採自幾家定點醫院,而且樣品採集時間局限於2019年12月24日和2020年1月5日。如果能在武漢其他醫院早期的病患檢測到這兩種單倍型,將對於尋找病毒來源非常有幫助。
擴散病例至少來自3個途徑
將58種單倍型分成了五組後分析顯示,廣東的病毒可能有三個來源,重慶和台灣的病毒有兩個來源。
在中國的54個樣本中,重慶3個樣本、廣東18個樣本、湖北22個樣本、台灣2個樣本、浙江4個樣本,其他5個省份有1個樣本。
武漢2019年12月24日至2020年1月5日的樣本編碼了13種單倍型,屬於C類和B類。這些關係表明,新冠病毒在武漢的傳播處於早期階段。H1和H3是湖北以外地區單倍型的祖先。
從2020年1月10日至1月23日採集的18個廣東樣本,編碼了15種單倍型,屬於A、C、E組,表明有多個來源輸入廣東。三個單倍型(H14、H15、H17)可能在本地演化,表明新冠病毒最初蔓延到深圳時即發生了人際傳播。來自台灣的兩個樣本編碼H3和H24,分別屬於B組和D組,重慶的三個樣品編碼H1、H40和H45,分別屬於B組和C組,顯示這兩個省或地區輸入了兩種來源。C組4個浙江的4個樣本編碼H1、H24,屬於C組,顯示僅從H1單倍型來源輸入。
中國境外總的樣本編碼了31種AE組的單倍型。其中,2個來自泰國的樣本是H1單倍型,分別來自澳大利亞和比利時的1個樣本是H3單倍型,1個來自美國的樣本是H19單倍型,1個來自新加坡的樣本是H40單倍型。
來自亞洲5個國家的12個樣本編碼了10個單倍型,7個和武漢有關,3個和深圳有關。在日本東京,人際傳播可能發生到H53單倍型患者到H52單倍型患者身上,患者此前從武漢撤回日本。
澳大利亞患者的5個樣本分別編碼B、C和D組的6個單倍型,均與武漢有關。病例(H3)、病例(H25、H26)、病例(H55,和H1有關)直接來自武漢,H25到H26發生了人際傳播,來自昆士蘭同一旅遊團。H56患者與H27患者之間的聯繫不明確,因為H56患者於1月25日從武漢飛往悉尼,H27患者於1月15日從武漢飛往墨爾本。
一種可能是有一個中間傳播者,他也傳播了新冠病毒,並且傳染給了法國、美國和中國台灣的其他病人。
8個歐洲樣本編碼了7個單倍型,來自四個國家的病人。比利時和德國的患者均有武漢旅行史。英國的患者沒有報告與武漢有關,但有發現從H28到H29的家族性傳播。法國的患者可能是通過三種不同的途徑感染,即與武漢有關的H44、與重慶或新加坡有關的H43,以及與中間傳播者有關的H30。
來自美國的13個樣本中,有3個來自華盛頓的同一名患者,編碼了相同的單倍型H38,另外3個樣本編碼了8個單倍型,覆蓋了AE 5組,因此輸入性感染的來源很複雜。3個單倍型(H1、H19、H38)與武漢相關,3個(H19、H35、H42)與5個(H41、H58)可能與廣東相關。其餘的單倍型(H36、H37、H57)與非中國患者(H54,越南;H56,澳大利亞)有關,這兩例患者來自武漢。
總體來看,廣東深圳一家人在早期就通過人傳人進行了傳播。有較多樣本的澳大利亞、法國、日本和美國,他們的患者感染源至少有兩個,尤其是美國包括了五個來源。
非常值得關注的是H56這個超級傳播者單倍型,它同時是澳大利亞、法國和美國,以及我國台灣患者的傳染源。其他國家患者因為樣品比較少,大多數的來源比較單一,他們除了是武漢旅遊輸入或在武漢感染外,有一些人可能是在廣東、新加坡等地被感染。
圖2 58種新冠病毒單倍型的演化關係和地理分佈(A, B)。基於進化分析和流行病學研究,作者們推斷出單倍型演化路徑(C)和可能的傳播和傳播路徑(D)。
研究還發現,中國和其他國家之間單倍型樣本的多樣性存在顯著差異。其他國家樣本的單倍型多樣性較高,可能是因為其採樣日期大多在2020年1月22日之後,而中國的樣本則在2020年1月22日之前。此外,作者推測,國際長途航班時的低水平輻射暴露可能加速了新冠病毒的突變率。
研究團隊最後強調,使用傳統方法對新冠病毒進行流行病學研究是非常困難的,因為一些有輕微症狀或無症狀的感染者在11月底和12月初可能被忽視。此外,被認為是新冠病毒發源地的華南海鮮市場,自2020年1月1日起已關閉。
他們提到,由於目前可獲得的樣本不包括12月初發現的第一例感染患者和其他更多患者,因此可能會漏掉最常見的祖先單倍型。如果有來自這些患者的冷凍樣本,就可以進行系統流行病學研究的基因組測序,以幫助確定新冠病毒的起源地地。