重磅研究揭示新冠病毒演變:突變如何顯著增強傳染力
中國醫學科學院北京協和醫院、中國疾控中心、加州大學洛杉磯分校、匹茲堡大學、湖南大學五家合作單位的研究人員共同在生物科學預印本網站bioRxiv在線發表了一項針對新冠病毒演化過程中的突變、重組和插入的重磅研究(“Mutations, Recombination and Insertion in the Evolution of 2019-nCoV”)。
研究通過分析病毒的突變,解釋新冠病毒為何傳染性能得到顯著增強。
團隊還進一步估計,大多數人類新冠病毒(2019-nCoV)和蝙蝠RaTG13病毒蛋白之間的差異發生在2005年至2012年之間,而人類SARS病毒和蝙蝠SARS樣冠狀病毒之間的差異發生在1990至2002年之間。
而除了點突變外,他們認為還有潛在的證據表明重組也是2019-nCoV進化的機制。他們的結果表明,2019-nCoV的S蛋白可能從穿山甲冠狀病毒衍生出來,而不是蝙蝠冠狀病毒RaTG13。而在2019- nCoV的進化過程中,RaTG13樣冠狀病毒和穿山甲樣冠狀病毒病毒株之間可能發生了重組。
該論文通訊作者為中國疾控中心病毒病預防控制所黨委書記武桂珍,中國疾控中心病毒病預防控制所研究員譚文傑,中國醫學科學院生物醫學大數據中心主任、蘇州系統醫學研究所所長助理蔣太交,加州大學洛杉磯分校微生物與免疫遺傳學系教授程根宏。
研究團隊收集並分析了120個2019-nCoV基因組序列,包括11個來自中國患者的新基因組。他們發現,儘管2019-nCoV、人和蝙蝠SARS-CoV(嚴重急性呼吸綜合徵冠狀病毒)在整體基因組結構中具有高度同源性,但它們通過受體結合域中(RBD)的潛在重組,演變成具有不同受體進入特性的兩組病毒。
研究團隊發現,2019-nCoV在刺突蛋白(S蛋白)的S1和S2結構域之間存在獨特的四個氨基酸插入(PRRA),它可能是一個弗林(Fruin)或TMPRSS2(跨膜絲氨酸蛋白酶2)酶切位點。而此前的研究表明,冠狀病毒可能發生蛋白酶裂解,從而觸發病毒-細胞膜之間的融合。這種啟動和触發融合機制的靈活性極大地調節了不同冠狀病毒的致病性和趨向性。
研究團隊提出,RBD的潛在重組,以及獨特的弗林蛋白酶切位點的存在,可以解釋新冠病毒傳染性的顯著增加。
當前,2019-nCoV在全球已經導致超過77000人感染、2400人死亡(截至論文提交),其基因組在系統發育上與蝙蝠SARS病毒RaTG13株最相似,該病毒株於2013年在中國雲南被首次分離。
研究人員表示,截至目前已經有很多針對新冠病毒的研究,但導致這種病毒感染和分子進化的機制仍不清楚,這項研究揭示了乙類冠狀病毒的進化、特異性、以及增強感染力的可能機制,為2019-nCoV的進化和傳播提供了全面的見解。
他們認為,利用從不同地點、不同時間點的患者身上分離到的2019-nCoV毒株進一步追踪基因組突變,將為理解這種快速傳播病毒的分子進化提供思路。
2019-nCoV傳播中發生的突變
研究團隊將2019-nCoV的感染率與最近暴發的β冠狀病毒,即2002年的SARS病毒和2012年的MERS(中東呼吸綜合徵)病毒的感染率進行了比較。
與SARS和MERS相比,2019-nCoV的傳播速度要快得多。迄今為止,已確認的2019-nCoV病例比2002年整個SARS暴發期間的病例要多。
在過去的18年中,科學家發表了很多冠狀病毒的基因序列,其中包括2002年SARS暴發期間從不同國家分離出的SARS病毒株,從沙特阿拉伯和阿拉伯聯合酋長國等中東國家也分離出很多MERS病毒株。
研究團隊這次從包括武漢在內的多個中國城市的新患者中收集並測序了11條全長2019-nCoV基因組序列。
系統發育分析表明,與人類SARS、MERS和其他冠狀病毒相比,這11個新的2019-nCoV病毒株與其他2019-nCoV病毒株類似,它們與蝙蝠冠狀病毒RaTG13病毒株同源性更高。
在氨基酸水平上,它們只在與人類和蝙蝠SARS中相應氨基酸序列相同的一致序列位置上有少量隨機突變。
為了鑑定新的遺傳突變,研究人員使用新冠病毒株EPI_ISL_402125作為根,為GIAID(全球共享禽流感數據倡議組織)中的所有120個新冠病毒的可用完整基因組構建了系統樹(更新至2020年2月18日)。
研究團隊發現,根據核苷酸位置8517和27641,2019-nCoV病毒株可分為兩個主要類別。
120個2019-nCoV全長基因組的序列比對,包括11個新的基因組(以星號突出顯示),G1和G2分別用紅色和藍色標記
第1組(G1)的所有病毒株在8517的位置有胸腺嘧啶,在27641位置有胞嘧啶,這與SARS中相應的核苷酸表現相同;而第2組(G2)則相反,在8517有胞嘧啶,在27641則有胸腺嘧啶。
以上兩組病毒的流行病學數據顯示,最早的G1病毒株(EPI_ISL_406801)於2020年1月5日在武漢被收集,而最早的G2株則於2019年12月24日在武漢被分離得到。
上述兩組基因群在同一城市中的存在表明它們是共循環的,但是在疫情暴發早期它們的進化是趨同的。在每個組中,研究人員還觀察到了多個病毒株的其他共有突變。
基於這些潛在的可遺傳突變以及識別時間和位置,研究人員生成了一個“突變樹”圖,以跟踪單個共享突變並顯示不同分離株之間的關係。
例如,今年1月10日至1月15日在廣東省識別出的5個病毒株屬於上述第1組病毒,它們在核苷酸位置28578上均有相同的突變,這表明它們可能是由同一人傳播的。類似的病毒可能傳播給了1月29-1月31日在日本發現的3例病例,它們的病毒在2397核苷酸位置有額外突變,這一類似病毒可能也傳播給了1月22日在美國發現的1例病例,這例病例的病毒在10818核苷酸位置有一個額外突變。
研究團隊還提到G10818T這個位置非常有趣,因為它在第1組和第2組中均由數個獨立的病毒株共享,這導致了orf1ab多蛋白內的L3606F氨基酸突變。
G10818T在第1組和第2組中均由數個獨立的病毒株共享
目前尚不清楚第1組和第2組病毒株在10818位點的共同突變是否具有任何生長優勢,但穿山甲和蝙蝠冠狀病毒在相同位置同樣有L3606V突變。
從樹狀圖來看,這兩組病毒株都已傳播到報告有2019-nCoV病例出現的大多數國家和地區,幾乎沒有例外,這表明這兩組病毒都是可以快速傳播的。
研究團隊在討論環節提到,儘管這兩個不同的2019-nCoV組是在從動物傳播給人類之前或之後進化尚待確定,這兩個群體都是首先在武漢被發現,然後傳播到中國的不同地區和多個國家。
2019-nCoV與穿山甲冠狀病毒的比較
目前與新冠病毒最緊密相關的病毒株為β型冠狀病毒RaTG13,RaTG13此前從中華菊頭蝠中分離出。研究團隊使用核苷酸序列對特定病毒蛋白(例如orf1a,S蛋白,基質和核衣殼)進行了其他系統發育分析後發現,RaTG13病毒株與其他蝙蝠類SARS樣冠狀病毒株同樣有密切關係。
研究人員進一步估計,大多數2019-nCoV和RaTG13病毒蛋白之間的差異發生在2005年至2012年之間,而人類SARS病毒和蝙蝠SARS樣冠狀病毒之間的差異發生在1990至2002年之間。
研究人員在討論環節總結道到,“我們的進化時鐘分析估計,2019-nCoV分別於大約12年前和30年前從RaTG13和人類SARS-CoV中分化出來。”而除了點突變外,還有潛在的證據表明重組也是2019-nCoV進化的機制。
在比較全長S蛋白序列時,研究人員發現,2019-nCoV與人和蝙蝠SARS病毒的序列同源性為39%,與MERS或其他冠狀病毒的同源性則為29%。
值得注意的是,研究團隊發現2019-nCoV和穿山甲冠狀病毒在S蛋白的RBD(氨基酸315-550區域)中共享幾乎相同的氨基酸序列,但與RaTG13卻不相同。
穿山甲CoV(藍線)和RaTG13 / 2013(綠線)與2019-nCoV的氨基酸同源性對比圖,保守受體結合結構域(RBD)以黃色突出顯示
為了證實這一發現,研究團隊將此前別的課題組發表的穿山甲CoV與先前分離但未發表的穿山甲CoV序列進行了比較。
基於比對和系統發育分析,研究人員發現2019-nCoV的共有序列與BetaCoV / 穿山甲/廣東/P2S/2019(EPI_ISL_410544)具有最高的同一性,而在廣西分離的穿山甲CoV株則發現存在其他突變和插入缺失。
接下來,研究人員使用ML方法(Maximum likelihood,最大似然法)檢測了2019-nCoV的共有S蛋白序列與25種代表性CoV病毒株(包括Hu-CoV,SARS和MERS)和5新穿山甲CoV病毒株的系統發育關係。
結果表明,2019-nCoV的S蛋白可能從穿山甲冠狀病毒衍生出來,而不是蝙蝠冠狀病毒RaTG13,當然這兩者都可能與蝙蝠-SARS-CoV或bat-SL-CoVZC542處於同一譜系。
他們提出,2019-nCoV的整個基因組結構與RaTG13最具有同源性,但S蛋白的RBD卻與穿山甲CoV最具同源性,這一差異表明在2019- nCoV 的進化過程中,RaTG13樣冠狀病毒和穿山甲樣冠狀病毒病毒株之間可能發生了重組。
研究人員還進一步檢查了基因組中的所有氨基酸突變。他們發現,當比較穿山甲樣冠狀病毒和2019-nCoV時,除了RBD外,nsp(非結構蛋白)14和15中的區域還共享連續序列(圖3D)。
兩個進化枝,以及獨特的弗林蛋白酶切位點
為了進一步評估2019-nCoV與其他SARS冠狀病毒的關係,研究人員分析了2019-nCoV和不同的人/蝙蝠SARS病毒的RBM(Receptor binding motif,受體結合基序),並觀察到它們可以清楚地分為兩個不同的進化枝。
進化枝I病毒包括2019-nCoV、穿山甲CoV,以及12種蝙蝠SARS(蝙蝠SARS CoV I,例如RaTG13)和人類SARS病毒。
進化枝II病毒則包含了49種蝙蝠SARS病毒(bat SARS CoV II),例如ZXC21和ZC45,它們與2019-nCoV有大約90%的核苷酸和氨基酸同源性性。
上述兩個進化枝之間的主要區別在於,進化枝II病毒的RBM存在5個、13-14個比進化枝I病毒短的氨基酸區域。
此前的研究表明,SARS病毒RBM的13-14個氨基酸區域形成獨特的環結構,該結構通過兩個半胱氨酸殘基之間的二硫鍵穩定。儘管該環區中2019-nCoV的氨基酸序列與人SARS病毒的氨基酸序列非常不同,但兩個半胱氨酸殘基都是保守的。
有趣的是,所有已知使用ACE2作為進入受體的病毒都屬於I型,而所有不使用ACE2進入受體的蝙蝠SARS病毒都屬於II型。因此,研究團隊預測,包括2019-nCoV在內的I型分支病毒可以通過人ACE2(血管緊張素轉換酶2)感染宿主細胞,而II型分支病毒不能通過ACE2感染宿主細胞。
此前的研究得出的是,SARS病毒使用人ACE2作為受體來感染宿主細胞,而MERS病毒則是使用DPP4作為其受體。最近的一些表明ACE2也是2019-nCoV的進入受體,儘管其他宿主細胞因子如TMPRSS2也可能參與其中。
在進化枝II病毒中,儘管它們的總體基因組序列與2019-nCoV存在同源性,但尚無屬於該枝的病毒利用ACE2進入受體的報導。
因此,這一研究不僅強調了RBM在確定進入受體特異性中的關鍵作用,而且提出了一個有趣的問題,即β冠狀病毒的同源病毒株如何通過RBM中的插入、缺失或重組等突變來改變趨向性。
值得注意的是,研究團隊還發現,2019-nCoV在S蛋白內或核苷酸位置23619-23632上有獨特的四個氨基酸插入(681-PRRA-684)。
有趣的是,上述2019-nCoV的S蛋白中的這種插入(PRRA)為哺乳動物弗林蛋白酶蛋白創建了潛在的切割位點RRAR。
為了了解這種插入的獨特性,研究團隊使用了來自人、麝貓和蝙蝠的SARS-CoV株進行了序列比較。他們發現,這種插入是2019-nCoV特有的。當與其他冠狀病毒家族成員進行比較時,研究人員發現也能夠識別到類似的位於S蛋白的S1和S2域之間結構邊界的插入。
而此前的研究則表明,病毒可能發生蛋白酶裂解,從而觸發病毒-細胞膜之間的融合。這種啟動和触發融合機制的靈活性極大地調節了不同冠狀病毒的致病性和趨向性。
不過,此前在SARS-CoV中沒有檢測到這種蛋白酶裂解。在SARS-CoV中引入一個酶切位點,則會導致S蛋白的裂解並增強膜融合活性。此外,在SARS-CoV假型病毒中引入一個裂解的S蛋白,也會使其能夠直接進入宿主細胞。
根據之前的測序和結構分析,2019-nCoV S蛋白被預測為可以與ACE2受體相互作用,觸發與宿主細胞膜的融合併引發感染。因此,導致S1-S2亞基改變的突變或插入會顯著影響病毒感染。
研究團隊推測,PRRA的插入可能使S蛋白裂解,從而觸發病毒融合事件。
雖然導致如此高感染率的確切機制仍有待進一步研究,但研究團隊認為,他們的數據顯示RBD重組、S1和S2域插入獨特的弗林酶切點或TMPRSS2酶切位點,也許可以解釋為什麼這個新出現的病毒和其他SARS、MERS相關的β冠狀病毒相比傳染性顯著增加。