新冠病毒並非實驗室產物自然子刊發文:有兩種自然選擇假說
新冠肺炎疫情發生以來,“實驗室病毒洩漏”、“人工合成新病毒”等流言一度在網絡上傳播。北京時間3月18日,頂級學術期刊《自然-醫學》(Nature Medicine)在線發表了來自美國、英國、澳大利亞共6位科學家的一篇文章“The proximal origin of SARS-CoV-2 ”,對新冠病毒的起源進行了詳細分析。
通過對基因組數據的比較分析,作者們對新冠病毒的起源進行了綜述。他們提出一個關於SARS-CoV-2基因組顯著特徵的觀點,並討論了這些特點可能導致的情況。他們的分析清楚地表明:新冠病毒並非源自實驗室,也不是一種故意製造的病毒,而是一種自然進化的產物。
這6位科學家分別為著名病毒進化學家美國斯克里普研究院免疫學和微生物學系Kristian G. Andersen副教授(一作及通訊作者)、英國愛丁堡大學進化生物學研究所Andrew Rambaut、美國哥倫比亞大學梅爾曼公共衛生學院感染與免疫中心主任W. Ian Lipkin、澳大利亞悉尼大學瑪麗·巴希爾傳染病和生物安全研究所教授Edward C. Holmes、美國杜蘭大學醫學院微生物與免疫學教授Robert F. Garry。
值得注意的是,作者當中來自哥倫比亞大學的Lipkin在國際流行病學領域聲名顯赫,被世界知名科普雜誌《Discover》譽為“世界上最知名的病毒獵手”。過去幾十年來,Lipkin一直置身於世界疫情爆發的最前線,包括紐約西尼羅病毒(1999年)、中國SARS(2003年)、MERS(2012-2016 年)、美國寨卡(2016年)和印度腦炎(2017年)。2003年,Lipkin是首批應邀協助中國抗擊SARS的國際知名專家。此後,他還協助建立了上海巴斯德研究所、廣州生物醫藥研究所等研究機構。
新冠病毒基因組兩個顯著特徵
論文提到,自中國湖北武漢首次報告新型肺炎(COVID-19)以來,關於其致病病毒新冠病毒的起源一直討論頗多。新冠病毒是已知的第七種感染人類的冠狀病毒。SARS-CoV、MERS-CoV和SARS-CoV-2可導致嚴重的疾病,而HKU1、NL63、OC43和229E引發的症狀較輕。
通過比較α冠狀病毒和β冠狀病毒,作者們確定了新冠病毒具有2個顯著的特徵。
第一,在結構研究和生化實驗的基礎上,新冠病毒似乎更適合與人類受體ACE2結合。第二,新冠病毒的S蛋白通過插入12個核苷酸,在S1-S2邊界處有一個多功能的多鹼基酶切位點(弗林),同時導致了該位點周圍出現3個O -linked 的聚醣結構。
S 蛋白全稱為spike glycoprotein (刺突糖蛋白),是冠狀病毒的一種表面蛋白。ACE2全稱為血管緊張素轉化酶2,是人體細胞與冠狀病毒結合的關鍵部分。一種簡單的比喻就是,在冠狀病毒感染人體的過程中,S蛋白就像一把“鑰匙”,而人體細胞上的ACE2受體則像一把“鎖”。
人類新冠病毒和相關冠狀病毒S蛋白的特徵。(a)新冠病毒S蛋白氨基酸突變。新冠蛋白S蛋白與最接近的SARS樣冠狀病毒和SARS-CoV-1的S蛋白一致。新冠病毒和SARS-CoV Urbani毒株中,與ACE2受體接觸的S蛋白中的關鍵氨基酸都用藍色方框標記。(b)多鹼基酶切位點和O-linked聚醣結構的獲得。多鹼基酶切位點和O-linked聚醣結構是新冠病毒所特有的,以前從未在B系β冠狀病毒中發現。注:使用的基因序列來自NCBI GenBank,登錄號MN908947、MN996532、AY278741、KY417146、MK211376。穿山甲冠狀病毒序列來自SRR10168377和SRR10168378 (NCBI BioProject PRJNA573298)。
具體分析來看,首先是新冠病毒受體結合區域的突變。S蛋白的受體結合域(RBD)是冠狀病毒基因組中最易變的部分。6種RBD氨基酸已被證明是與ACE2受體結合的關鍵,同時也是確定SARS-CoV樣病毒宿主範圍的關鍵。
使用SARS-CoV的基因組為參考,這6種相應氨基酸為Y442、L472、N479、D480、T487、Y4911,對應於新冠病毒中的L455、F486、Q493、S494、N501、Y505。這6種氨基酸中有五種在新冠病毒和SARS-CoV之間存在差異(圖1a)。
基於結構模型模擬和早期生化實驗發現,新冠病毒的RBD與人類、雪貂、貓等的ACE2受體具有高親和性。
雖然上述分析表明,SARS-CoV-2可能與人類ACE2具有較高的親和力,但計算分析預測,這種相互作用並不完美。此前的研究對ACE2受體蛋白進行結構生物學分析,並預測了與其匹配程度最高的配體氨基酸序列,這與在新冠病毒RBD中發現的並不同。
因此,作者們提到,新冠病毒S蛋白與人類ACE2的高親和力結合,很可能是對人類ACE2的自然選擇的結果,從而產生了另一個最佳結合方案。他們認為,這有力地證明了新冠病毒並不是故意製造的產物。
新冠病毒的第二個顯著特徵是,S蛋白S1和S2亞基交界處有一個多鹼基酶切位點(RRAR)(圖1b)。這使得弗林和其他蛋白酶的有效裂解成為可能,並在確定病毒感染性和宿主範圍方面發揮作用。
此外,在新冠病毒中,該位點除了有2個精氨酸和1個丙氨酸,還有一個脯氨酸也插入其中,因此,插入的序列是PRRA(圖1b)。由脯氨酸插入所產生的轉變預計會導致在多鹼基酶切位點側面的S673、T678和S686上增加O-linked聚醣結構(圖1b)。
值得注意的是,這是新冠病毒的一個獨特特徵。文章中提到,雖然在包括HKU1(A系)的β冠狀病毒中存在這些酶切位點和O-linked聚醣結構,但在相關的B系β冠狀病毒屬中並未發現過類似特徵。
作者們還認為,考慮到S蛋白的遺傳變異水平,很可能會在其他物種中發現具有部分或全部多鹼基酶切位點的新冠病毒樣病毒。
不過,對於新冠病毒這兩個顯著特徵的功能目前均尚不清楚。
作者們提到,通過動物模型確定新冠病毒多鹼性酶切位點對病毒傳播和發病機制的影響具有重要意義。但通過對SARS-CoV的實驗發現,在S1/S2交界處設計多鹼基酶切位點可以增強細胞間融合,但不影響病毒的進入。此外,MERS-CoV S蛋白的高效裂解也使得來自蝙蝠的MERS樣冠狀病毒可以感染人類細胞。
另外,禽流感病毒的血凝素蛋白(HA)的兩個亞基的交界處也能產生多鹼基酶切位點,條件是病毒處於高速復制和傳播中(例如在高密度雞群),多鹼基酶切位點能被弗林蛋白酶和其他蛋白酶快速識別並切割。而HA與冠狀病毒S蛋白在細胞-細胞融合和病毒進入過程中起著類似的作用。通過插入或重組獲得HA中的多鹼性酶切位點,可將低致病性禽流感病毒轉化為高致病性病毒。流感病毒HA在細胞培養或通過動物反复傳代後,也可觀察到多鹼基酶切位點的產生。
至於3個O-linked聚醣結構的潛在功能,目前也不清楚,但它們可以產生一個“粘蛋白樣結構域”,以保護新冠病毒S蛋白上的某些潛在表位或關鍵氨基酸。目前已知的是,一些病毒會利用粘蛋白樣結構域作為免疫逃避的糖鏈屏障。
作者們提到,需要進行生化分析或結構研究來確定O-linked聚醣結構位點是否在新冠病毒中被利用。
新冠病毒的起源:兩種可能解釋
作者們在論文中鮮明指出:新冠病毒不太可能是通過對現有SARS相關冠狀病毒的實驗室操作而出現。
如上所述,其RBD還不是最完美的結合構象,其有效的解決方案與之前預測的不同。此外,如果已經進行了基因操作,我們應該看到對β冠狀病毒使用了反向遺傳學系統,但情況並非如此,因為遺傳數據顯示,新冠病毒並非源自任何以前使用過的病毒骨架。
在這篇文章中,研究團隊提出了兩種可能解釋新冠病毒起源的方案:第一,人畜共患病轉移前非人類動物宿主中的自然選擇;第二,人畜共患病轉移在人類中的自然選擇。
第一,在動物宿主中進行自然選擇。鑑於新冠肺炎暴發早期的很多病例有武漢華南海鮮市場接觸史,那麼該市場可能存在動物來源。又考慮新冠病毒與蝙蝠SARS樣冠狀病毒(尤其是RaTG13)序列相似度極高,那麼蝙蝠來源這一點也是可靠的。
但是,儘管來自中華菊頭蝠的冠狀病毒RaTG13和新冠病毒在全基因組層面上有大約96%的相似性,但兩者的RBD有很大差異,這表明它可能無法有效地與人類ACE2結合(圖1a)。
初步分析表明,非法進口到廣東省的馬來穿山甲中含有一種與新冠病毒相似的冠狀病毒。雖然RaTG13在全基因組上最接近於新冠病毒,但馬來穿山甲和新冠病毒在RBD上表現出高度相似,包括6個關鍵氨基酸一致(圖1)。
作者們指出,這清楚地表明,新冠病毒S蛋白優化ACE2受體結合是自然選擇的結果。
鑑於目前採集到的蝙蝠和穿山甲冠狀病毒都不含多鹼基酶切位點,作者們提到,雖然目前還沒有發現與新冠病毒的直接起源極其相似的動物冠狀病毒,但蝙蝠和其他物種冠狀病毒的多樣性被大大低估了。
在冠狀病毒S1-S2接點附近可以發生突變、插入和缺失,說明多鹼基酶切位點是自然進化過程中形成的。這種突變需要病毒在較高種群密度、並且ACE2基因類似於人類同源蛋白的生物集群中大量複製才有可能產生。
第二,在人體內隱秘適應。作者們提出,新冠病毒的祖先也有可能從非人類動物躍遷到人類身上,上述的基因組特徵是通過在隨後的人與人之間的傳播中進行適應而獲得的。
他們推測,一旦病毒獲得了這些適應,就將帶來疫情的暴發,進而產生足夠大且異常的肺炎病例群,醫療監控系統被觸發,並發現了病毒。
到目前為止,所有進行測序過的新冠病毒基因組都具有很好的適應性RBD和多鹼基酶切位點,因此它們是從一個共同祖先那裡獲得的這些特徵。穿山甲中存在一種與新冠病毒非常相似的RBD,這意味著這些特徵可能在傳播到人類中以前已經存在於病毒中。這使得多鹼基酶切位點插入發生在病毒人際傳播過程中。
使用現有的基因組序列數據估算新冠病毒的最新共同祖先的時間,表明病毒在2019年11月下旬至12月上旬出現,這與最早的回顧性確診病例研究的時間相符。
因此,這種情況下,作者們認為可以假定,在最初的病毒由動物轉移到人身上與人際傳播時多鹼基酶切位點的獲取之間,存在一段無法識別的病毒人際傳播時期。如果在很長一段時間內,首先發生的很多人畜共患病事件(病毒由動物轉移到人身上)能夠產生人與人之間傳播的短鏈,那病毒就會有足夠的機會大暴發。
文章提到,這其實就像阿拉伯半島上MERS-CoV傳播的情況,所有人類病例都是病毒從單峰駱駝反复傳播的結果,產生了單一感染或人與人之間的短鏈傳播。迄今為止, MERS-CoV還尚未完全適應人類宿主。
新冠病毒是否發生了這種隱秘的傳播?作者們認為,回顧性血清學研究可以提供有用信息。在中國的某些地區,已經進行了少數這類研究,顯示了居民對SARS樣冠狀病毒有低水平暴露。
然而,關鍵的是,這些研究尚無法區分陽性血清反應是由於先前感染了SARS-CoV、新冠病毒或其他冠狀病毒所致。作者們認為,應該進行進一步的回顧性血清學研究,以確定之前人類在不同地理區域接觸過新冠病毒的程度。
實驗室有意或無意洩露了新冠病毒的可能?
作者們還討論了實驗室裡培養新冠病毒的可能性。
他們提到,多年來,世界各地的多個BSL-2(生物安全第二等級)實驗室一直在進行涉及蝙蝠SARS樣冠狀病毒在細胞培養和/或動物模型中傳代的基礎研究。也有一些記錄表明,曾發生或一些SARS-CoV實驗室逃逸事件。因此,我們必須考慮實驗室有意或無意洩露了新冠病毒的可能。
作者們認為,從理論上說,新冠病毒的RBD突變位點有可能是通過細胞培養傳代過程中的適應取得的,這種情況已經在SARS-CoV的研究中被觀察到。
然而,在穿山甲中發現了具有幾乎相同RBDs的SARS-CoV樣冠狀病毒,這為解釋新冠病毒是如何通過重組或突變獲得這些RBDs提供了一個更有力、更簡潔的解釋。
同時,多鹼基酶切位點或O-linked聚醣的存在也反對了基於實驗室培養的假設。因為只有在細胞培養物或動物中長時間傳播低致病性禽流感病毒的情況下,才能產生多鹼基酶切位點。此外,如果真的通過細胞培養或動物傳代產生新冠病毒,則需要事先分離具有非常高遺傳相似性的祖病毒,在具有人類同源ACE2受體的動物中大量傳代,但這些工作此前從未有報導。同時獲得O-linked聚醣結構的可能性也不大,因為這種突變通常表明免疫系統的參與,這在體外是不存在的。
作者們在文章中寫道,在全球新冠疾病的公共衛生緊急情況中,我們有理由去想為什麼流行病的起因十分重要。對動物病毒如何跨越物種、如此迅速地感染了人類的詳細了解將有助於預防未來的人畜共患病事件。
例如,如果新冠病毒已預先適應了另一種動物,那麼即使目前的流行病得到控制,我們也仍有未來再發生此類事件的風險。相反地,如果我們描述的適應過程是發生在人類中,那麼即使重複此前的人畜轉移,病毒也不太可能暴發,除非發生了相同系列的突變。
此外,確定與新冠病毒最接近的動物親緣將大大有助於病毒功能的研究。RaTG13 bat序列的可用性也的確促進了本研究進行的比較基因組分析,有助於揭示RBD中的關鍵突變以及多鹼基酶切位點的插入。
他們認為,本文描述的基因組特徵可以部分解釋新冠病毒在人類中的傳染性和傳播性。目前的基因組證據不支持新冠病毒是實驗室產物的觀點,但目前尚無法證明或反駁本文所述的其他起源。
然而,由於作者們在相關的自然界冠狀病毒中觀察到新冠病毒的所有顯著的特徵,包括優化的RBD和多鹼基酶切位點,他們認為任何基於實驗室製造的假設都是不可信的。
文章提到,更多的科學數據可能會改變證據的平衡,使一種假說比另一種假說更可信。從動物來源獲得相關的病毒序列將是揭示病毒來源的最確定的方法。例如,對來自動物的新冠病毒樣樣病毒的中間或完全形成的多鹼基酶切位點的進一步觀察將為自然選擇假說提供進一步支持。這也將有助於獲得更多關於新冠病毒的遺傳和功能數據,包括動物研究。
識別新冠病毒的潛在中間宿主,以及對非常早期的患者的病毒進行測序,同樣具有很高的信息價值。
作者們最後表示,無論新冠病毒通過什麼樣的確切機制自然選擇,對人類肺炎疫情和其他動物進行持續監測顯然是最重要的。