進化“景觀”能夠幫助預測COVID病毒的下一步動作
2019年秋天,世界開始了現代史上最大的進化生物學實驗之一。一種冠狀病毒獲得了在人類體內生存的能力,而不是一直作為其宿主的蝙蝠和其他哺乳動物。它進一步適應,變得能有效地從一個人傳播到另一個人,甚至在身體的防禦系統能夠對抗它之前進行。
很顯然,進化的棋局並沒有就此停止,現在,我們已經有一個希臘字母湯的SARS-CoV-2變體來證明這一點。
眼下,來自世界各地的研究人員正在試圖更詳細地了解該病毒的進化,特別是SARS-CoV-2的突變如何改變其在人類中傳播的能力。“今天適應性良好的病毒明天可能會適應不良,因為宿主產生了抗性,然後它必須找出一種新的方式來感染該宿主,”來自加州大學聖地亞哥分校的進化生物學家Justin Meyer說道,“這推動了創新,推動了新穎性。”
儘管不斷變化的大流行病所造成的人員傷亡是嚴峻的,但通過觀察病毒在全球範圍內的移動而獲得的大量科學數據是有啟發的。牛津大學大數據研究所的統計遺傳學家Luca Ferretti表示:“COVID給了我們一些最美麗的進化實例。”
預測病毒下一步可能會做什麼可能永遠不可能,但世界各地的病毒學家一直在深入了解SARS-CoV-2的哪些部分最容易進化,哪些關鍵的蛋白質元素不能改變而不影響其生存。這些信息可能為更好、更持久的疫苗指明了方向。其他研究強調了該病毒可能對用於治療一些嚴重的COVID-19患者的單克隆抗體療法產生抗性的方式。這項工作還指出了特定的突變組合,如果這些突變在病毒群體中普遍存在則可能會迎來大流行病的新階段,這些突變除了快速傳播之外還擅長逃避我們的免疫防禦。
科學家們通過利用現代技術重新審視近一個世紀前提出的一個概念–適應度(或自適應)景觀–而得以做出這些發現。他們可以使用適應度景觀來量化病毒基因組的變化跟其複制和感染新宿主的能力之間的關係。代表這種關係的地形圖可以幫助重建病毒的歷史,另外,至少還可以潛在地預測其未來。
對於倫敦帝國學院的分子進化生物學家Tobias Warnecke來說,適應度地貌是連接基因型和表型的一種寶貴方式。他指出,通過挖掘它們的定量潛力,科學家們可以提出關於兩個突變如何協同影響一個性狀的問題以及它們如何受到第三個突變的影響。“以這種方式,你可以通過許多不同的基因型組合來看看這如何影響你感興趣的東西。”
適應度景觀的價值並不限於在基因組或蛋白質的少量變化之間進行比較。現代實驗技術也使一種被稱為深度突變掃描的策略成為可能,在這種情況下,研究人員進行小規模的自然選擇實驗並一次性比較數以萬計的突變體的適應度價值。這一過程可以揭示出突變之間不可預見的相互作用,這些突變可以幫助或傷害病毒–而且可以確定病毒未來的進化路徑,這些路徑可能會對人類構成新的威脅。
生存的動態地圖
查爾斯·達爾文在《物種起源》中寫道,自然選擇是“保存有利的個體差異和變異,並破壞那些有害的個體差異和變異”的結果。在那些日子裡,在對遺傳學和突變的科學理解之前,生物學家只能試圖想像一個生物體的小的、可繼承的變化會如何影響其繁殖。這個想法只有在美國生物學家Sewall Wright的工作中才得以充分鞏固。在其於1932年發表在《Proceedings of the Sixth International Congress of Genetics》上的開創性論文中,他用手繪的圖表來說明一個生物體如何在“幾乎無限的可能變異領域中移動,而該物種可能在自然選擇下通過這些變異”。
Wright指出,將DNA或肽等線性分子的大量可能變體形象化的一種方法是將每種可能性視為空間中的一個獨特點。然後,分子的進化相當於初始和最終變體的點之間的路徑,沿途則會遇到所有的中間變體的點。
為了幫助理解這些變體的複雜圖形和它們之間的進化路徑,Wright表明,它們可以被表示為更直觀的“適應性景觀”,只有兩個或三個維度。橫軸描繪了DNA(基因型)或物理性狀(表型)的變異性–兩個變體越相似,它們在平面上就越接近;縱軸則衡量變異對進化適應性的影響。無論是通過增加可存活的後代還是改善蛋白質的功能,提高生物體生存機率的變異都在山峰上棲息,而那些減少生物體生存的變異則在谷底徘徊。
來自密歇根大學醫學院的進化生物學家Adam Lauring指出,結果是一個具有獨特地形的景觀。如果映射出的變體在其對健康的影響方面沒有什麼不同,那麼景觀看起來就相當平坦,很像內布拉斯加州。對適應度有很大影響的變異體創造的景觀更接近於猶他州布萊斯峽谷的高聳的帽狀物。自然選擇傾向於山峰上的變體。一個物種的平均基因型或表現型應該通過從一個山峰到下一個山峰來進化,最好是沿著山峰之間的山脊而不是通過山谷。
“如果你移動幾英尺你就會掉下來,再爬起來就變得非常困難,”Lauring說道,“可以移動的路徑較少。”
“這個理論非常簡單明了。你只需要知道你的基因型,然後你測量適應度,你基本上可以預測任何可能發生的事情,”在瑞士伯爾尼大學研究進化動力學的Claudia Bank說道。然而將理論付諸實踐是另一回事。
一個複雜的問題是,無論是SARS-CoV-2還是人類的適應度景觀都不是靜態的。一個讓生物體消化新食物但使其生長更慢的突變可能是一個救命稻草,也可能是一個致命的障礙。一個變異體對進化適應性的影響取決於生物體所處的環境。當環境發生變化時,適應度狀況也會發生變化。Lauring說道:“不同的變異有不同的影響,而這取決於適應度環境。”
創建適應度景觀同時也是一個數學上的挑戰。即使是一個長度只有100個氨基酸的小蛋白質也會有20100個可能的變體,這比宇宙中的原子數量還多。很難想像,更不用說計算了,真正的蛋白質適應度景觀的複雜地形以及穿越它們的各種路徑的可能性。因此,幾十年來,適應度景觀是概念上的幫助,而不是具體測量的工具。直到最近,隨著先進的計算能力和改進的分子生物學技術,科學家們才開始為單個蛋白質和簡單的生物體如細菌和病毒製作定量的景觀。
細菌和病毒幾乎是適應度景觀的理想對象。在試管中以數百萬或數十億的數量增長,每個細菌細胞或病毒顆粒都可以從描述適應度景觀的巨大變體庫中孕育一個突變。它們的生成時間非常短,只有幾小時或幾天,這也使研究人員能更快地識別新的變異。大多數使用RNA作為其遺傳物質的病毒–包括HIV和丙型肝炎病毒(HCV)–也非常容易發生突變,因為複制其基因組的RNA聚合酶並不像DNA聚合酶那樣有效地校對副本。
科學家們開始發現的第一件事是,儘管景觀很複雜,但生物體往往只受制於少數幾個適應度最大值和它們之間有限的路徑。2006年《科學》的一篇論文仔細研究了一種叫做β-內酰胺酶的蛋白質,它能使青黴素等抗生素失活。β-內酰胺酶中五個單核苷酸突變的共同作用可以使其抗生素的抗性增加100,000倍。當時在哈佛大學從事進化生物學博士後研究、現在在布朗大學領導一個實驗室的Daniel Weinreich和他的同事指出,該基因的進化有可能遵循120條路徑來積累所有五個突變。
然而,當科學家們在實驗室中創造和測試中間變體時,他們發現其中102條路徑在自然選擇下是不可能的,因為它們產生了有缺陷的或不完整的蛋白質。當他們發現剩下的許多組合未能提高抗生素的抗性時可能性進一步縮小。他們寫道:“這意味著,生命的蛋白質帶可能在很大程度上是可重複的,甚至是可預測的。”
深度突變掃描
預測即使是最小的病毒或蛋白質的未來進化軌跡需要對其適應性景觀有一個詳細的了解,而這是很難獲得的。歷史上,科學家們不得不一次創造一個核苷酸或氨基酸的突變,然後提純突變的蛋白質並評估其功能。檢查幾個以上的可能突變往往是不切實際的。
深度突變掃描技術的發展則改變了這一切。這種技術使科學家能一次性產生數以萬計的變異體,然後使所有的變異體相互競爭從而確定它們的相對適應性價值。
研究人員首先創建一個可以克隆到培養細胞中的變異基因庫。這些基因編碼一種蛋白質,其活性跟某些生化功能有關,可以在實驗室中進行選擇,因此製造這些蛋白質的最合適、最活躍版本的細胞將變得更加豐富,而製造不活躍版本的細胞則消失。通過高通量DNA測序,研究人員可以統計出每個變體的數量以定量測量它在多代中的表現。
倫敦Warnecke實驗室的研究員Valerie Soo表示:“這是一種真正強大的用來捕捉突變影響的方法。”
有了易變異的RNA病毒,科學家們甚至不必在實驗室裡產生變異–易出錯的基因組複製機器會引入變異並為他們完成這項工作。數以百萬計的病毒拷貝中的每一個都跟它的鄰居略有不同,這形成了病毒學家所說的突變體群。
“微生物的繁殖如此迅速,以至於進化每天都在發生,”法國蒙彼利埃MIVEGEC實驗室的進化生態學家Samuel Alizon表示,“”實際上可以實時監控進化。”
研究人員發現,這些病毒群中的突變很少被傳遞給新的宿主,特別是當只需要少量的病毒就能引起感染時。這其中有些純粹是機會,只是哪個變體在正確的時間出現在正確的地點的問題。加州大學舊金山分校的病毒學家Raul Andino-Pavlovsky指出,但通過勾勒出適應性景觀,研究人員可以嘗試弄清楚一些變種的傳播頻率遠高於其他變種的原因。
“一種病毒不僅需要能夠產生多樣性,而且它必須能夠容忍這種多樣性。如果你是一種病毒,且你能容忍變化,那麼你就有可能成為一種適應能力更強的病毒。”
進化生物學家Tyler Starr指出,從概念和數量上來說,實用性景觀是描述慢性或持續性感染的病毒如何逃避宿主免疫系統中和它們的反复努力的完美方式。這就是為什麼他加入了弗雷德-哈欽森癌症研究中心Jesse Bloom的實驗室研究艾滋病毒如何在感染過程中與病人體內的抗體免疫力共同進化。他的目標是了解病毒和免疫系統之間的這種進化軍備競賽是如何產生具有保護性的抗體的,而這可以幫助科學家在開發HIV疫苗時將重點放在病毒中更不可改變的部分。
然而就在Starr剛開始研究艾滋病毒的時候,另一種病毒就搶走了他–以及全世界–的注意力。
比預期的更易變
隨著SARS-CoV-2開始在全球蔓延,Starr和Bloom意識到適應度景觀為開始研究這種新型病原體提供了一種有用的方法。它給了他們一種方法來弄清楚哪些因素在病毒蛋白中是重要的以及病毒能容忍多少變化。
最初,對SARS-CoV-2進行測序的科學家並沒有註意到很多遺傳變化。儘管新冠病毒使用一種容易出錯的RNA聚合酶來複製它們的遺傳物質,但SARS-CoV-2擁有第二種蛋白質作為校對者。因此,研究人員沒有想到該病毒會像流感或艾滋病毒那樣獲得許多突變。
Bloom和Starr知道尖峰蛋白將是新冠病毒中進化壓力最大的部分,因為它是免疫系統識別能力最強的部分,也是病毒用來闖入人體細胞的。然而,由於擁有1273個氨基酸,刺突蛋白的規模太大,無法通過適應度景觀進行快速評估。因此,Starr決定把重點放在被稱為受體結合域的刺突蛋白的一個分支上,它只有幾百個氨基酸–這是一個更加棘手的問題。
Starr利用深度突變掃描創造了4000個不同的受體結合域的突變。他評估了它們跟人類ACE2蛋白結合的能力以及被免疫系統識別的能力。如果SARS-CoV-2無法容忍其受體結合域的許多變化,Starr預計將看到免疫識別或ACE2結合功能將受到突變的嚴重損害。
但這根本不是發生的情況。“受體結合域有很多不同的突變,實際上提高了結合親和力,”Starr說道,“這看起來是一個真正具有容忍性的結構域,有很大的進化能力。然而,當時的想法是,新冠病毒不會發生抗原性的進化。它們可能會是穩定的。”
雖然受體結合結構域容忍的變化比預期的要多,但並非刺突蛋白的所有部分都是如此。Starr說,刺突蛋白的這些部分因此可能是新疫苗和單克隆抗體的良好目標,因為它們隨著時間的推移不太可能發生變異。
當他們於2020年6月首次在biorxiv.org預印本服務器上發布這些結果時,這成為了一個巨大的警鐘,Starr說–這是SARS-CoV-2比人們想像的更容易變異的首批跡象之一。現在,Starr和Bloom正在重複他們對阿爾法、貝塔、伽馬、德爾塔和奧密克戎變體的深度突變掃描實驗以獲得關於其受體結合域的類似見解。
Starr、Bloom及其同事還創建了一個受體結合域的所有可能的突變圖,這些突變並不會干擾ACE2的結合。他們的工作發表在2021年1月的《科學》上,其確定了該結構域的潛在突變。據了解,這些突變可以逃避單克隆抗體療法的中和。他們的工作還確定了在一個感染了SARS-CoV-2 150天的免疫力低下的人身上出現的幾個突變。當這個人在第145天接受單克隆抗體治療時,它們已經對市場上的現有產品產生了抗性。對Starr來說,這表明這些治療性單克隆抗體可能會隨著時間的推移而變得不那麼有效,無論是在單個病人身上還是隨著病毒的變異而變得更加普遍。
此外,正如Starr、Bloom和他們的同事去年夏天在《自然-通訊》上所描述的那樣,幾種廣泛的突變可以分別幫助SARS-CoV-2逃避免疫系統通常針對受體結合域中最有針對性的部分所產生的一些抗體。到目前為止,還沒有哪個病毒系進化到擁有所有這三種突變。他們寫道:“然而,我們認為這種變異體的出現將是一個令人擔憂的發展,應該密切監測。”
2019年底,SARS-CoV-2首次出現的世界跟今天的世界不同。該病毒產生大量自身拷貝並在個人之間傳播的能力是其在大流行初期取得成功的關鍵。然而隨著通過疫苗接種和自然獲得感染的人數增加,病毒將經歷更多逃避免疫反應的壓力。Lauring指出,許多變異都是有代價的,SARS-CoV-2也不例外。一個具有減少病毒傳播的免疫逃逸變體在2020年初可能不被看好,但現在可能被看好。
“我們是病毒的環境,”Lauring說道,“如果我們改變了,環境就會改變。”