如何猜到新冠病毒“喜歡”感染哪些細胞?
自2019年12月開始,關於新型冠狀病毒感染的肺炎疫情就牢牢佔據了我們的視線,在一線奮戰的醫護人員、科研人員,受到疫情影響的同胞們,都觸動著我們的神經。知己知彼,百戰不殆。為了對付新型冠狀病毒,特別是尋找藥物救治被感染的患者,當疫情出現後,我們急需了解它究竟是如何感染人的,特別是它究竟在攻擊哪些細胞,才能有的放矢,尋找相關藥物。
可是,病毒一般只有10-300納米,人體細胞也只有30-100微米,我們怎樣看到在這麼微觀的世界裡,病毒到底感染了人體哪些細胞?
科學的發展,離不開技術的推動
生活在19世紀的科學家們,如果想要弄明白一個動物器官的功能,需要切掉這個器官。
到了20世紀,為了研究某個類型的細胞的群體功能, 科學家們可能要折騰上好幾年去培育轉基因動物。
21世紀的科學家並不滿足於模式化的實驗對象,而是將視野轉向了更大量的數據和更精細的範圍,大到生物的全基因組,小到單個細胞的功能。
這種巨大的變化,要得益於多項技術的發展,其中重要的一項就是單細胞基因活性分析技術。
單細胞基因活性分析,
在新冠病毒感染研究中大展身手
從2013年“單細胞mRNA測序”被評為《自然•方法》的年度技術以來,單細胞基因活性分析不斷發展,讓科學家們得以清楚地看到每個細胞作為一個個體和作為組織的一員所發揮的作用,極大程度地減少了繁雜的假設-求證的步驟,是如今生命科學發展的有力助推器。
近期,這一技術也為揭示新型冠狀病毒感染人體的傾向性立下功勞。
早在一月中下旬,我國科學家就發現,和SARS冠狀病毒一樣,血管緊張素轉化酶2(ACE2)也是新冠病毒感染人體細胞的窗口。
消息一出,立刻有人想到,“尋找新冠病毒入侵人體的的突破口”這個難題有了解決辦法!
首先,我們知道了血管緊張素轉化酶2(ACE2)在新冠病毒感染中起到的關鍵作用,其次,我們還知道肺是一個非常複雜的器官,有許多種類型的細胞組成。現在,如果我們對肺部各種細胞中ACE2的表達量(“表達”即為細胞製造某種蛋白質)做一個詳細分析,就有可能找到容易被新冠病毒感染的細胞類型。
就這樣,觀察微觀世界發生的微觀事件的難題,被轉化成了數據分析題。
不過,數據分析題的難度也不低,而且值得注意的是,這些科研人員們並沒有做任何新實驗,只是從已有的數據庫當中,就找到了所需的樣本。
那麼在肺炎疫情爆發之前取得的樣本,為什麼可以作為我們研究新冠病毒感染的參考?這些數據是如何被取得和分析的?
要回答這些問題,都需要對單細胞基因活性分析有更深入的了解。
基因活性如何預測細胞的易感程度?
這項研究的目的其實很簡單:看看肺裡那麼多種類的細胞,哪些表達大量的ACE2,它們就一定是新冠病毒的主要攻擊目標。
中學生物課上我們學過,一個細胞想要製造某種蛋白質,首先要將記載這種蛋白質編碼信息的基因(DNA)轉錄成信使RNA(mRNA),然後核醣體會根據mRNA上的信息翻譯成蛋白質。因此如果一個細胞中有某種蛋白的表達,我們可以推測其中一定有相應的mRNA;而且就不同細胞中的同種蛋白來說,多數情況下mRNA越多,意味著蛋白表達量也越高。
因此,尋找高表達ACE2的肺細胞,就可以簡化為尋找ACE2 mRNA含量高的肺細胞。所以在這項研究中,“基因活性分析”實際上就是分析細胞為了製造蛋白而轉錄出來的mRNA,即為單細胞mRNA測序。
細胞中基因表達的過程(圖片來源:wikipedia)
如何取得所需要的數據?
這項新冠病毒研究的數據,來源於2019年6月發表的另外一項關於肺細胞的研究中包含的8個健康人的樣本。當時,研究者通過單細胞mRNA測序技術讀取這些樣本的數據之後,上傳到公共數據庫當中,與世界各地的科研人員共享。
當時具體的操作是這樣的:從健康的肺中取一小塊組織,通過處理使其分散成單個的細胞。單個細胞被裂解之後,其中的mRNA被第二代測序技術讀出序列,我們將這些mRAN序列與人類的基因組一比較,就可以推測出每個細胞裡哪些基因在轉錄mRNA、表達了怎樣的蛋白,某個蛋白在哪些細胞之中表達量高。
最新的技術更是可以將每個細胞都打上不同的標籤,這樣可以同時測序多個細胞並得到每個細胞的單獨數據,實驗成本和效率得到極大改善。
單細胞RNA測序的流程(圖片來源:來自wikipedia,有改動)
得益於第二代測序技術,每個細胞中的所有基因表達數據都被讀取並保存,甚至包括那些並不是實驗設計者本意的數據,使得實驗結束之後還能夠源源不斷地提供信息。有了這項技術和共享模式的數據庫,科研人員就可以隨時隨地從前人的數據當中尋找自己想要的信息,而不必重複做實驗,省時省力,高效經濟。
在這項新冠病毒的研究中,科研人員發現,發現肺裡面80%以上的ACE2分佈在II型肺泡上皮細胞(AT2)表面,而且,男性樣本比女性樣本的ACE2表達量要高,與早期感染患者中男性多於女性的現像不謀而合。具體分析過程已經有專業解讀(參考文獻5),請有興趣的讀者自行挑戰。當然單純的數據分析只是一種推測,並不能百分之百保證就是實際情況,還需要實驗和臨床數據的驗證。
基因活性分析的另一種方法
除了單細胞mRNA測序,還有另外一種技術也稱得上是基因活性分析,即為single-cell assay for transposase-accessible chromatin-seq (scATAC-seq,單細胞ATAC測序)。transposase意為轉座酶,可以將有特定序列的DNA插入到另外的雙鏈DNA位點當中。這裡有特定序列的DNA就是芭芭拉•麥克林托克(Barbara McClintock)在玉米中發現的那個轉座子,也稱跳躍基因。
我們知道,真核生物的基因組DNA非常長,在不復制、不表達的時候都會纏繞在核小體上緊密壓縮起來,防止環境帶來的損傷。當某個基因需要表達的時候,相應位置的DNA雙鏈就會從核小體上解脫下來,形成一個鬆散的狀態,方便細胞中跟轉錄有關的酶結合上去,從而開始基因的轉錄。所以我們可以說,在非分裂期的細胞中,凡是結構鬆散的基因都是正在表達的活躍基因。
ATAC測序就利用了這一點,將攜帶測序接頭片段(sequencing adaptor,為特殊的小片段DNA)的轉座酶送到細胞核裡,轉座酶會結合到結構鬆散的DNA上,將測序接頭片段連入基因組DNA。通過擴增、測序這些DNA,我們就可以知道,有測序接頭片段的位點就是當初基因組DNA鬆散的部分,也就是活躍的基因。單細胞ATAC測序就是在每個單獨的細胞中進行上述過程,相關技術與單細胞mRNA測序也有相通之處。
芭芭拉• 麥克林托克(左)以及美國國家自然歷史博物館展出的她的顯微鏡和研究對象——玉米(右)(圖片來源:wikipedia)
在測序技術發展到單細胞水平之前,我們只能從很多個細胞中批量提取DNA或RNA然後進行測序,這樣一來就只能取得所有細胞數據的平均值,而細胞之間一些微小的差異,或者數量較少的特殊細胞類型就被掩蓋掉。
但是,這種細胞間的基因活性差異實際上是非常重要的,試想我們人體幾十萬億的細胞全部都是由一顆受精卵發育而來,如果沒有基因活性的變化,如何能夠組成複雜的結構、實現多樣的功能?
事實上,發育生物學也正是單細胞基因活性分析技術大展拳腳的領域,在動物胚胎從受精卵發育成個體的過程中,通過追踪每個細胞的基因活性變化,科學家們能夠揭示單個基因在發育過程中的起到的作用,而這些知識將對再生醫學做出卓越貢獻。
除此之外,對於像肺一樣由較多類型的細胞(即細胞異質性較高)組成的器官、組織和腫瘤,單細胞基因活性分析也可以對其進行詳盡的研究,然後準確地找出某些數量極少但是極重要的細胞類型。
ATAC測序的應用(圖片來源:來自wikipedia,有改動)
寫在最後
自2002年末SARS病毒出現,到這次的2019-nCoV,時間已經過去了17年。這17年裡,科學與技術在不斷進步,我們也對生命有了更多的認識,但是,我們中的一部分人,對待生命和自然的觀念卻始終沒有進步。希望我們在努力推動科學發展的同時,也能夠銘記這些深刻而沉痛的教訓,敬畏生命,尊重生命,與自然和諧共處。