新綜合地圖將每個人類基因跟它的功能聯繫起來
人類基因組計劃(The Human Genome Project)是一項雄心勃勃的舉措,旨在對人類的每一塊DNA進行排序。該項目吸引了來自世界各地研究機構的合作者–其中包括麻省理工學院(MIT)的懷特海生物醫學研究所–並最終於2003年完成。
現在,二十多年過去了,MIT教授Jonathan Weissman及其同事已經超越了序列並提出了人類細胞中表達的基因的第一個全面功能圖。這個項目的數據於6月9日在線發表在《Cell》上,其將每個基因跟它在細胞中的工作聯繫起來,這代表了多年來在單細胞測序方法Perturb-seq上合作的結晶。
這些數據可供其他科學家使用。Weissman說道:”這是一個很大的資源,就像人類基因組是一個很大的資源一樣,你可以進去做基於發現的研究。你不必提前定義你要研究的生物學,你有這個基因型-表型關係圖,你可以進去篩選數據庫,而不必做任何實驗。”據悉,他還是懷特海研究所的成員和霍華德-休斯醫學研究所的調查員。
這使得研究人員得以深入研究各種生物學問題。他們用它來探索功能未知的基因對細胞的影響、研究線粒體對壓力的反應並篩選出導致染色體丟失或增加的基因,這種表型在過去被證明很難研究。“我認為這個數據集將使那些來自生物學其他領域的人能夠進行各種我們甚至還沒有想到的分析,突然間他們就有了這個可以利用的東西,”這項研究的論文共同第一作者、前魏斯曼實驗室博士後Tom Norman說道。
開創性Perturb-seq方法
該項目利用的Perturb-seq方法使得科學家們有可能以前所未有的深度跟踪開啟或關閉基因的影響。這種方法由包括魏斯曼和MIT教授Aviv Regev在內的一組研究人員於2016年首次發表,不過它只能用於小規模的基因集且花費巨大。
大量的Perturb-seq圖譜是由Joseph Replogle的基礎工作促成,他是Weissman實驗室的醫學博士生,也是本論文的第一作者之一。Replogle與Norman、Britt Adamson(普林斯頓大學分子生物學系的助理教授)及10x基因組學的一個小組合作著手創建一個可以擴大規模的新版Perturb-seq。研究人員於2020年在《Nature Biotechnology》上發表了一篇概念驗證的論文。
Perturb-seq方法使用CRISPR-Cas9基因組編輯將遺傳變化引入細胞,然後使用單細胞RNA測序來捕獲有關因特定遺傳變化而表達的RNA的信息。由於RNA控制著細胞行為方式的所有方面,這種方法可以幫助解讀基因變化的許多細胞效應。
自他們最初的概念驗證論文以來,Weissman、Regev及其他人已經在更小的範圍內使用這種測序方法。如研究人員在2021年使用Perturb-seq來探索人類和病毒基因在感染HCMV(一種常見的皰疹病毒)的過程中如何互動。
在新研究中,Replogle和包括Weissman實驗室的研究生和該論文的共同第一作者Reuben Saunders在內的合作者將該方法擴大到整個基因組。他使用人類血癌細胞係以及來自視網膜的非癌細胞、對超過250萬個細胞進行了Perturb-seq並利用這些數據建立了一個將基因型和表型聯繫起來的全面地圖。
深入研究數據
在完成篩選後,研究人員決定將他們的新數據集投入使用並著手研究一些生物學問題。Tom Norman指出:“Perturb-seq的優勢在於它可以讓你以一種無偏見的方式獲得一個大數據集。沒有人完全知道你能從這種數據集中得到的極限是什麼。現在問題是,你實際上用它做什麼?”
第一個最明顯的應用是研究具有未知功能的基因。因為該屏幕也讀出了許多已知基因的表型,研究人員可以用這些數據來比較未知基因和已知基因並尋找類似的轉錄結果,這可能表明這些基因產品作為一個更大的複合物的一部分一起工作。
一個名為C7orf26的基因的突變尤其引人注目。研究人員注意到,那些被移除導致類似表型的基因是一種叫做Integrator的蛋白質複合物的一部分,該複合物在創造小核糖核酸方面起著作用。Integrator複合體由許多較小的亞單元組成–以前的研究表明有14個單獨的蛋白質–而研究人員能確認C7orf26構成了該複合體的第15個組成部分。
他們還發現,這15個亞單位在較小的模塊中一起工作並在整合者復合物中執行特定的功能。Saunders說道:“如果沒有這種千尺高樓平地起的情況,這些不同的模塊在功能上是如此不同,這一點並不清楚。”
而Perturb-seq的另一個好處是,由於該檢測專注於單細胞,研究人員可以使用這些數據來觀察更複雜的表型,當它們跟來自其他細胞的數據一起研究時這些表型會變得模糊不清。“我們經常把’基因X’被敲除的所有細胞拿出來,把它們平均在一起,然後看看它們如何變化,”Weissman介紹稱,“但有時當你敲除一個基因時,失去同一基因的不同細胞會有不同的行為,而這種行為可能會被平均數所忽略。”
研究人員發現,一個基因子集,其去除導致不同細胞的不同結果,負責染色體的分離。它們的移除導致細胞失去一條染色體或撿到一條額外的染色體,這種情況被稱為非整倍體。“你無法預測失去這個基因的轉錄反應是什麼,因為它取決於你獲得或失去什麼染色體的次級效應,”Weissman介紹道,“我們意識到,我們可以扭轉這種情況,創造這種複合表型,尋找染色體獲得和失去的特徵。通過這種方式,我們已經完成了第一個全基因組範圍的篩選以尋找DNA正確分離所需的因素。”
“我認為非整倍體研究是迄今為止這一數據的最有趣的應用。它抓住了一個你只能用單細胞讀出的表型。你不能用其他方式去追求它,”Norman說道。
研究人員還利用他們的數據集來研究線粒體如何對壓力做出反應。從自由生活的細菌進化而來的線粒體,在其基因組中攜帶13個基因。在核DNA內,約有1000個基因跟線粒體功能有某種程度的關係。Replogle說道:“人們對核DNA和線粒體DNA在不同的細胞條件下是如何協調和調節的,特別是當一個細胞受到壓力時,已經關注了很久了。”
研究人員發現,當他們擾亂不同的線粒體相關基因時,核基因組對許多不同的遺傳變化作出類似的反應。然而線粒體基因組的反應要多得多。
Replogle指出:“線粒體為什麼仍有自己的DNA,這仍然是一個開放的問題。從我們的工作中得到的一個大的啟示是,擁有獨立的線粒體基因組的一個好處可能是對不同的壓力源有局部的或非常具體的遺傳調節。”
“如果你有一個線粒體被破壞,而另一個線粒體以不同的方式被破壞,這些線粒體可能會做出不同的反應,”Weissman說道。
在未來,研究人員希望將Perturb-seq用於他們開始使用的癌細胞係以外的不同類型的細胞。另外,他們還希望繼續探索他們的基因功能圖並希望其他人也能這樣做。Norman說道:”這確實是作者和其他合作者多年工作的結晶,我真的很高興看到它繼續成功和擴大。”