人類基因組圖譜發布20週年,基因組測序的17座豐碑
如果說人類的基因組是書寫生命的一本“天書”,那麼讀出構成DNA的A、C、G、T的測序技術就是讓我們能夠讀懂這本“天書”的工具。出現伊始,基因組測序技術對生物醫學研究的重要性就得到了廣泛的關注。
20年前,人類基因組計劃(Human Genome Project)發布了第一版人類基因組圖譜,標誌著人類基因組測序領域的突破性里程碑。此後,基因組測序領域繼續突飛猛進,多種技術創新讓基因組測序更為高效,精準和普及。在第一版人類基因組序列圖譜公佈20週年之際,《自然》網站列舉了20年來在基因組測序領域的重要里程碑。今天藥明康德內容團隊將與讀者一起回顧其中的部分精彩內容。
2001年:第一版人類基因組圖譜發布
在1990年,由世界上多個國家的研究人員組成的國際性團隊開展了人類基因組計劃(HGP),目標是完成對人類基因組中的30億鹼基的測序。在1998年,由Craig Venter博士創建的Celera Genomics也宣布開展人類基因組測序計劃。在2001年2月,《自然》和《科學》雜誌分別發布了人類基因組計劃和Celera Genomics公司完成的人類基因組草圖。這兩項突破性研究開啟了生物醫藥的新時代。
2004:宏基因組學的誕生
在21世紀以前,對微生物的研究通常需要通過培養來分離單個菌株。然而,微生物學家很早就發現,很多種自然界中存在的微生物無法在實驗室中培養,這意味著,使用培養的研究策略,只能夠捕捉到自然界中微生物多樣性的1%,那麼用什麼手段才能夠研究那剩餘的99%?
在2004年,兩項劃時代的研究通過對環境中採集的包含多種不同微生物的樣本進行測序,成功構建了樣本中包含的不同微生物的基因組序列。這兩項研究表明,不用單獨分離和培養一種微生物,就可以通過DNA測序技術,對複雜微生物群體中不同微生物進行分類,並且發現未知的微生物。它們揭示了宏基因組學(metagenomics)的巨大潛力。
2008:下一代基因測序技術
第一代核酸測序技術稱為Sanger測序法。在2003年發布的第一版人類基因組圖譜就是通過Sanger測序來完成的。然而,Sanger測序法需要通過電泳分離大小不同的DNA片段來讀取DNA序列,在成本和速度上的局限限制了它的大規模應用。
2008年,在《自然》雜誌上發表的兩篇論文使用下一代基因測序技術(NGS),生成了一名非裔個體和一名亞裔個體的基因組。在這兩項研究中,研究人員使用了稱為Solexa測序的下一代測序技術。這一技術目前仍然是Illumina公司短讀測序儀的基礎。
圖片來源:123RF
下一代測序技術與Sanger測序法相比的一大重要突破是通過將單個DNA分子固定在基質上,能夠允許對上百萬個不同的DNA分子同時進行測序。在2001年發布的第一版人類基因組圖譜耗資3億美元,耗時十幾年。而使用下一代測序技術,在2008年可以在幾週內完成對一個人類基因組的測序,將測序成本降低到50萬美元。下一代測序技術的出現是測序可及性方面的重大進步,時至今日,這一技術仍然在進一步降低測序需要的時間和成本。
2008:癌症基因組測序的突破
在人類基因組圖譜發布之後,從事癌症研究的科學家們很快就意識到了DNA測序在癌症研究和抗癌療法開發方面的巨大潛力。基因組學可能幫助回答與癌症相關的一些根本性的問題,例如,腫瘤細胞中究竟包含了哪些基因變異?
在2008年,《自然》發布了首個急性髓系白血病(AML)樣本的全基因組序列。在這項研究中,科學家使用下一代測序技術,對一名50多歲的AML患者的腫瘤細胞和正常皮膚細胞樣本進行了全基因組測序。通過將癌細胞的基因組序列和正常細胞的基因組序列進行比較,研究人員發現了在癌細胞中的8個全新基因突變。這一突破性研究驗證了腫瘤學家的猜測,那就是利用基因組測序能夠發現可能導致腫瘤發生的全新基因突變,從而提供一系列潛在的藥物靶點。
自這一突破以來,腫瘤學領域的測序研究以驚人的速度進展。如今,基於DNA測序的檢測已經能夠幫助發現癌症驅動基因,腫瘤突變負荷以及新抗原的出現,為個體化治療提供非常寶貴的信息。
圖片來源:123RF
2008:RNA測序和轉錄子組
人類基因組圖譜雖然揭示了人類基因組的DNA序列,但是要進一步了解這些序列的功能,科學家們需要對DNA轉錄產物RNA進行檢測。在21世紀初,對轉錄子組(transcriptome)的研究依靠的主要技術之一是微陣列(microarray)技術。然而,這一技術的缺陷在於只能研究固定在微陣列芯片上的已知基因或外顯子序列。
在2008年,一系列研究在不同生物模式生物中展示了使用高通量下一代測序技術,對轉錄子組進行測序的可能。這種稱為RNA測序的技術首先通過mRNA的Poly(A)尾部分離RNA,然後將它們逆轉錄生成cDNA並且使用下一代測序技術對cDNA進行測序。在2008年,利用RNA測序技術,多個研究團隊對酵母和擬南芥(Arabidopsis thaliana)的轉錄子組進行了測序,並發現了全新的轉錄子和基因。
RNA測序不但能夠確定功能性基因組,而且可以用於監測不同條件下RNA的數量變化,它已經成為遺傳學、生物學和醫藥領域的標誌性研究工具之一。
2009:外顯子組測序
歷史上,想要找到單基因疾病的原因通常先要通過遺傳學研究確定可能的致病突變在染色體上的位置。而外顯子組測序的突破讓研究人員在不知道致病基因突變的位置和它的功能的情況下,發現導致單基因疾病的基因突變。
外顯子組測序技術通過使用微陣列捕捉到基因組DNA中的外顯子序列,然後對富集的外顯子序列進行測序。它在降低測序成本的同時,對編碼蛋白的序列能夠進行更深度的測序。
圖片來源:123RF
在2009年,華盛頓大學(University of Washington)的Sarah Ng博士和她的同事們報告了首個利用全外顯子組測序發現單基因疾病致病突變的概念驗證結果。在這項研究中,這一團隊對8個對照樣本和四名罕見疾病Freeman–Sheldon綜合徵患者的樣本進行了外顯子測序。他們發現MYH3基因是在4名患者中均出現非同義突變或者剪接位點異常的基因。這一研究確立了使用外顯子測序技術發現致病基因變異的研究框架。隨後,這一團隊應用同樣的策略,又發現了Miller綜合徵等其它單基因疾病的致病基因變異。
外顯子測序對蛋白編碼序列進行深度測序的能力大幅度加快了研究人員發現致病基因的速度,尤其是在罕見病領域。
2009:單細胞測序
基於對組織樣本的基因表達檢測只能夠發現不同細胞類型產生的平均結果,這可能導致研究人員忽略特定細胞類型的表現。在2009年,Nature Methods發布了首個對單個小鼠卵裂球(blastomere)進行的全轉錄子組研究。與微陣列技術相比,這一技術具有更高的敏感性,研究人員不但能夠檢測到更多轉錄RNA的基因,而且發現了全新的剪接位點。
單細胞測序技術的發展,為分析細胞狀態、發現罕見細胞類型,追踪細胞發育軌跡和譜系,以及研究腫瘤異質性都提供了有力的工具。
2012:構建人類基因組的“百科全書”
在第一版人類基因組圖譜完成之前,科學家們已經意識到,確定基因組的DNA序列還遠遠不能達到了解生命分子過程的目的。儲存在DNA序列中的信息需要被調控和解讀,與蛋白的相互作用,染色質的結構和化學修飾,都對這一過程有著重要的影響。因此,在2003年,名為DNA元件百科全書(Encyclopedia of DNA Elements, ENCODE)的研究項目開始啟動。這一項目旨在確認基因組中所有的功能性元件,這不僅包括編碼蛋白的基因,還包括啟動子和增強子這樣的調控元件。
調節基因表達的多種功能性元件(圖片來源:ENCODE官網)
在2012年,這一項目的第二階段(ENCODE 2)完成,研究團隊在《自然》,Genome Research和Genome Biolgoy上發表了30篇論文。他們不但確認了20687個編碼蛋白的基因,而且在147種不同的細胞類型中描繪了它們的表達模式。研究人員還發現了超過7萬個啟動子和接近40萬個增強子區域,為基因組中接近80%的序列找到了至少一種功能。
ENCODE 3的研究結果匯集了5992個實驗,顯著擴展了人們對人類和小鼠基因組中調控元件的了解。
目前這一項目已經進入到第四階段。它將進一步整合個體基因組和單細胞多組學信息,為了解人類生物學、進化和疾病提供一本與時俱進的“百科全書”。
結語
20年前,人類基因組圖譜的發布代表了多個研究團隊將近15年的研究成果。然而,這只是開始。在《自然》紀念人類基因組圖譜發表20週年的特刊中,研究人員表示,基因組圖譜的發布激發了闡明基因組非編碼部分功能的新時代,為療法開發鋪平了道路。更為重要的是,在關注單個基因功能的同時,它幫助建立了在系統水平上對生物學的理解,讓我們能夠解讀定義生命的“天書”。