首個完整無間隙人類基因組序列公佈
被譽為生命科學“登月計劃”的人類基因組測序再次取得重大進展:國際科學團隊端粒到端粒聯盟(T2T)發表了第一個完整的、無間隙的人類基因組序列,首次揭示了高度相同的節段重複基因組區域及其在人類基因組中的變異。這是對標准人類參考基因組,即2013年發布的參考基因組序列(GRCh38)的“重大升級”。當地時間31日,《科學》雜誌連發6篇論文報告這一成就。
2001年2月12日,由6國科學家共同參與的國際人類基因組計劃首次公佈人類基因組圖譜及初步分析結果;2003年4月15日,公佈了人類基因組序列草圖。然而由於技術限制,當初的人類基因組計劃留下了大約8%的“空白”間隙。這部分很難被測序,由高度重複、複雜的DNA塊組成,其中包含功能基因以及位於染色體中間和末端的著絲粒和端粒。
新的無間隙版本被稱為T2T-CHM13,由30.55億個鹼基對和19969個蛋白質編碼基因組成。增加了近2億個鹼基對的新DNA序列,包括99個可能編碼蛋白質的基因和其中近2000個需要進一步研究的候選基因。這些候選基因大多數是失活的,但其中115個仍然可能表達。團隊還在人類基因組中發現了大約200萬個額外的變異,其中622個出現在與醫學相關的基因中。此外,新序列還糾正了GRCh38中的數千個結構錯誤。
具體而言,新序列填補的空白包括人類5條染色體的整個短臂,並覆蓋了基因組中一些最複雜的區域。其中包括在重要的染色體結構中及其周圍發現的高度重複的DNA序列,如染色體末端的端粒和在細胞分裂過程中協調複製染色體分離的著絲粒。新序列還揭示了以前未被發現的節段重複,即在基因組中復制的長DNA片段,已知其在進化和疾病中發揮重要作用。
新序列還在識別和解釋遺傳變異方面具有重要改進,並揭示了關於著絲粒周圍區域的前所未見的細節。這一區域內的變異性可能為人類祖先如何進化提供新證據。
研究人員稱,這一完整的、無間隙的序列對於了解人類基因組變異的全譜和了解某些疾病的遺傳貢獻至關重要。
研究人員表示,下一階段的研究將對不同人的基因組進行測序,以充分掌握人類基因的多樣性、作用以及我們與近親、其它靈長類動物的關係。(實習記者張佳欣)