人類基因組草圖再添細節X染色體被無死角解碼
這是基因測序技術的一小步,卻有可能是人類基因工程學發展的一大步。近日,美國國立衛生研究院(NIH)人類基因組研究所(NHGRI)的研究人員宣布,終於獲得了人類X染色體的完整、無間隙、端對端的序列信息。
這一突破性發現公佈在《自然》雜誌上,這表明有可能生成一個人類染色體的精確鹼基序列,產生人類基因組的完整序列。NHGRI主任、醫學博士埃里克·格林說:“這項成就開啟了基因組學研究的新紀元。”
耗資30億美元、於1990年啟動的人類基因組計劃,經過十年努力,在2000年繪製出首個人類基因組工作草圖。這是有史以來最準確、最完整的脊椎動物基因組序列。
但是,承載人類遺傳密碼的“密卷”並未被百分之百地破譯,仍然存在大量未知的缺口。這些缺口為什麼遲遲不能補上?這次幫助科學家獲得X染色體完整序列的是什麼基因測序技術?剩餘的基因序列空白,能夠順利補上嗎?
給人類基因組測序就像在拼圖
如果你家裡有小朋友,或者你就是一個拼圖愛好者,挑戰更多片數、更大畫幅的拼圖一定是你追逐的目標。
但是,你想過嗎,有一群不同國別的科學家也在挑戰一幅巨大的拼圖,而這幅“拼圖”可能包含的碎片高達數十億片。這幅巨大的“拼圖”實際上就是全球許多機構和科學家多年來一直在努力完成的作品,也就是人類基因組圖譜。
DNA(脫氧核糖核酸)片段儲存著生命的種族、血型及孕育、生長、凋亡等過程的全部信息。生物體的生、長、衰、病、老、死等一切生命現像都與DNA有關。
人類基因組非常長,包含約30億個鹼基對。通過定位這些鹼基對在DNA鏈上的準確位置,進而識別分析出各種基因及其功能,將使人類最終征服癌症、心髒病、阿爾茨海默症等多種頑疾。
需要說明的是,人類基因組並非對某一個人進行測序研究。人類的基因大體相似,無論你是男是女,黃皮膚還是藍眼睛。但是,每個人都有自己的基因組“副本”,而且每個“副本”都略有不同。
因此,在基因組研究中,通常會採用“參考基因組”的概念。參考基因組是一個由科學家組裝的核酸序列數據庫,作為物種的一個基因組參考模版。
基因組參考聯盟(GRC)負責對參考基因組進行不定期更新。但目前參考基因組仍然不完整,其中的DNA序列存在許多缺口等待著填補。
“由於人類基因組太長了,目前任何測序技術都無法一次性讀取所有的序列信息。因此,科學家只能把基因組打碎成一個個小片段進行測序,最後再組裝起來。”南京醫科大學生物信息學系主任汪強虎教授說,在外人看來,這些科學家所做的工作就像是在“拼圖”。
在這幅“拼圖”中,有許多重複的序列。由於測序技術只能完成短片段讀取,重複序列就會導致許多看起來幾乎完全相同的短片段出現。“這就好比拼圖中的藍天、草原,其中的每一小塊都是藍色或綠色,但又沒有線索告訴我們這些片段如何拼接在一起。”汪強虎說,這就帶來了許多缺口。
首先攻下的為何是特殊的X染色體
眾所周知,人的細胞中有一個細胞核,細胞核的遺傳物質在23對染色體上,其中有一對是性染色體。如果是女性,這對性染色體就是XX,但如果是男性,就是XY。而每個人的性染色體一半來自父親一半來自母親。
“科學家選擇X染色體進行補缺測序是有原因的。”汪強虎說,X染色體在23對染色體中長度中等,但是又包含許多遺傳信息,一旦能將X染色體完整測序,也將為今後其他染色體的完整測序提供參考。
“這並非說Y染色體就不重要。”汪強虎說,Y染色體有27個特別的編碼基因,是X染色體沒有的,從這點看,男孩要比女孩多27個來自爸爸的編碼基因。
今年2月告破的28年前南京醫科大學女學生遇害案件,就是依靠Y-STR家系排查技術,先通過Y染色體分析找到家族,再通過採集嫌疑人家族中11名男性口腔拭子並進行DAN比對,確認罪犯。
“Y染色體為男性特有,只能來自於父親的遺傳,有點類似古人說的’一脈相承’。”汪強虎告訴記者,就是爺爺傳給父親,父親傳給兒子。因此,一個家族裡只要對一位男性的Y染色體進行了檢測,也就基本知道這個家族裡其他男性的Y染色體什麼樣。
女性會繼承兩條X染色體,一條來自母親,一條來自父親。但是,這兩條X染色體並不相同,它們的DNA序列包含許多差異。
在這項研究中,研究人員沒有對人類正常細胞的X染色體進行測序。而是選用了一種特殊的雌性細胞——具有兩條來源相同的X染色體。與僅具有X染色體單拷貝的雄性細胞相比,這種細胞可提供更多的DNA進行測序。它還可以避免分析典型雌性細胞的兩個X染色體時遇到的序列差異。
納米孔技術是X染色體測序最大功臣
與20年前獲得的人類基因組草圖相比,這次科學家將X染色體完整測序,最大功臣就是納米孔測序技術。
“這是一種第三代測序技術。”據汪強虎介紹,1996年美國哈佛大學的丹尼爾·布蘭頓、加州大學的大衛·迪默及其同事,在美國《國家科學院院刊》雜誌上首次發表文章指出,可以用膜通道檢測多核酸序列,成為納米孔測序技術的起源。
此次研究使用的是一種特殊的納米孔測序儀,它通過檢測單個DNA分子通過膜上的小孔(納米孔)時電流的變化,對DNA進行測序。
“納米孔測序技術可以獲得包含數十萬個鹼基對的’超長讀取’,這樣的長度可以跨越整個重複區域,從而繞過了一些複雜的挑戰。”汪強虎告訴記者,第一代基因測序技術一次只能讀取幾百個鹼基對,近二十年來測序技術取得長足進步,讓那些曾經被認為十分棘手的重複序列測序,變得相對容易。
“這一成果無疑是個里程碑。”汪強虎表示,通過分析X染色體的基因信息,科學家或將很快攻克一些複雜疑難疾病。
比如X染色體上有著名的基因F8(凝血因子8)和F9(凝血因子9),凝血因子8和9缺乏會導致血友病。
因為男性只有一條X染色體,一旦出現問題,就無法正常產生凝血因子8和9。這也是為何血友病通常發生在男性身上的原因:女性帶有兩條X染色體,如果有一條染色體出現問題,而另一條正常,通常不會出現血友病的病症,但是會遺傳給下一代。
汪強虎認為,新的人類基因組序列填補了目前人類參考基因組中的許多缺口,為基因組研究開闢了新的領域。但潛在的挑戰依然存在,比如,1號染色體和9號染色體的重複DNA片段比X染色體上的要長得多。科學家接下來計劃繼續努力彌合更多未知的缺口區域。
與此同時,針對中國人的多個基因組計劃也在實施之中,汪強虎介紹說:“目前人類參考基因組是以歐美人群為藍本,但是歐美人群與中國人的基因還存在細微差別。例如中國工程院院士、南京醫科大學沈洪兵教授課題組通過全基因組關聯研究,找到與中國人肺癌有關的19個易感基因,作為中國人群肺癌多基因遺傳風險評估指標,可實現前瞻性預防。”