我們的DNA真的有98%都是垃圾嗎?
據國外媒體報導,脫氧核糖核酸(DNA)是維持生命運作的靈藥,如同一本蛋白質生產的指導手冊。這本手冊僅用四個字母寫成:A、G、T和C,分別對應著4個鹼基:腺嘌呤(A)、胸腺嘧啶(T)、鳥嘌呤(G)和胞嘧啶(C)。這四個字母、或者說鹼基對,在長長的DNA鏈中以特定方式組合在一起,便構成了基因。
基因是微小的DNA片段,其中記錄著通過轉錄過程生成蛋白質所需的信息。這些蛋白質對於生物的發育和生存而言至關重要。
1990年,幾家實驗室決定聯手破解構成人類DNA的遺傳指令,這便是著名的“人類基因組項目”。到了2003年4月該項目結束時,我們終於揭開了大自然繪製的人類藍圖。
染色體由DNA鏈盤繞而成。
借助人類基因組計劃,科學家終於對人類的DNA有了數字概念。結果顯示,人類細胞中共含有30億對鹼基對,壓縮成了23對染色體。每2萬至2.5萬條基因對應著約1億個鹼基對,負責著一系列蛋白質的編碼,其中每種蛋白質都有各自的獨特功能。在整個基因組中,負責蛋白質編碼的DNA僅佔1%至2%。
剩餘的98%至99%並未負責任何蛋白質的編碼,因此被命名為“非編碼DNA”。由於科學家認為蛋白質合成是DNA的主要作用,因此這部分DNA又被叫做“垃圾DNA”。但問題是,作為生命的“菜譜”,DNA中為何會有這麼多頁的垃圾內容呢?
是垃圾,還是尚未被發現?
mRNA的剪接機制。
合成蛋白質並不像按照菜譜做菜那麼簡單。蛋白質需要藉助DNA的轉錄才能合成,因為合成蛋白質的酶無法直接讀取DNA。DNA中編錄的內容會被複製到一種叫做“信使RNA(mRNA)”的分子上去。和DNA一樣,mRNA也有4個鹼基對,但胸腺嘧啶(T)被尿嘧啶(U)所取代。此外,mRNA是單鏈結構,而不是DNA那樣的雙鏈結構。
在轉錄期間,mRNA會被切割成若干片段、然後再重新結合在一起。這一過程名叫RNA剪接。之所以要有這一過程,是因為部分基因片段“從蛋白質角度來說”沒有意義。這些片段被叫做“內含子”(introns)。在RNA剪接過程中,這些片段會被剔除出去、棄之不用,可以說這些片段在轉錄過程中被丟棄了。
DNA與RNA。
數十年來,這些非編碼片段一直令科學家困惑不已。它們分散在各個基因之間,似乎起不到任何明顯作用,許多科學家認為它們毫無價值可言。1972年,遺傳學家大野乾(Susumu Ohno)發明了“垃圾DNA”一詞,來形容這些DNA中的“廢料”。當時,這些DNA也被稱作“自私DNA”,因為它們的存在似乎完全是為了自己,對生物體的生存沒有做出任何貢獻。
不過,有一些科學家認為,我們不應倉促地給這些DNA打上“無用”的標籤。如果你在閱讀這篇文章的英語原文時,只認識其中的十個單詞,你能說除此之外的其它單詞全都是無用的廢話嗎?同理,科學家認為,這些所謂的“垃圾DNA”的功能也許只是尚未被我們發現而已。
“垃圾DNA”的功能是什麼?
研究人員決定將人類基因組與其它動物基因組的龐大數據庫進行比較。這項技術名叫比較基因組學。結果研究人員震驚地發現,有些垃圾DNA片段千萬年來始終不曾改變過。這些DNA片段得以被保留下來,說明非編碼DNA在某種程度上對生物的存活至關重要。因此,這些DNA在進化過程中通過“正選擇”被保留了下來,因為假如這些片段發生了變異,可能會對生物有害。
例如,在6500萬至7500萬年以前,小鼠和人類從同一個祖先走上了兩條不同的進化路線。研究人員發現,在所有保留下來的DNA中,只有20%負責了蛋白質編碼,大部分DNA其實都屬於基因組中的非編碼區域。
人類基因組計劃時間線。
然而,在人類基因組計劃結束後發布的“DNA元件百科全書”(簡稱ENCODE)為垃圾DNA的“無用”投出了否定的一票。ENCODE是在美國國家人類基因組研究院的讚助下、由多家實驗室合作完成的。人類基因組計劃旨在解讀人類生存的藍圖,而ENCODE則力圖弄清這部藍圖中的哪些片段真的有用。
人類基因組計劃利用了DNA測序來破解人類基因組,而ENCODE項目則通過RNA測序、以及尋找可以被化學物質或蛋白質改變的DNA片段,對RNA等其它元件進行了考察。該項目研究結果顯示,DNA片段的化學活動也許給我們一些提示,幫助我們了解其可能有哪些功能。
要記得,基因攜帶著合成蛋白質所需的信息,而蛋白質最終負責執行細胞功能。給定基因最終能夠合成的蛋白質數量是由其基因表達(即利用基因中編錄的信息指導蛋白質合成的能力)決定的。
基因表達的核心原理。
特定的蛋白質、轉錄因子、或化學物質可以與DNA結合,改變基因表達的時間和方式。科學家發現,一部分“垃圾DNA”中含有能夠調節基因的DNA,可以決定何時及如何激活或關停基因。它們還可以作為轉錄因子與DNA結合的場所,對轉錄過程進行調節。非編碼DNA包含幾種不同的調控因子,包括:
啟動子(Promoters):假如將基因比作一個燈泡,那麼啟動子序列就是它的開關。啟動子為蛋白質提供了一個啟動轉錄過程所需的場所,還可以切換轉錄相關元件的開閉。無法合成蛋白質的基因不含啟動子,其位置處於編碼基因序列的前端。
啟動子的作用機制。
增強子(Enhancers):協助激活轉錄過程的蛋白質會與增強子序列結合。增強子的作用類似於化學反應中的催化劑。即使沒有增強子序列,轉錄依然可以發生,但在有增強子的情況下,轉錄的效率會更高。增強子可能位於基因序列末端,也可能遠離基因序列。
增強子的作用機制。
沉默子(Silencers):與增強子相反,沉默子可以與能夠抑制轉錄的蛋白質結合,防止某個基因過度表達,造成蛋白質過剩。與增強子類似,沉默子與基因序列之間的距離也由遠有近。
沉默子的作用機制。
增強子與沈默子結合在一起,起到的作用類似於風扇的調節器。只不過它們控制的不是風扇轉速,而是基因表達的程度。蛋白質與增強子結合,相當於把風速調到最大;而與沈默子結合,則相當於讓風扇“停轉”。
以上列舉了非編碼DNA的幾項“功能”。那麼,非編碼DNA究竟算不算功能性的DNA序列呢?
一段“功能性”的DNA序列能夠控制基因表達,即由一段特定基因序列合成的蛋白質數量。正是蛋白質組合上的區別賦予了每種細胞獨特的功能。因此,既然每個細胞含有的基因組和DNA都相同,就需要由基因表達水平來決定某個細胞屬於上皮細胞、免疫細胞還是神經細胞等等。
為解釋這種與生俱來的可變性,ENCODE研究團隊在多種類型的細胞中實踐了上述技術。因此,按照上述“功能性”的定義,“垃圾DNA”對基因表達絕對起到了一定影響。ENCODE項目的研究結果說明,我們對基因組中神秘的非編碼區域的了解實在是少得可憐。
2012年,ENCODE項目合作小組揭露,超過80%的基因鹼基對都表現出了生物化學活動。因此,擁有生物功能的DNA肯定不止1%。該項目發現了大量此前未識別出的信號和“開關”,就像紋身一樣,鑲嵌在人類DNA各處。
結論
自ENCODE項目發布研究結果以來,科學家已經找到了非編碼DNA序列與多種生物學過程及人類疾病之間的關聯。研究人員猜測,這些序列也許與我們方向相反的大拇指、甚至子宮的發育有關。期刊《致癌基因》(Oncogene)上發表的一篇論文也顯示,一段非編碼DNA片段可以調控基因表達,最終可以對前列腺癌和乳腺癌的患病風險造成影響。因此,破解所謂“垃圾DNA”的功能如今已成為了一項大有可為的研究領域。
但這裡需要指出,ENCODE項目對於“有功能”的定義受到了人們的激烈討論。許多科學家指出,ENCODE項目的結果具有誤導性,並且被遠遠高估了。他們認為,蛋白質僅僅是與DNA結合、或是經歷了化學變化,不足以說明該DNA序列一定扮演著某種有意義的角色。在生物體內,有些DNA與蛋白質的結合僅僅是隨機發生的事件,沒有任何重要意義。這無疑給ENCODE項目發布的結果蒙上了一層疑影。
這些批評的聲音不無道理。要想對非編碼DNA的功能進行量化,我們還需要開展更多研究工作。不過,對於“垃圾DNA其實一點也不垃圾”這一事實,倒是沒有人反對。