我們所知的基因概念即將終結:基因並不能決定一切
基因並不像我們曾經以為的那樣決定一切。近年來,我們看過了太多刻意製造噱頭的新聞標題,比如“富有和成功源於你的DNA”、“兒童的成功或許將由一項新的基因檢測決定”、“基因決定了我們未來的命運”等等。
問題在於,這些新聞中很多根本沒有討論真正的基因,而是根據一個粗略的統計模型,涉及幾十種不太可能的假設。現在,可以確定的是,關於基因的整個概念模型正在受到挑戰,儘管過程還十分緩慢。
我們已經攀上了基因的高峰,並且更進一步。
當然,這是一個引人入勝的故事。今天,大多數人都知道孟德爾(Gregor Mendel)在19世紀50年代的豌豆育種實驗。他專注於簡單的特徵,具有明確且易於計數的性狀:紫色或白色的花朵;長莖或短莖;光滑或發皺的種子,等等。在交叉受精後,後代的性狀組合顯示出這些變化與單個“遺傳單位”有關。
孟德爾提出的遺傳因子——當時還無法確定是什麼——就是後來所說的基因。在20世紀初,有人將它們與整個後代在精神和身體上全面發展所需的信息和指令等同起來,這是個誘人的想法。
丹麥植物學家威廉·約翰森(Wilhelm Johannsen)在1911年發表了一篇著名的論文,警告不要這麼做。他說,我們不知道那些推斷出來但無形的因子如何能攜帶如此復雜的信息。但是,約翰森的意見被忽視了,事實證明,真正的原因與意識形態有關,而與生物學無關。
20世紀20年代,受到偏愛的基因法則開始以不同的面目出現。1943年,著名物理學家埃爾溫·薛定諤(Erwin Schrödinger)在都柏林的一次著名演講中,對基因進行了恰當的總結。他告訴聽眾,染色體“以某種編碼腳本的形式,包含了個體未來發展的整個模式,並決定了成熟狀態時的功能”。
圍繞著“編碼”的形象,一個等級和特權分明的世界很快得到了加強。我們被告知,這些基因有不同的“長處”,在一個階級社會中,不同的基因排列形成了決定不同“種族”和階級結構具有不同價值的等級。整個智力測試運動就建立在這種先入為主的概念之上,之後才建立起相應的測試方法。
這一形像還助長了20世紀30年代的優生學和納粹運動,帶來了悲慘的後果。一些政府追隨英國教育委員會在1938年提出的著名論斷,宣布“遺傳不平等是我們無法逃避的事情”,並且“不同的孩子……需要在某些重要方面接受不同類型的教育”。
第二次世界大戰之後的基因研究將重點明確放在生物化學上,但也有類似的先入之見。
1953年,沃森和克里克發現了脫氧核糖核酸(DNA)的結構,這似乎證實了強大的編碼腳本的存在。他們揭示了DNA中的由核苷酸組成的序列如何作為蛋白質的模板——可以視為一種編碼,就像一台打字機將字母組合成為單詞。因此,被廣為接受的“中心法則”(central dogma)可以被認為是基因中編碼的單向信息流:
DNA模板→蛋白質→發育特徵;就好像只需要生成單詞就能寫出複雜的整本“書”。
然後,用於全基因組測序的卓越技術出現了。我們被告知,儘管成本巨大,但該技術在人類基因組計劃中的應用將揭示“是什麼造就了人類”。我們聽到了過度的承諾,宣稱很快就會發現控制人類智力、社會行為和復雜疾病的基因。
現在,在低成本、高度自動化的程序中,尋找這些基因變得更加容易。每個人的DNA組成——就像單詞中的字母——都有所不同,這一現象稱為單核苷酸多態性(single nucleotide polymorphisms,簡稱SNP)。對人類定義的遺傳搜索被歸結為尋找這些變化與智商、教育、疾病或其他方面的差異之間的相關統計。
多年來,令人失望的是,單核苷酸多態性和可觀察到的人類特徵之間只具有少數非常微弱的關聯。於是一個憑空想像的主意出現了。為什麼不把這些微弱關聯中相關性最強的挑出來,把它們加在一起,直到獲得一個與個體差異具有統計學顯著性的關聯?正是這樣的“多基因評分”,將數百或數千個單核苷酸多態性組合在一起,與不同人的智商或教育成績等特徵關聯在一起(儘管十分微弱),從而構成了我們如今在新聞中見到的誇大宣稱。
今天,20世紀30年代的政策暗示再次被提出。與此有關的提議包括在出生時進行基因檢測以進行教育干預、選擇具有所需特徵的胚胎、鑑別哪些階級或“種族”比其他類別更健康,等等。在聰明的市場營銷下,數以百萬計的人驚慌失措地通過DNA自我檢測工具包來了解自己的“基因運勢”。
因此,如今在大眾媒體中的炒作,正在將科學中一直潛藏的某種東西推廣開來,這就是:存在一個作為實體的“基因神”,它具有近乎超自然的力量。借用英國聖公會的讚美詩來說,如今是基因“讓我們貴賤分明,身份有序”。
科學哲學家蘇珊·奧亞瑪(Susan Oyama)在1984年出版的《信息的個體發生》(The Ontogeny of Information)一書中警告稱:“正如傳統思想將生物形態置於上帝的精神中一樣,現代思想也找到了賦予基因終極成型能力的方法。”
在今天的科學和流行描述中,基因會“扮演”,會表現出“行為”,會“指導”“控制”“設計”“影響”,還會“起作用”“負責”,還是“自私”的,不一而足。彷彿基因也有自己的設計和意圖。
但與此同時,相反的敘事正在建立,不是來自媒體,而是來自科學本身。
威廉·約翰森的邏輯觀點長期受到壓制,已經在過去幾十年中助長了“基因神”的壯大。如今,他的邏輯已經回歸。科學家現在明白,DNA編碼中的信息只能作為蛋白質的模板,它不可能作為更複雜任務——將蛋白質組合成一個完整功能的實體——的指令,正如打字機的字母不會自己組成一個故事。
我們許多人都曾被灌輸這樣的概念,即在生物發育之前,必須先有一組基因指令;如果這些指令不在DNA編碼中,又會在哪裡呢?到了20世紀80年代,研究結果逐漸使這一概念完全改變。
首先,實驗室研究顯示,遠在基因存在之前,生命形態可能就以“分子湯”的形式繁盛了很久。它們是自組織的合成聚合物(如RNA和DNA),通過數百種組分之間的相互作用不斷適應、再生。這意味著它們遵循的是組分之間根據當前條件,因相互關係而產生的“指令”,沒有整體控制者。遺傳學家多倫·蘭瑟(Doron Lancet)將這種“指令”稱為“組合式信息”(compositional information)。
從這個角度來看,後來演化出來的基因,其實是先前系統的產物,而不是它們的最初設計者和控制者。基因更可能是在需要時作為組件的模板:一種在循環基礎上“及時”供應零件的設施。
然後我們慢慢意識到,我們從父母那裡繼承的是這種動態系統,而不僅僅是基因。卵子和精子含有多種因子:酶和其他蛋白質;氨基酸;維生素;礦物質;脂肪;核糖核酸(RNA);數百種細胞信號因子;以及父母基因的其他產物,而不僅僅是基因本身。
分子生物學家一直在描述這些因子如何形成相互作用的複雜網絡。它們根據周圍不斷變化的條件,自行組織在一起。由於對不斷變化的統計模式十分敏感,它們會預測未來的狀態,經常創造出新的屬性來滿足需要。
因此,即使是單個細胞也會改變自己的代謝途徑,以及利用基因來適應這些模式。也就是說,它們在“學習”的同時創造出了指令。當然,基因被用作製造重要資源的模板。但是,系統的方向和結果不受基因控制。就像螞蟻或蜜蜂的巢穴一樣,在形態和變異的發展過程中有更深層次的動力學規律。
有些人將這個過程比作一個沒有指揮的管弦樂隊。生理學家丹尼斯·諾布爾(Denis Noble)將其描述為“隨生命之調起舞”(Dancing to the Tune of Life)——這也是他新書的標題。在早期發育中,這個過程最令人驚嘆。在幾小時內,受精卵變成了一團由相同細胞組成的球——當然,它們都具有同樣的基因組。但是,這些細胞已經在通過化學信號“風暴”進行交談。通過化學信號風暴中的統計學模式,指令再次被創建。所有具有相同基因的細胞增殖成數百種截然不同的類型,在正確的時間找到合適的地方,開始隨指令“翩翩起舞”。這一過程無法在DNA的固定字符串中指定。
於是,我們已經開始明白,不存在事先的計劃或發育藍圖:指令是在倉促間實時創建的,遠比愚蠢的DNA聰明得多。這就是今天的分子生物學家報導細胞中存在“認知資源”的原因;“生物-信息情報”“細胞智能”“代謝記憶”以及“細胞知識”,所有這些術語都來自最近發表的文獻。“細胞會思考嗎?”,這是2007年發表在《細胞與分子生命科學》(Cellular and Molecular Life Sciences)期刊上一篇論文的標題。另一方面,基因型中假設存在的發育“程序”編碼從未被描述過。
正是這些發現徹底改變了我們對遺傳因果關係的概念。我們傳統上認為細胞內容物只是為DNA指令服務的。但是,正如英國生物學家丹尼斯·諾布爾所堅持的那樣,“現代合成法已經表明生物學中的因果關係是錯的……在被系統其他部分激活之前,DNA本身什麼都做不了……DNA不是主動意義上的原因。我認為更好的描述是,DNA是一個被動,生物體用它來製造所需的蛋白質。”
當然,很容易理解人們為什麼會有直接遺傳指令的印象。在一定程度上,父母將身體特徵“傳遞”了下去:頭髮、眼睛顏色,身高、面部特徵,等等;這些都是“在家族中流動”的東西。還有數百種疾病在統計學上與單基因突變有關。幾十年來我們的認知都是,這些肯定反映了遺傳編碼預先決定了發育和個體差異,是這樣嗎?
事情並非如此簡單。想想孟德爾的甜豌豆。有些花是紫色或白色的,正如前文提到的,遺傳模式似乎反映了單個“遺傳單位”的變異。然而,遺傳模式並不取決於單個基因。統計相關性模糊了染料(花青素)的幾種化學合成途徑,這些途徑由細胞作為整體控制和調節,包括許多基因的產物。一個組成部分(轉錄因子)的微小改變就會破壞這種編排,在這種情況下,花朵就是白色的。
這是諾布爾所說的“被動因果關係”的很好例證。類似的觀點也適用於許多“遺傳疾病”,以及在家族中“流動”的疾病。但演化程度更高的功能——以及相關疾病——取決於上面提到的更龐大的調節系統,涉及數千個基因。基因遠不是一心一意的執行者,而通常是在DNA序列中,以十幾個或更多的“調節”序列(被更廣泛的細胞信號及其動力學所用)作為側翼,來控制基因轉錄。
這就解釋了為什麼人類的基因數量只比蒼蠅或老鼠多一些(大約只有2萬),而胡蘿蔔的基因數量就有45000!生物的複雜性和它們擁有的基因數量之間並沒有相關性,而是與調節網絡不斷演化的複雜性有關。通過計算基因數量來理解生命,就像以字母數量來判斷文學作品一樣,這是沒有意義的。
所有這些為現代基因關聯研究提供了令人焦慮的背景。此外,支持這些研究的統計分析本身也充滿了陷阱。首先,在計算多基因得分的方法中,有數百萬變量通過統計操作進行分析,從而為假陽性的產生提供了巨大的機會。極大的數據庫——即使是隨機產生的——會包含大量毫無意義的相關性;而且統計學顯著性數值會因為無效的假設而極度誇大。
舉例來說,在多基因評分估計中,假設單核苷酸多態性關聯可以簡單地加在一起,就像袋子裡的豆子一樣,不會彼此影響,也不會受到環境的影響。然後,正如美國國立衛生研究院(NIH)提醒我們的那樣,絕大多數單核苷酸多態性在功能上都是不相關的。
更重要的是,所有現代社會都是人們不斷遷移的結果,他們的遺傳背景差異在功能上無關緊要。不同的遷移浪潮傾向於在不同水平上隨機地進入階層結構,產生所謂的遺傳種群分層。但是,不同社會階層在學習機會方面也存在差異,而智商測試、教育等的設計反映的正是這些差異,而不論學習能力的差異如何。因此,一些欺騙性的相關性也是不可避免的。
正如傑里米·J·伯格(Jeremy J。 Berg)於2018年12月在在線期刊Biorxiv上警告的那樣,多基因評分“受到分層偏差的嚴重影響,因為即使祖先中很小的差異也會在無意中轉化為預測表型的巨大差異。”
對這些工作不利的另一個方面是,研究者發現基因產物在使用之前通常會進行重排。這意味著不同的蛋白質(可能具有不同的功能)可以從同一基因產生,而不是像中心法則說的那樣“一對一”。同樣的,這些重排過程的指令也不是來自基因本身。
更令人驚異的是,基因組中只有不到5%的基因是真正用來製造蛋白質的。大部分基因用來產生大量的不同因子(RNA),通過調節網絡來調節其他基因的使用。
我們越來越多地發現,在演化程度較高的性狀(如人類思維)中,很少有從DNA變異發育至個體差異的預測。當然,基因是至關重要的,但近乎所有遺傳變異形成的方式都是構建替代路線。“多種替代途徑……是規則而不是例外,”2017年《生物系統》(BioSystems)期刊上的一篇論文如此寫道。
現在眾所周知的是,在相同環境中養育的一組基因相同的個體(比如純種的實驗動物),在成年時並不會完全相同。相反,它們會展現出全方位的身體和功能變化,與正常的、遺傳變異的群體中出現的情況一樣。在2013年《科學》(Science)雜誌的一篇報導中,茱莉婭·弗林德(Julia Fruend)及其同事在大腦結構發育的差異中觀察到這種效應。
同樣,我們現在可以理解為什麼相同的遺傳資源可以在不同器官和組織中以多種不同的方式發揮作用。現在用於我們手臂和雙腿發育的基因,最初都出現在沒有這些器官的生物體中。果蠅用於性腺發育的基因現在被用於人類大腦的發育。而且,大多數基因會同時用於幾種不同的組織,以實現不同的目的。
在2013年發表在《生命物理評論》(Physics of Life Reviews)期刊的一篇論文中,詹姆斯·夏皮羅(James Shapiro)描述了細胞和生物體是如何進行“天然基因工程”的。也就是說,它們經常改變自己的DNA序列,對基因組的改寫貫穿了它們的整個生命。該研究最令人震驚的暗示是,對基因的普遍認知——作為DNA鏈上的藍圖,決定生物發育及其變異——實際並不存在。
因此,在2017年《遺傳學》(Genetics)雜誌的一篇綜述中,遺傳學家佩特·波汀(Petter Portin)和亞當·威爾金斯(Adam Wilkins)質疑了“基本’遺傳單位’概念的應用以及長期以來對基因是自主介質的盲從信念”。他們指出,基因的“經典分子定義已經過時了”。
這些對基因概念的徹底修改需要盡快讓大眾知曉,才能使我們避免重複以前的政策錯誤。(任天)
作者簡介:肯·裡查德森(Ken Richardson)曾任英國開放大學的人類發展高級講師。他是一位心理學家,著有《基因、大腦和人類潛能:智力的科學與意識形態》( Genes, Brains and Human Potential: The Science and Ideology of Intelligence)。