中國團隊領銜新創的全基因組分析方法取得重大發現
距今93萬年前,人類祖先可能遭遇劇烈氣候變化,在短期內喪失了約98.7%的成員個體,幾乎滅絕。9月1日,國際學術期刊《科學》在線發表了中國科學院上海營養與健康研究所李海鵬研究組與華東師範大學腦功能基因組學研究所潘逸萱研究組的這項最新研究成果。
該研究創建了FitCoal(快速極小時間溯祖)新理論,並發現人類在早、中更新世過渡期由於氣候環境的急劇變化經歷了嚴重的群體瓶頸,人類祖先近乎滅絕。這一人類進化史上的重大發現,凝聚著合作研究團隊“十年磨一劍”的結晶。
研究成果照片。圖片左側展示了群體歷史估計新方法的核心公式;右側岩畫描繪了人類祖先在遠古的群體瓶頸時期,團結起來共同面對未知的風險。中國科學院上海營養與健康研究所供圖
對古人類群體進行“人口普查”
“如果說古DNA提取和分析是一把槍,精準擊中了人類近十萬年的溯祖研究,那麼我們就想造一把新槍,用以解決百萬年精準溯祖的問題。 ”李海鵬說。2007年,李海鵬成立研究組,希望破解這個人類群體進化史上的重大謎團。
“史前人口數量的變化,綜合反映了該時期氣候環境的變遷,所以通過群體遺傳學的研究方法進行回溯,能更深入了解現代人類的形成。”他解釋說。
已有化石記錄表明,最近100萬年是人類進化的關鍵時期,但人類群體歷史的研究多局限於最近的30萬-10萬年。雖然近年來古DNA測序技術迅猛發展,但由於炎熱條件不利於DNA的保存,無法從30萬年前非洲人類祖先化石中提取古DNA。
為準確估算百萬年前人類群體歷史,研究團隊創建了群體遺傳學和計算生物學新理論——FitCoal。遵循這一理論,研究團隊設定群體歷史模型並分析模擬產生的DNA多態數據,精準追溯人類祖先歷史的年限從距今10萬年向前延伸到了100萬年,甚至當數據充足,能精確追溯到每一天,置信區間高達95%。而且,輸入任何生物的一段DNA數據,FitCoal都能給出溯祖結果。
史前雖無文字記載群體數量,但有效群體大小會影響每個世代的溯祖率,即兩個譜系在上一世代來自同一祖先的概率。因此人類祖先曾在群體基因組中留下印記,反映當時的群體大小。群體歷史越久遠,留存至今的印記信號越微弱。
為準確解讀人類祖先留下來的印記信號,研究團隊遵循FitCoal理論進行數學推導,獲得了在任意群體模型下各突變類型(即突變頻譜)對應溯祖樹枝長期望值的解析解,並獲得精確的似然值,即在群體歷史條件下觀察到樣本突變頻譜的概率。因此,無須事先獲得群體歷史的先驗知識,FitCoal即可自動快速搜尋出極大似然值,從而估算群體歷史,對古人類群體進行“人口普查”。
從十萬人銳減至千餘人,人類祖先幾近滅絕
基於FitCoal,研究團隊進一步分析了來自千人基因組計劃和HGDP-CEPH基因組計劃(人類基因組多樣性計劃)產生的、共50個現代人類群體的基因組數據,首次發現在距今93.0萬年前,人類祖先由於早、中更新世過渡期的氣候劇烈變化,在短期內喪失了約98.7%的成員個體,個體數從近10萬急劇下降到1280。
“這段空缺一直持續了11.7萬年,此後人類祖先種群數量上升至27160。”李海鵬說,面對這一幾近滅絕的群體瓶頸,人類祖先一定發生了某些改變,最終適應了氣候變化, “此後再沒有發現類似的情況。”既往考古學研究顯示,人類約在79萬年前學會控制火,或許是這一劃時代的技能習得,使人類祖先絕地逢生。
此外,研究人員採用HGDP-CEPH數據集的兩個南部非洲群體作了進一步驗證,雖然樣本量僅為6個和8個個體,但FitCoal依然檢測到了遠古群體瓶頸。研究發現,這一嚴重的遠古群體瓶頸,恰好與非洲人類祖先化石的缺失環節、非洲直立人化石的消失、新的古人類物種的形成、兩條古人類2號染色體的融合階段相對應。
“這一遠古時期群體數量的衰減,降低了65.85%現代人群的遺傳多樣性,對人類生命和健康產生深遠的影響,很可能決定了現代人類許多關鍵表型的形成
業內專家表示,該成果的重大貢獻是提出了理論框架——基於基因變異頻譜的倒溯。美國南佛羅里達大學教授劉曉明點評稱,FitCoal是“目前為止最為準確的估計有效群體規模歷史的方法”。作為一種全新工具,FitCoal基於的是突變頻譜數據,具有數據形式適應性強、計算速度快等優點,有廣泛的應用前景。
在李海鵬看來,該成果將有諸多“溢出效應”。“這一成果可運用於動物、植物、微生物在內的多個物種的歷史生存狀況推溯,並且也有助於揭示腫瘤的演化、腦容量快速增長的分子機制以及現代人群對糖尿病的整體易感性。”李海鵬說。
“我們已鎖定一個可能與人類糖尿病易感性相關的基因,後續將進一步深入研究。 ”潘逸萱表示,如果在這方面有所突破,可能會尋找到一些新途徑,從人群總體上降低罹患糖尿病的風險。