生物學家建構了迄今為止最全面的鳥類族譜圖時間橫跨9300萬年
一個全球研究小組建構了迄今為止最全面、最廣泛的鳥類家系圖,詳細描述了9,300 萬年來363 種鳥類之間的演化連結。該圖代表了所有鳥類家族的92%。這項進展在很大程度上得益於加州大學聖地牙哥分校工程師開發的尖端運算方法,以及該校聖地牙哥超級電腦中心最先進的超級運算資源。
這些技術使研究人員能夠高精度、高速度地分析大量基因組數據,為建立有史以來最全面的鳥類家譜奠定了基礎。
4月1日發表在《自然》(Nature)和《美國國家科學院院刊》(PNAS)上的兩篇互補性論文詳細介紹了這項進展。 《自然》雜誌報導的更新家系揭示了6600萬年前恐龍滅絕後鳥類進化史的模式。
發表在《自然》雜誌上的最新鳥類家譜,勾勒出363 種鳥類之間9,300 萬年的進化關係。圖片來源:Jon Fjeldså(繪圖)與Josefin Stiller
研究人員觀察到,早期鳥類的有效族群數量、替代率和相對腦容量都急劇增加,這為我們揭示這一關鍵事件之後推動鳥類多樣化的適應機制提供了新的線索。在發表於《美國國家科學院院刊》(PNAS)的相關論文中,研究人員仔細研究了新家譜的一個分支,發現火烈鳥和鴿子的親緣關係比之前的全基因組分析所顯示的更遠。
這項工作是由哥本哈根大學、浙江大學和加州大學聖地亞哥分校領導的多機構合作項目”鳥類萬基因組(B10K)項目”的一部分,該項目旨在為約10500種現存鳥類生成基因組序列草案。
“我們的目標是重建所有鳥類的整個進化史,”加州大學聖地亞哥分校雅各布斯工程學院電子與計算機工程教授西亞瓦什-米拉拉布說,他是《自然》論文的共同資深作者,也是《美國科學院院報》論文的第一作者和共同通訊作者。
這些研究的核心是一套名為”ASTRAL”的演算法,米拉拉布實驗室開發了這套演算法,以前所未有的可擴展性、準確性和速度推斷演化關係。透過利用這些演算法的強大功能,研究小組整合了來自6 萬多個基因組區域的基因組數據,為他們的分析提供了強大的統計基礎。
研究人員隨後研究了整個基因組中各個片段的演化歷史。在此基礎上,他們拼湊出了一棵馬賽克基因樹,然後將其編入一棵綜合物種樹。這種細緻入微的方法使研究人員能夠建構一個新的、經過改進的鳥類家系,即使在歷史不確定的情況下,也能非常精確和詳細地描述複雜的分支事件。
米拉拉布說:”我們發現,我們在分析中加入數萬個基因的方法實際上是解決鳥類物種之間進化關係的必要條件。需要所有這些基因組數據,才能以很高的置信度還原6500萬-6700萬年前的這段特定時期發生了什麼事”。
在發表於《美國國家科學院院刊》(PNAS)上的這項研究中,研究人員仔細研究了更新的鳥類家譜中的一個分支,發現包括火烈鳥和鴿子在內的鳥類群體的親緣關係比以前的全基因組分析所顯示的要遠,並將這一結果歸因於第4 號染色體上的一個不尋常區域。圖片來源:Ed Braun(繪圖)、Daniel J. Field(鳥類圖片)和Siavash Miarab
該團隊之所以能夠在海量資料集上進行這些分析,是因為米拉拉布實驗室設計的運算方法能夠在功能強大的GPU 機器上運作。他們在加州大學聖地牙哥分校聖地牙哥超級電腦的Expanse超級電腦上進行了計算。
米拉拉布說:”我們很幸運能夠使用如此高端的超級電腦。如果沒有Expanse,我們就無法在合理的時間內對如此龐大的資料集進行運行和重新運行分析。”
研究人員也研究了不同基因組取樣方法對樹的準確性的影響。他們發現,兩種策略–對每個物種的許多基因進行定序,以及對許多物種進行定序–結合在一起,對重建這段演化史非常重要。
哥本哈根大學生物學教授、《自然》論文第一作者約瑟芬-斯蒂勒(Josefin Stiller)說:”因為混合使用了這兩種策略,所以我們可以測試哪種方法對系統發育重建的影響更大,從每種生物體中採樣許多基因序列比從更廣泛的物種中採樣更重要,儘管後一種方法有助於我們確定不同群體進化的時間。
借助先進的計算方法,研究人員還揭示了他們在先前的研究中發現的不尋常之處:鳥類基因組中一條染色體的特定部分數百萬年來保持不變,沒有出現預期的基因重組模式。
這個反常現象最初導致研究人員錯誤地把火烈鳥和鴿子歸為進化上的表親,因為根據這段未變的DNA,它們似乎關係密切。這是因為他們先前的分析是基於48種鳥類的基因組。但透過使用363個物種的基因組重複分析,他們發現了一個更準確的家族樹,它將鴿子與紅鶴的關係進一步拉近。此外,透過使用由洛克菲勒大學神經生物學教授 Erich Jarvis(Erich Jarvis)領導的脊椎動物基因組計畫(Vertebrate Genome Project,VGP)提供的六個高品質基因組,米拉布及其同事能夠發現並推測出這種令人驚訝的模式。
佛羅裡達大學生物學教授、《美國科學院院刊》(PNAS)論文共同通訊作者愛德華-布勞恩(Edward Braun)說:”令人驚訝的是,這段被抑制的重組時期可能會誤導分析。正因為它可能會誤導分析,所以在未來的6000多萬年後,它實際上是可以被檢測到的。
這項工作的影響遠遠超出了對鳥類演化史的研究。米拉拉布實驗室首創的計算方法已成為重建其他各種動物進化樹的標準工具之一。
下一步,研究小組將繼續努力建構鳥類演化的完整圖像。生物學家們正在對更多鳥類物種的基因組進行定序,希望將家譜擴展到數千個鳥屬。同時,米拉拉布領導的計算科學家們正在改進他們的演算法,以適應更大的數據集,確保在未來的研究中能夠高速、準確地進行分析。
編譯來源:ScitechDaily