人工智能繪製的藍圖為預測靈長類乃至人類疾病提供了突破性進展
來自24個國家的科學家繪製了超過233種不同靈長類動物的DNA圖譜,使現有的基因數據增加了四倍多,這在世界範圍內尚屬首次,為人類的致病基因突變提供了關鍵的新見解。
“人類是靈長類動物,”主要作者、西班牙龐培法布拉大學教授湯姆-馬奎斯-博內說。”鑑於非人類靈長類動物的系統發育位置,對數百個非人類靈長類動物基因組的研究對人類進化研究非常有價值,可以更好地了解人類基因組和我們的奇異性的基礎,包括人類疾病的基礎,以及對它們未來的保護。”
在一項研究中,研究人員利用233種靈長類動物的藍圖為一種新的人工智能工具提供信息,該工具準確地識別和分離了人類基因組中導致疾病的遺傳變異。
高級作者、生物技術研究公司Illumina的人工智能副總裁Kyle Farh說:”由於它們與人類基因組的關係密切,非人類靈長類物種具有獨特的價值,因為它們可以讓我們了解人類疾病的遺傳基礎,而且它們本身也是如此。”
“我們發現,如果在靈長類動物的基因組中找不到一個’罕見’的突變,那麼它就非常可能導致人類疾病,”Farh說。”此外,其中一些罕見的突變本身就可以引起一些被認為是多基因的疾病。”
根據美國國家衛生研究院的數據,現在每年產生400億GB的基因組數據,這個數字只會增加。但是,如果沒有能夠廉價、快速地分析和解釋這些數據的工具,這些數據就沒什麼用。
PrimateAI-3D與ChatGPT不同,而是使用自然選擇系統進行學習,其特點是由233個物種的數百萬個良性基因變體組成的神經網絡。在研究中,它能夠在六個被測試的人類隊列中識別出致病的基因變體,並且在對來自英國生物庫的近50萬個人類基因組的研究中也能夠準確地提供遺傳疾病風險的個性化預測。
“將人工智能的最新進展應用於基因組學為Illumina在遺傳風險預測和藥物靶點發現方面提供了巨大的機會,通過解碼複雜的遺傳疾病,如糖尿病、心髒病和自身免疫性疾病的基礎,”Illumina的首席技術官Alex Aravanis說。
靈長類動物基因組計劃研究了所有16個靈長類家族的809只動物,是迄今為止最雄心勃勃和最全面的DNA數據庫,涵蓋了所有活著的靈長類物種中的近一半。
這些數據也給我們認為將我們與我們的祖先分開的工作帶來了麻煩。研究人員發現,許多物種與人類共享的DNA比以前認為的要多得多,將被認為是智人獨有的基因目錄減半。
“這些研究將比較基因組學帶到了新的高度,我們可以預測對人類生物學的理解和實際的臨床診斷問題的影響,”人類基因組測序中心的創始主任、貝勒大學分子和人類遺傳學的沃弗德-凱恩講座和教授理查德-吉布斯博士說。
貝勒大學人類基因組測序中心的首席調查員和副教授杰弗裡-羅傑斯補充說:”當我們調查非人類靈長類動物的基因組學時,我們不僅可以了解這些物種,這很重要也很及時,而且我們還可以將人類遺傳學置於其適當的比較背景中,這為人類健康和人類進化提供了新的見解。”
這項研究發表在《科學》雜誌的一個特刊上。