全球最大人類基因組序列對科學家開放
世界上最大、最完整的人類基因組資料庫剛剛上線。英國生物銀行,一個有關健康、基因組和其他生物數據的資訊資源庫,於11月30日發布了50萬名英國志願者的全基因組序列。世界各地的研究人員都可以申請訪問這些缺乏可識別細節的數據,並利用它們來探索健康和疾病的遺傳基礎。
英國生物銀行執行長Rory Collins在新聞發布會上表示:“當科學家想知道從生活方式、環境、基因到疾病的途徑是什麼時,他們不會去谷歌了,而是去英國生物銀行。”
2021年,英國生物銀行曾公開20萬名英國志願者的全基因組數據,供全世界科學家研究使用。這項耗資2億英鎊的研究由生物醫學研究基金惠康基金會、英國政府和幾家製藥公司資助,作為回報,這些公司在數據廣泛發布前9個月便獲得了數據。
先前,英國生物銀行公佈的遺傳訊息包括整個「外顯子組」——每個外顯子組占基因組的2%,負責編碼蛋白質,以及分佈在基因組中的85萬個常見的單鹼基DNA變異。後者的資訊為將健康和基因聯繫起來的全基因組關聯研究(GWAS)提供了動力。
但是,當研究人員尋找遺傳與疾病或其他性狀之間的關聯時,大多數「位點」出現在基因組的非編碼區域,這些區域在外顯子組序列中缺失,並且在現有的全基因組數據中僅以低解析度覆蓋。英國埃克塞特大學人類遺傳學家Michael Weedon說,全基因組還允許研究人員發現非常罕見的突變,這些突變往往比全基因組數據中包含的常見變異對某個性狀的影響更大。「我們希望罕見的變異能讓我們對生物學有更多的了解」。
事實已經證明了這一點。在11月20日發布的預印本文章中,Weedon團隊挖掘了英國生物銀行公開的首批20萬個完整基因組數據,並發現了29種罕見的DNA變異,這些變異與高達7cm的身高差異有關,並且在先前的基因研究中從未被發現。
Weedon表示,最終,研究人員將需要50萬多個完整基因組來全面繪製罕見基因變異與健康之間的關係,這是獲得數百萬個樣本的良好開端。
一項由美國政府資助的名為「我們所有人」的研究,計劃最終公佈100萬或更多美國人的全基因組和健康數據。先前,這項工作已經公佈了25萬個基因組,但直到8月才開始接受非美國研究人員的數據研究申請。研究人員表示,像「我們所有人」這樣的資料庫也將有助於確認與英國生物銀行相關數據發現的關聯。
根據英國生物銀行先前公開的20萬個基因組數據了解到的情況,芬蘭赫爾辛基大學統計遺傳學家Andrea Ganna還不相信這些數據能帶來多大的回報。許多由全基因組研究發現的非編碼變異與已透過GWAS發現的突變非常接近。
Ganna說,儘管如此,完整的基因組序列可能會幫助研究人員更準確地繪製出疾病與結構變異之間的聯繫,例如缺失、多餘或翻轉的DNA片段。
Collins認為,英國生物銀行已經發表了9,000多篇論文,最新發表論文的真正影響在一段時間內可能還不清楚。“我想,我們會驚訝地發現,有很多東西是我們甚至沒有想到的。”