揭示隱藏的基因組:可能對人類健康至關重要的未知DNA序列被發現
來自杜克-新加坡國立大學醫學院的研究人員和他們的合作者在人類基因組中發現了數千個以前未知的DNA序列,這些序列為微蛋白和肽編碼,可能對人類健康和疾病至關重要。
計算生物學家Sonia Chothani博士解釋說:“我們對基因組中已知的2%的蛋白質編碼的了解,大部分來自於尋找長鏈的蛋白質編碼核苷酸序列,或長的開放閱讀框。然而,最近,科學家們發現了小型開放閱讀框(smORFs),它們也可以從RNA翻譯成小肽,在DNA修復、肌肉形成和基因調控中發揮作用。”
科學家們一直在尋求識別smORFs及其編碼的小肽,因為smORFs的中斷會導致疾病。然而,目前可用的技術相當有限。
Chothani博士補充說:“目前的大部分數據集並沒有提供足夠詳細的信息來識別RNA中的smORFs。大多數還來自於對永生人類細胞的分析,這些細胞被繁殖–有時是幾十年,以研究細胞的生理學、功能和疾病。然而,這些細胞係並不總是人類生理學的準確代表。”
Chothani和來自新加坡、德國、英國和澳大利亞的研究人員在最近發表在《分子細胞》上的一項研究中介紹了他們為解決這些挑戰而創建的方法。他們搜索了現有的核醣體分析數據集,尋找具有周期性三鹼基部分的短鏈RNA,這些部分覆蓋了RNA長度的60%以上。然後他們進行了自己的RNA測序和核醣體分析,建立了一個由六種細胞和五種組織組成的綜合數據集,這些細胞和組織來自數百名患者。
對這些數據的分析確定了近8000個smORFs。有趣的是,它們對所發現的組織具有高度的特異性,這意味著這些smORFs可能在其環境中執行一種特定的功能。研究小組還確定了由其中一些smORFs編碼的603種微蛋白。
來自CVMD項目的該研究的高級作者Owen Rackham副教授說:“基因組中到處都是smORFs。我們的人類smORFs的全面和空間分辨率地圖突出了基因組中被忽視的功能成分,指出了健康和疾病中的新角色,並為科學界提供了一個資源,作為加速發現的平台。”
新加坡國立大學研究部高級副院長Patrick Casey教授說:“隨著醫療系統的發展,不僅要治療疾病,還要預防疾病,確定疾病研究和藥物開發的潛在新目標可以為新的解決方案開闢途徑。Chothani博士和她的團隊的這項研究,作為科學界的資源發表,為該領域帶來了重要的見解。”