AI發現了隱藏在”垃圾”DNA片段中的癌症驅動因素
加文醫學研究所(Garvan Institute of Medical Research)的研究表明,占我們基因組98%的非編碼DNA(以前被認為是”垃圾”)可能在癌症診斷和治療中起著至關重要的作用。
研究發現,這些區域的突變與12 種不同的癌症類型有關。這些突變發生在CTCF蛋白的結合位點上,而這些位點對於維持基因組的三維結構至關重要。這些位點的破壞可能會導致癌症的發生。研究結果表明,針對這些不同癌症的共同突變,有可能找到一種通用的癌症治療方法。
根據加文醫學研究所(Garvan Institute of Medical Research)的一項新研究,非編碼DNA–占我們基因組的98%,不包含製造蛋白質的指令–可能是新的癌症診斷和治療方法的關鍵。這些研究結果發表在《核酸研究》(Nucleic Acids Research)雜誌上,揭示了先前被忽視的基因組區域中的突變,這些突變可能導致至少12 種不同癌症的形成和發展,包括前列腺癌、乳腺癌和結腸直腸癌。
這項發現可能會帶來早期診斷和對多種癌症有效的新療法。
「非編碼DNA由於明顯缺乏功能,曾一度被視為’垃圾DNA’,該研究的共同通訊作者、加萬研究官阿曼達-庫裡(Amanda Khoury)博士說。”我們的研究發現,這些DNA區域的突變可能為癌症治療開闢一種全新的通用方法。 “
人類乳癌細胞(藍色)中可視化的DNA 損傷(綠色)。資料來源:加文研究所
研究人員重點研究了影響一種名為CTCF 的蛋白質結合位點的突變,有助於將DNA 長鏈折疊成特定形狀。在先前的研究中,他們發現這些結合位點能將DNA 的遙遠部分拉近,形成三維結構,以控制基因的開啟或關閉。
Khoury博士說:「我們已經確定了一個『持久』的CTCF結合位點子集,即它們就像基因組中的錨,存在於不同的細胞類型中。我們假設,如果這些錨出現問題,就會破壞基因組的正常三維組織,導致癌症。
為了驗證這一點,研究人員開發了一種名為CTCF-INSITE的新型複雜機器學習(AI)工具,它利用基因組和表觀基因組特徵來預測哪些CTCF位點有可能成為12種癌症類型中的持久性錨點。然後,他們評估了國際基因組聯盟資料庫(International Genome Consortium database)中這12種癌症類型患者的3000多份腫瘤樣本,發現這些持久性錨點富含突變。
阿曼達-庫裡(Amanda Khoury)博士和蘇珊-克拉克(Susan Clark)教授在澳洲雪梨的加文醫學研究所(Garvan Institute of Medical Research)。圖片來源:加文研究所
研究的第一作者陳文漢博士說:「利用我們的機器學習工具,我們確定了12 種不同癌症類型中的持久性CTCF 結合位點。值得注意的是,我們發現每個癌症樣本中都至少有一個持久性CTCF 結合位點發生了突變。
“這項研究證實,持續存在的CTCF 結合位點是癌症中的’突變熱點’。我們認為這些突變為癌細胞帶來了生存優勢,使它們能夠增殖和擴散,」Khoury 博士補充說。
這些發現可能對了解和治療多種類型的癌症產生廣泛影響。加文癌症表觀遺傳學實驗室主任、該研究的主要作者蘇珊-克拉克教授說:”大多數新的癌症治療方法都必須仔細地針對特定的突變,而這些突變在不同的腫瘤類型中並不總是常見的,但是由於這些CTCF錨在多種不同的癌症類型中都發生了突變,我們就有可能開發出對多種癌症都有效的方法。
研究人員目前正計劃利用CRISPR基因編輯技術進一步進行大規模實驗,研究這些錨突變是如何破壞三維基因組並可能促進癌症生長的。
克拉克教授說:「既然我們已經發現了我們認為是基因組的關鍵錨,並證明它們對維持基因組結構的平衡非常重要,那麼這些非編碼DNA突變會破壞癌細胞中的這種平衡也就說得通了–我們將在編輯這些突變時對這一假設進行檢驗。 。
“找到這些隱藏在大量數據中的線索,是人工智慧如何促進醫學研究的有力例證,」她說。 “這是癌症研究的一個全新領域,我們很高興能進一步探索它”。
編譯自/ ScitechDaily