關於癌症全基因組,我們有了全新的認識
今日,最新一期《自然》雜誌如約上線,而登上封面的“癌症全基因組”則是本期的主題:在本期《自然》雜誌上,一共發表了6篇相關的論文。而在Nature Genetics、Nature Biotechnology、以及Nature Communications等子刊上,也有系列論文發表。點擊文末“閱讀原文/Read More”,即可訪問《自然》這一專題下的所有文章列表。
那麼,是什麼樣的研究項目引起瞭如此的重視呢?在今天的這篇文章裡,我們來一起了解下其中的信息。具體來看,主導這些研究的是“泛癌症全基因組分析合作項目”(Pan-Cancer Analysis of Whole Genomes Consortium),而“全基因組”是其中的關鍵詞。過去,很多研究都在尋找哪些編碼蛋白質的基因在突變後會導致癌症。但事實上,編碼蛋白質的基因序列,僅為人類基因組的約2%。在剩下的98%中有哪些變異可能與癌症有關,我們尚不是非常了解。而這正是“全基因組分析”的意義所在。
在這個合作項目的主導下,來自全球四個大洲744個組織的科研人員們對2658份癌症樣本做了全基因組測序工作,涵蓋了38種不同的癌症類型。此外,來自同一名個體的非癌變樣本也被用於對照。從獲取樣本、保護患者隱私、獲取測序數據、分析測序數據等一系列流程來看,這一研究的工作量極為龐大。而這些努力,也最終帶來了可喜的回報。對於癌症全基因組,我們有了新的認識。
平均來看,每一個腫瘤基因組樣本里,大約有4到5個驅動癌症發展的突變,這會給這些癌細胞帶來生存上的選擇性優勢。《自然》的一篇總結性文章裡也提到,研究中使用的腫瘤樣本里,很多出現了複雜的DNA重排(17.8%為chromoplexy,22.3%為chromothripsis,這兩個單詞的解釋請見下圖)。相比之下,只有5%的樣本沒有查出驅動性的突變。
▲Chromoplexy與chromothripsis的形象化解釋(圖片來源:參考資料[8])
第二篇文章裡,研究人員們則嘗試從非編碼DNA裡尋找癌症的驅動因素。研究發現了一些全新的癌症驅動突變,譬如抑癌基因TP53的一段非編碼區裡,反復出現了一種突變;而編碼端粒酶的基因TERT的非編碼區,也有會導致其過度表達的突變。這或許會促進癌細胞異常分裂。
第三和第四篇文章側重講的是一些具有特徵性的基因組變異。這是啥意思呢?原來當DNA修復出現錯誤,或是接觸到環境裡的誘變劑時,都會在DNA裡留下一些具有特徵性的變化,但這些變化並不好找。研究人員們在大量數據的支持下,找到了97個類似的特徵性變化,極大地拓展了我們的認知。
第五篇論文專注於癌細胞的演化。通過比較不同細胞亞群裡的突變,我們可以倒推出這些突變出現的先後順序。分析發現在癌症早期,最常出現的是驅動型突變。這甚至可以在診斷的數年前出現,因此可能對癌症早期診斷或是生物標誌物的開發有著意義。而隨著時間的推移,環境造成的影響會越來越小,DNA修復缺陷造成的影響則會越來越大。
最後一篇論文裡,研究人員們分析了1188個轉錄組的數據,發現拷貝數變異仍然是癌細胞中驅動基因表達變化的主要因素,但數百個單核苷酸突變也會影響到周圍的基因表達。此外,癌細胞裡的一些突變還會引起轉錄信息的變化,如產生新的蛋白編碼序列等。
數千位科學家們合力帶來的這些突破,讓我們對癌症基因組有了全新的認識。《自然》同期的一篇報導也指出,目前我們還比較缺乏臨床上與患者的治療和預後相關的數據。這些數據能幫助我們更好地理解這些基因組的信息和癌症治療之間的關聯。