哈佛全新類ChatGPT癌症診斷AI登上Nature 準確率最高96%
能夠執行多種任務,識別19種癌症類型,預測患者生存率…哈佛醫學院研究人員提出CHIEF,一種多功能AI癌症診斷模型,表現出類似於ChatGPT的靈活性,遠超其他現有的癌症診斷模型。近日,來自哈佛醫學院等機構的科學家們開發了一種名為CHIEF(Clinical Histopathology Imaging Evaluation Foundation,臨床組織病理學成像評估基礎)的多功能AI癌症診斷模型,並於9月4日登上“ Nature」。
論文地址:https://www.nature.com/articles/s41586-024-07894-z
值得一提的是,儘管最近出現了其他用於醫學診斷的病理影像基礎AI模型,但CHIEF是第一個能夠預測患者預後並在多個國際患者群體中驗證的模型。
工作原理
目前,大多數AI癌症診斷系統通常被訓練來執行特定任務。例如,檢測癌症的存在,或分析腫瘤的基因特徵,通常僅適用於少數癌症類型。
相較之下,全新的CHIEF模型則具有類似ChatGPT的靈活性-不僅能夠執行多種任務,還能辨識不同癌症類型需要特別關注的區域。
透過讀取腫瘤組織的數位切片,它可以檢測癌細胞並根據影像中觀察到的細胞特徵分析腫瘤的基因特徵。
此外,還可以預測多種癌症類型的患者存活率,並精確定位腫瘤周圍組織的特徵,即腫瘤微環境。這些特徵與患者對手術、化療、放療和免疫治療等標準治療的反應有關。
更進一步的,CHIEF還具有產生新見解的潛力——它發現了先前未被認為與患者存活相關的特定腫瘤特徵。
研究團隊指出,這些發現進一步證明了AI可以幫助臨床醫生有效率且準確地評估癌症,包括識別可能對標準癌症療法反應不佳的患者。
論文主要作者,哈佛醫學院Blavatnik研究所生物醫學資訊學助理教授Kun-Hsing Yu
模型訓練與表現
首先,CHIEF在1500萬張未標記的圖像上進行訓練,這些圖像被分成多個模型可能需要特別關注的部分。
然後,CHIEF在6萬張全切片影像上進行了訓練,其中包括肺、乳房、前列腺、結腸、胃、食道、腎臟、腦、肝、甲狀腺、胰腺、子宮頸、子宮、卵巢、睪丸、皮膚、軟組織、腎上腺和膀胱等組織的全切片影像。
這種訓練方法,使得模型不僅關注影像的局部,也能夠結合整個影像,將某一局部的特定變化與整體連結起來。從而,CHIEF在進行癌症分析時能夠考慮更廣泛的背景訊息,更全面地解讀影像,而不是僅僅專注於某個特定區域。
訓練完成後,研究團隊在19,400多張全切片影像上測試了CHIEF的表現。這19400多張全切片影像來自全球24家醫院和病患群體中收集的32個獨立資料集。
整體上,CHIEF在以下任務中比其他最先進的AI方法高出36%:癌細胞檢測、腫瘤起源識別、預測患者結果、以及識別與患者治療反應相關的基因和DNA模式。
無論腫瘤細胞是透過切片或手術切除獲得,CHIEF的表現都同樣出色。無論使用何種技術對癌細胞樣本進行數位化處理,它的準確性也同樣高。
研究人員表示,這種適應性使CHIEF能夠在不同的臨床環境中使用,而目前大部分AI癌症診斷模型通常只能在透過特定技術取得的組織中表現良好。
CHIEF的4種應用
癌症檢測
CHIEF在癌症檢測中的準確率達到了近94%,測試涵蓋了15個資料集,其中包含11種癌症類型。
在另一個涵蓋5個活檢資料集的測試中,CHIEF達到了96%的準確率,其中包括食道、胃、結腸和前列腺在內的多種癌症類型檢測。
當研究人員用資料集之外的手術切除腫瘤切片來測試CHIEF時,模型的準確率超過了90%。
模型注意力得分的可視化顯示,CHIEF準確地識別了黑色素瘤、肺癌和腎癌的癌症區域
分析腫瘤的基因特徵
腫瘤的基因組成包含了未來腫瘤發展和最佳治療方案的關鍵線索。為了獲取這些信息,腫瘤學家通常會對腫瘤樣本進行DNA測序。
但由於將樣本送到專業的DNA定序實驗室需要一定的成本和時間,世界各地普遍沒有進行常規的詳細的基因組分析。即使在資源充足的地區,這個過程也可能需要數週時間。
不過,這是AI可以填補的空白。
研究人員稱,對於影像中特定的基因組異常,識別其細胞模式,可能提供快速且經濟的替代基因組定序的方案。
CHIEF在預測腫瘤的基因變異方面優於現有的AI方法。這種新的AI方法成功地識別了與癌症生長和抑制相關的多個重要基因特徵,並預測了腫瘤在各種標準癌症療法過程中的關鍵基因突變。
CHIEF也檢測到了特定的DNA模式,這些模式與結腸腫瘤對一種稱為免疫檢查點抑制的免疫療法的反應效果有關。
在觀察全組織影像時,CHIEF識別出54個常見突變癌症基因中的突變,整體準確率超過70%,優於目前用於基因組癌症預測的最先進AI方法。
研究團隊使用CHIEF模型來預測特定基因突變,這些突變與FDA(美國食品藥物管理局)批准的標靶治療方法的效果有關。研究涉及的18個基因分佈在人體的15個不同解剖部位。
CHIEF在多種癌症類型中都達到了高準確率。在檢測一種名為瀰漫性大B細胞淋巴瘤的血液癌症中的EZH2基因突變時,CHIEF達到了96%的準確率;在檢測甲狀腺癌中的BRAF基因突變時,CHIEF的準確率達到了89 %;在檢測頭頸部癌症的NTRK1基因突變時,準確率為91%。
CHIEF 在預測癌症類型的組織病理學圖像中的基因突變狀態方面取得了很高的成績
預測患者
存活率
基於初次診斷時所獲得的腫瘤組織病理影像,CHIEF能夠成功預測患者的存活期。
總體上,CHIEF預測高風險和低風險死亡率的能力在來自17家不同機構的患者樣本中得到了測試和驗證。
在所有研究的癌症類型和患者群體中,CHIEF能夠區分長期存活的患者和短期存活的患者。 CHIEF的表現比其他模型好8%。
在患有晚期癌症的患者中,CHIEF的表現比其他AI模型高出10%。
識別不同癌症類型需要特別關注的區域
該模型在影像上識別出與腫瘤侵襲性和患者存活率相關的明顯模式。
為了可視化特定的區域,CHIEF在影像上產生了熱圖。當人類病理學家分析這些由AI生成的熱點時,他們發現了一些反映癌細胞與周圍組織相互作用的有趣訊號。
模型注意力的可視化顯示了肺癌患者存活預測中的重要區域
其中一個特徵是,在長期存活者的腫瘤區域中,免疫細胞的數量比短期生存者更多。 Yu指出,這項發現有其合理性,因為更多的免疫細胞可能表明免疫系統已被活化來攻擊腫瘤。
在觀察短期生存者的腫瘤時,CHIEF辨識了一些需要關注的區域。這些區域的特徵包括各種細胞成分的異常大小比例、細胞核上較多的非典型特徵、細胞之間較弱的連接,以及腫瘤周圍區域中較少的結締組織。
這些腫瘤周圍還有更多的死亡細胞。例如,在乳房腫瘤中,CHIEF指出組織內的壞死(或細胞死亡)是一個需要關注的區域。另一方面,存活率較高的乳癌患者腫瘤周圍,更有可能維持類似健康組織的細胞結構。
研究團隊指出,與存活率相關的視覺特徵和需要關注的區域因癌症類型而異。
參考資料:
https://hms.harvard.edu/news/new-artificial-intelligence-tool-cancer