深度學習10萬張乳房X光照片AI模型幫助篩查乳腺癌
乳房X光照相技術能夠降低乳腺癌死亡率是一個公認的事實。與替代篩查相關的假陽性高召回率加快了IBM、麻省理工學院計算機科學與人工智能實驗室等機構對人工智能驅動系統的開發。但它們並不完美,因為與更多最近的測試相比,大多數模型只進行過一次單一的篩選測試。
這一缺陷促使紐約大學數據科學中心和放射學系的一組研究人員提出了一個機器學習框架,即篩查先前檢查時生成的不同種類乳房X光照片,利用先前的檢查結果做出診斷。他們說,在初步測試中,它降低了基線(基線就是被用為對比模型表現參考點的簡單模型。基線幫助模型開發者量化模型在特定問題上的預期表現)的錯誤率,並在預測篩查人群的惡性腫瘤時,達到了0.8664的曲線下面積(在所有分類閾值下的性能指標,即預測的準確率)。
合著者寫道:“放射科醫生經常將目前的乳房X光照片與之前的照片進行比較,以便做出更明智的診斷。例如,如果一個可疑的區域隨著時間的推移變得越來越大或密度越來越大,放射科醫生就會更加確信它是惡性的。相反,如果一個可疑的區域沒有增長,那麼它可能是良性的。”
該團隊在紐約大學開源乳腺癌篩查數據集上訓練了一組機器學習模型,每組篩查中至少包含一張圖像,對應於乳房X光攝影篩查中常用的四種視圖(右顱尾側、左顱尾側、右中外側斜肌和左中外側斜肌)。他們使用了四種二元標籤來表示左乳或右乳有無良、惡性的發現,並且只考慮了包括患者在內的數據集的子集,而這些數據集之前的檢查數據都是可獲得的。
實驗所收集的數據庫中包含了來自43013名患者的127451份檢查,其中有2519份至少進行了一次活體組織切片檢查。
該團隊根據這些數據訓練了一系列機器學習模型,然後僅使用訓練數據集的一部分來比較它們的性能。他們注意到,與良性預測的基線相比,其效果並沒有明顯的改善,他們將其歸因於算法傾向於關注掃描區域的顯著變化。(而良性的改變並不明顯。)但他們發現,其中一個模型——AlignLocalCompare——對惡性腫瘤的發現表現出明顯的改善,預測腫瘤發生的可能性為0.97,而基線預測僅為0.73。