研究發現乳房X射線影像AI可能會受病患年齡和種族的影響而產生誤報
研究顯示,乳房X 光攝影中的人工智慧可能會受患者年齡和種族的影響而產生誤報,凸顯了多樣化訓練資料的重要性。最近的一項研究分析了近5000 張FDA 批准的人工智慧演算法解讀的乳房篩檢照片,發現患者的種族和年齡等特徵會影響假陽性率。研究結果發表在今天(5 月21 日)出版的北美放射學會(RSNA)期刊《放射學》。
![Example-Mammogram-Assigned-False-Positive-Case-Score.jpg](https://i0.wp.com/static.cnbetacdn.com/article/2024/0521/e5ba82626089290.jpg?w=640&ssl=1)
例:一名59 歲的黑人患者乳房纖維腺體密度散在,乳房X 光檢查假陽性病例評分為96 分。 (A)左側頭尾切面和(B)內外側斜切面顯示外上象限中間深度(方框)有血管鈣化,人工智慧演算法將其單獨識別為可疑發現,並將單一病灶評分定為90 分。因此,乳房X 光檢查的總分為96 分。資料來源:北美放射學會(RSNA)
北卡羅來納州達勒姆杜克大學助理教授、醫學博士德里克-阮(Derek L. Nguyen)說:”人工智慧已成為放射科醫生提高乳房X光篩檢閱讀效率和準確性,同時減輕閱讀者倦怠感的一種資源。
阮博士介紹說,雖然初步數據表明,將人工智慧演算法應用於乳房X光篩檢檢查可能會提高放射科醫生對乳癌檢測的診斷性能,並縮短判讀時間,但人工智慧也有一些方面需要注意。
他說:「用於人工智慧演算法訓練的人口統計多樣化資料庫很少,FDA 也不要求多樣化的資料集進行驗證。」由於患者群體之間存在差異,因此研究人工智慧軟體能否適應不同年齡、種族和民族的患者,並使其表現達到相同水準非常重要。 “
![Example-Mammogram-Assigned-False-Positive-Risk-Score.jpg](https://i0.wp.com/static.cnbetacdn.com/article/2024/0521/508dead872c4328.jpg?w=640&ssl=1)
一名59 歲的西班牙裔患者,乳房密度不均,乳房X 光檢查偽陽性風險評分為1.0。圖中顯示了雙側重建的二維(A、B)頭尾切面和(C、D)內外側斜切面。此演算法預測患者會在1 年內罹患癌症,但該患者在接受乳房X 光檢查後2 年內並未罹患癌症或出現不典型增生。資料來源:北美放射學會(RSNA)
在這項回顧性研究中,研究人員確定了2016年至2019年期間在杜克大學醫學中心進行數位乳房斷層合成篩檢的陰性(無癌症證據)患者。所有患者在接受乳房X光篩檢後都接受了為期兩年的隨訪,沒有患者被確診為乳房惡性腫瘤。
研究人員從這一群體中隨機抽取了一個子集,該子集由4855 名患者組成(中位年齡54 歲),廣泛分佈在四個民族/種族群體中。此子集包括1,316 名(27%)白人患者、1,261 名(26%)黑人患者、1,351 名(28%)亞裔患者和927 名(19%)西班牙裔患者。
一種市售的人工智慧演算法對乳房X 光照片子集中的每次檢查進行解讀,產生病例評分(或惡性腫瘤的確定性)和風險評分(或一年後的惡性腫瘤風險)。
阮說:”我們的目標是評估人工智慧演算法在不同年齡、乳房密度類型和不同患者種族/族裔中的表現是否一致。”
鑑於研究中的所有乳房X 光檢查結果均為陰性,因此演算法標記為可疑的任何結果均被視為假陽性結果。與白人患者和年齡在51-60 歲之間的女性相比,黑人患者和年齡較大的患者(71-80 歲)更容易出現假陽性病例評分,而亞裔患者和年齡較小的患者( 41-50 歲)則較少出現假陽性病例評分。
「這項研究非常重要,因為它強調了醫療機構購買的任何人工智慧軟體在所有患者年齡、種族/族裔和乳房密度方面的表現可能不盡相同。展望未來,我認為人工智慧軟體的升級應專注於確保人口多樣性。
掌握本機構的人口統計學基線知識,並向供應商詢問其培訓數據的種族和年齡多樣性,將有助於你了解在臨床實踐中會面臨的限制。
編譯來源:ScitechDaily