放射科醫師與機器的較量:在辨識胸部X光片肺部疾病能力上依然超越人工智慧
最近發表在《放射學》雜誌上的一項研究發現,放射科醫生比人工智慧工具更擅長從2000 多張胸部X 光片中識別或排除三種常見肺部疾病。根據《放射學》雜誌上的一項研究,放射科醫生在從胸部X 光片中準確檢測出三種常見肺部疾病方面超過了人工智慧。人工智慧工具雖然靈敏,但產生了更多的誤判,使其在自主診斷方面不太可靠,但在第二意見方面卻很有用。 北美放射學會(RSNA)期刊《放射學》9月26日發表的一項研究顯示,在對2000多張胸部X光片進行的研究中,放射科醫生在準確識別三種常見肺部疾病的存在與否方面優於人工智慧。放射成像的作用首席研究員、丹麥哥本哈根Herlev 和Gentofte 醫院放射科住院醫生兼博士研究員、醫學博士Louis L. Plesner 說:”胸透是一種常見的診斷工具,但要正確解讀檢查結果需要大量的培訓和經驗。”雖然市面上已有經FDA 批准的人工智慧工具來協助放射科醫生,但將基於深度學習的人工智慧工具用於放射診斷的臨床應用仍處於起步階段。Plesner 博士說:”雖然越來越多的人工智慧工具被批准用於放射科,但在實際臨床場景中進一步測試這些工具的需求尚未得到滿足。人工智慧工具可以協助放射科醫生解讀胸部X光片,但其實際診斷準確性仍不明確。”(A)71 歲男性患者因呼吸困難進展而接受檢查的後前位胸部X 光片顯示雙側纖維化(箭頭B)31 歲女性患者因咳嗽一個月而轉診接受放射檢查的後前位胸部X 光片顯示右心邊界有細微的氣隙不清晰(箭頭)。(C) 一名78 歲男性患者在置入中心靜脈導管後轉診的前胸X光片顯示右側皮膚皺褶(箭頭)。(D)為排除氣胸而轉診的一名78 歲男性患者的後前方胸部X 光片顯示右側頂部有一個非常細微的氣胸(箭頭)。(E)一名72 歲男性患者的後正位胸部X光片顯示肋膈角慢性變圓(箭頭),該患者無特殊原因轉診進行放射檢查。(F) 因懷疑充血和/或肺炎而轉診的76 歲女性患者的前胸X光片顯示左側胸腔有非常微小的積液(箭頭),所有三種能分析前胸X光片胸腔積液的人工智慧工具都漏診了。資料來源:北美放射學會 研究結果Plesner 博士和研究團隊比較了四種市售人工智慧工具和72 位放射科醫生在2020 年對丹麥四家醫院兩年內連續拍攝的2040 張成人胸部X 光片進行解讀時的表現。患者群體的中位年齡為72 歲。在胸部X 光片樣本中,669 張(32.8%)至少有一個目標發現。胸部X 光片針對三種常見發現進行了評估:氣室疾病(由肺炎或肺水腫等引起的胸部X 光片形態)、氣胸(肺部塌陷)和胸腔積液(肺部周圍積水)。人工智慧工具對氣道疾病的敏感度為72% 至91%,對氣胸的敏感度為63% 至90%,對胸腔積水的敏感度為62% 至95%。他說:”在檢測胸部X 光片上的氣腔疾病、氣胸和胸腔積液方面,人工智慧工具顯示出與放射科醫生相當的中高靈敏度。然而,與放射科醫生相比,它們產生了更多的假陽性結果(在不存在疾病的情況下預測出疾病),而且當出現多個發現和較小的目標時,它們的表現會下降。”預測值比較對於氣胸,人工智慧系統的陽性預測值–篩檢呈陽性的患者真正患病的機率–在56%到86%之間,而放射科醫師的預測值為96%。“人工智慧在識別氣胸疾病方面表現最差,陽性預測值在40% 到50% 之間,”Plesner 博士說。”在這疑難老年病患樣本中,人工智慧10次中有5到6次預測出了不存在的氣隙疾病。你不可能讓一個人工智慧系統以這樣的速度獨立運作”。放射科醫師的目標是在發現和排除疾病的能力之間取得平衡,既要避免重大疾病被忽視,又要避免過度診斷。”人工智慧系統在發現疾病方面似乎非常出色,但在確定沒有疾病方面卻不如放射科醫生,尤其是在胸部X光片比較複雜的情況下,”他說。”過多的假陽性診斷會導致不必要的影像、輻射暴露和成本增加”。大多數研究通常傾向於評估人工智慧確定單一疾病存在與否的能力,這比現實生活中病人往往患有多種疾病的情況要容易得多。在先前許多聲稱人工智慧優於放射科醫生的研究中,放射科醫生只查看了影像,而無法了解患者的臨床病史和先前的影像研究。在日常實踐中,放射科醫師對影像檢查的解釋是這三個數據點的綜合。研究人員推測,如果下一代人工智慧工具也能進行這種綜合,其功能可能會變得更強大,但目前還不存在這樣的系統。”我們的研究表明,在病人種類繁多的真實場景中,放射科醫生的表現普遍優於人工智慧,”他說。”雖然人工智慧系統能有效辨識正常的胸部X光片,但人工智慧不應自主進行診斷。”Plesner 博士指出,這些人工智慧工具可以透過對胸部X 光片進行二次觀察,增強放射科醫師對其診斷的信心。