機器學習預測新冠肺炎患者住院時間多中心研究首次報導
2020年3月3日,來自安康、麗水、鎮江、蘭州、臨夏5家指定醫院的團隊在預印版平台medRxiv發表未經同行評審的研究論文,首次報導了基於機器學習建立的CT影像組學模型對新冠肺炎患者住院時間的預測價值。
該研究團隊發表的研究論文題為“Machine learning-based CTradiomics model for predicting hospital stay in patients with pneumoniaassociated with SARS-CoV-2 infection: A multicenter study”。
iNature指出,住院時間是新型冠狀病毒疾病(COVID-19)臨床預後的重要指標之一。相關報導顯示,SARS-CoV-2感染患者的中位住院時間為10天。
目前,CT 影像學已成為COVID-19 肺炎重要的診斷和監測工具。疫情期間,由中國抗癌協會腫瘤人工智能專業委員和國家超級計算天津中心組成的項目團隊就曾搭建出CT 影像綜合分析AI 輔助系統,提高了篩查診斷能力。
研究團隊在蘭州、安康、麗水、鎮江、臨夏5 家新冠肺炎定點醫院,於2020 年1 月23 日到2 月8 日期間,招募了52 例實驗室確診的SARS-CoV-2 感染患者,收集了相關臨床資料,對其初始CT 圖像進行了研究。
到了2020 年2 月20 日,研究排除了未出院患者和首次CT 檢查無肺炎表現患者,最終以31 例治愈出院的患者為研究對象,共具有72 個病變段。
另外,研究團隊將10 天作為住院時長的二分類閾值——短期住院(≤10 天)和長期住院(>10 天)。由於樣本數目有限,研究團隊將其中4 個中心作為訓練隊列,另外一個中心作為驗證隊列。
針對訓練和相互驗證數據集中從肺炎病變中提取的特徵,研究團隊開發了基於邏輯回歸(Logistic Regression,LR)模型和回歸森林(Random Forest,RF)的干預CT 放射學模型。
圖片來源:medRxiv 所有者:medRxiv
最終結果顯示,基於6 個二級特徵的CT 放射組學模型對肺炎合併SARS-CoV-2 感染患者在短期住院和長期住院有較好的鑑別效果,LR 和RF 曲線下面積分別為0.97 (95 %CI 0.83-1.0) 和0.92 (95%CI 0.67-1.0)。
另外,LR 模型的靈敏度和特異度分別為1.0 和0.89,RF 模型在測試數據集上的靈敏度和特異度分別為0.75 和1.0,表現相似。
由此,基於機器學習的CT放射組學模型在預測肺炎合併SARS-CoV-2感染患者住院時間方面具有可行性和準確性。
參考資料:https://www.medrxiv.org/content/10.1101/2020.02.29.20029603v1