機器學習模型分析6個數據點可提示危及生命的重症COVID-19
羅格斯大學的研究人員開發了一種機器學習模型PLABAC,用於預測住院患者的重症COVID-19 病例。該模型利用患者年齡和五項常規檢查的結果,旨在改善患者預後和醫院資源分配。PLABAC 經過不同患者群體的驗證,以其準確性和易用性而脫穎而出,未來計劃整合到醫療應用程式和電子健康記錄中。
羅格斯大學的研究人員開發了一種機器學習工具,旨在幫助醫院識別嚴重的COVID-19 病例。該工具利用患者年齡和五項常規測試的數據來預測冠狀病毒疾病的進展。
創造者相信,這種模式可以顯著改善對因COVID-19 住院的患者的護理,而這種疾病仍然是美國的一個主要原因。
改善病患預後及醫院資源分配
「準確的預測非常有價值,」羅伯特伍德約翰遜醫學院(RWJMS) 副教授、mBio 雜誌上這篇新論文的合著者Payal Parikh 說。「他們讓患者在健康狀況良好的情況下了解即將發生的情況,從而做出明智的治療選擇。 它們還讓醫院透過預測患者需求來有效地分配資源。 此外,透過更好的預測,我們可以在疾病過程的早期開始治療,從而帶來更好的患者護理結果。”
羅格斯大學團隊開始尋求利用機器學習軟體和969 名在大流行初期因病毒住院的患者的醫療記錄來建立COVID-19 預測模型。
從數據分析到實際應用
研究的主要作者、RWJMS 四年級學生戴維·納塔諾夫(David Natanov) 表示:「我們從每位患者身上獲取了一系列數據點,包括實驗室結果、人口統計數據、生命體徵、合併症等等。我們透過一系列不同的機器學習模型調整到略有不同的參數,並產生了一個初始的77 個變數模型。 模型表現良好,但沒有人有時間將77 個單獨的資料點輸入到任何內容中。”
納塔諾夫說,研究人員使用各種分析工具來確定與疾病相關的10 個最具預測性的變數。然後,它使用人工智慧以各種組合來觀察它們,直到找到由每個醫院收集的六個數據點(年齡和五種常見實驗室測試的結果)組成的兩個有效模型。
PLABAC 模型簡介
研究人員將他們的模型中最準確的模型稱為PLABAC,這是每個組成變數的第一個字母的縮寫:血小板計數、乳酸、年齡、血中尿素氮、天冬胺酸轉氨酶和C 反應蛋白。
為了確保PLABAC 預測所有因COVID-19 住院的患者的死亡率,而不僅僅是初始樣本中的969 人,研究人員成功地使用它來預測疫苗接種前住院的另外7901 名患者和第三組患者的結果接種後期間的1547 例。
接種疫苗後住院患者的強勁結果表明,PLABAC 可以預測感染第一組患者的原始病毒以外的COVID-19 變種患者的預後。
羅格斯大學團隊並不是第一個使用舊患者記錄創建COVID-19 進展模型的團隊,但其成員相信他們是第一個通過成功測試其模型預測第二(和第三)組結果的能力來驗證其模型的團隊的患者。
易於使用和未來集成
他們也相信,與他們見過的其他模型相比,他們的模型還有另一個關鍵優勢:易於使用。大多數醫院已經收集了有關COVID-19 患者的所有六個數據點。唯一的額外工作是將這六個變數輸入到公式中——研究團隊希望讓它變得更容易。
「接下來的工作計劃是與MDCalc對接,這是每個臨床醫生手機上都有的應用程序,用於查找資料並使用有用的公式,」納塔諾夫說。“我很想添加這個公式,這樣用戶只需輸入六個數字就可以得到預測。”
納塔諾夫表示,他希望與最大的電子健康記錄軟體製造商Epic 合作,將該模型添加到其不斷增長的預測工具清單中。
「沒有人必須輸入任何內容。系統會自動從實驗室結果中提取數字並進行計算,」他說。