科學家用遺傳數據訓練人工智能預測病毒感染患者病情發展
加州大學聖地亞哥分校醫學院的研究人員使用一種人工智能(AI)算法篩選了數千兆字節的基因表達數據,確定在感染期間哪些基因是”開啟”或”關閉”的,以尋找過去病毒大流行感染患者的共同模式,包括SARS、MERS和豬流感。
2021年6月11日發表在《eBiomedicine》上的這項研究指出了兩個明顯的特徵。其一,一組166個基因,揭示了人類免疫系統如何對病毒感染做出反應。第二組是20個簽名基因,預測了病人疾病的嚴重程度。例如,是否需要住院或使用機械呼吸機。該算法的效用通過使用從已故COVID-19患者屍檢中收集的肺部組織和感染的動物模型得到驗證。用於測試和訓練算法的數據來自公開的病人基因表達數據。每次有一組來自COVID-19患者的新數據可用時,該團隊就在他們的模型中進行測試。他們每次都看到相同的標誌性基因表達模式。
在病毒感染期間,免疫系統向血液中釋放稱為細胞因子的小蛋白質。這些蛋白質引導免疫細胞到達感染部位,幫助擺脫感染。但有時,身體會釋放過多的細胞因子,形成一個失控的免疫系統,攻擊自己的健康組織。這種被稱為”細胞因子風暴”的錯誤被認為是一些病毒感染的病人,包括一些患有普通流感的病人屈服於感染,而其他人則沒有的原因之一。但是,致命的細胞因子風暴的性質、程度和來源,誰的風險最大,以及如何最好地治療它,長期以來一直不清楚。
這些與病毒大流行相關的特徵告訴我們一個人的免疫系統對病毒感染的反應,以及它可能變得多麼嚴重,這給我們提供了一個關於這次和未來大流行的地圖。通過簡單的抽血,與大流行性病毒感染相關的基因表達模式可以為臨床醫生提供一張地圖,幫助定義患者的免疫反應,測量疾病的嚴重程度,預測結果,並測試治療方法。