微軟正與印度理工學院合作開髮用於抑制新冠病毒傳播的AI建模工具
微軟、印度理工學院和TCS Research(Tata Consul tancy Services 的研發部門)的研究人員共同撰寫的一篇預印論文描述了一個人工智能框架,旨在幫助城市和地區根據COVID-19 作出關於鎖定、關閉和物理距離的政策決策。
他們聲稱,由於它會自動學習政策作為疾病參數的函數,如傳染性、妊娠期、症狀持續時間、死亡概率、人口密度和運動傾向,因此,優於迄今使用的其他建模工具。
並表示這個框架可能對近200 個有冠狀病毒病例的國家的組織和政府有用。包括新加坡和台灣在內的亞洲國家已經證明,遏制戰略,如接觸追踪,或識別可能與感染者接觸的人的過程,可以有效地緩解COVID-19 的傳播。
合著者首先生成了一個圖網絡-一個包含一些對相關的對象的模型,使得對像對應於頂點,每對頂點被稱為邊緣-有100 個節點和1000 個個體。每個節點都代表一個城市或一個包含一定數量個體的區域,節點對之間連接的強度與節點之間的種群的乘積成正比,與它們之間距離的平方根成反比。
接下來,研究人員模擬了COVID-19 可用的最佳疾病參數:潛伏期為5-10 天,感染期為7-14 天,80%的可能性顯示可見症狀,2% 的死亡率,以及與易感人群接觸的感染者100% 的傳播概率,並進行了多次模擬,以獲得可靠的統計數據。
在整個研究過程中,研究人員假設一個開放節點允許人們往返於網絡中的其他開放節點。表現出症狀的人不允許前往其他節點,但無症狀和暴露的人可以這樣做。(當一個節點被鎖定時,所有進出該節點的旅行都被阻塞) 此外,他們還解釋了一個事實,即雖然有症狀的人在節點內被隔離,但少數人打破了檢疫,並在節點內流通。
研究人員還制定了幾個基線鎖定策略,其中他們假設每個節點都可以選擇每週鎖定或打開一次。然後,他們定義了一組策略,如果該節點中症狀人群的比例超過了5% 、10% 、20% 、50% 或超過100% 的預定義閾值,則鎖定任何給定節點。
最後,該團隊訓練了一種深度Q 網絡強化學習算法(一種通過獎勵激勵軟件代理的算法),該算法每週通過對疾病傳播的一些模擬,做出每節點二進制決策-“開放”或“鎖定”。為了讓該算法確定鎖定的最佳策略,他們量化了模擬每個結果的成本:鎖定的每一天和每個感染者的權重為1.0 ;每次死亡的權重為2.5;獎勵被定義為這些成本的負值,以便更高的獎勵對應於較低的成本。
在實驗中,在75 次模擬過程中,模擬持續52 週(364天),研究人員確定,5% 至10% 的鎖定政策經歷了較低的感染高峰。可以預見的是,該政策對導致同一節點內症狀人群和總體人口比例增加的決定持謹慎態度,因此,一旦感染開始擴散,它就會提前鎖定較大的節點,一旦感染開始在節點內擴散,外部感染的可能性就會更高的節點。
不過,需要注意的是,研究中的人工智能模型沒有考慮人口規模和地理,他們沒有使用真實的數據進行網絡模型。但他們說,更深入的分析正在進行中,他們將繼續添加更詳細的描述和文獻綜述的階段。
除了這項研究,各個團隊正在開發人工智能係統來跟踪COVID-19 的傳播。例如,卡內基梅隆大學的研究人員正在重新訓練一種預測季節性流感的算法,而柏林的羅伯特·科赫研究所使用了一種考慮到政府遏制措施的模型,如封鎖、隔離和社會隔離處方,以表明遏制措施可以成功地減少擴散。