研究人員通過人工智能自動咳嗽分析檢測COVID-19
據外媒報導,COVID-19危機已經考驗了全世界的醫療系統。獲得針對COVID-19的疫苗已使情況日趨穩定。然而,人們不得不繼續進行大規模人群新冠病毒核酸檢測篩查,以發現陽性病例,從而打破可能的病毒傳播鏈。因此,科學家必須研究新的技術,以減少診斷檢測的時間和成本,從而以方便、有效和經濟的方式大規模地進行檢測。在Interspeech 2021國際大會的框架內,一個研究小組向利用聲學診斷COVID-19(DiCOVA)挑戰賽的咳嗽聲軌提交了該系統。與他們的貢獻有關的文章已被接受加入Interspeech科學計劃。
這項研究由UPF視聽系統工程校友、奧格斯堡大學(德國)研究員Adrià Mallol和Helena Cuesta領導,Emilia Gómez(歐盟委員會聯合研究中心)參與,他們都是UPF信息和通信技術系(DTIC)音樂技術研究小組(MTG)的成員,以及奧格斯堡大學和倫敦帝國學院(英國)的研究員Björn Schuller。
以前基於人工智能的系統已被證明在檢測咳嗽和打噴嚏以及識別呼吸道異常方面是有效的。人工智能還被用於精神健康領域,以識別抑鬱症或創傷後應激障礙的患者。繼數字健康方面的進展之後。“受這些研究的啟發,並基於COVID-19引起的呼吸系統疾病,我們為自己設定了一個挑戰,即調查人工智能技術是否能夠通過自動咳嗽分析來檢測與該病毒有關的疾病,”研究小組的成員Helena Cuesta解釋說。
咳嗽信號在COVID-19檢測呈陽性的患者中有所改變
在這篇論文中,作者研究了兩種不同的神經網絡架構,但有一個共同的結構:第一個區塊處理輸入的頻譜圖並提取一組嵌入式特徵,第二個區塊根據這些特徵是對應於COVID-19檢測陽性的病人還是健康病人進行分類。
“我們的模型使用頻譜圖,即音頻信號的時間頻率表示作為輸入。”
第一步是對輸入數據進行預處理。一般來說,數據庫的錄音包含各種咳嗽,由沉默分開(我們咳嗽時的典型模式)。“為了只保留錄音中包含相關信息的部分,即咳嗽,我們使用基於信號能量的聲音活動檢測器(SAD),” Cuesta解釋說。在過濾了這些數據後,下一步是提取特徵並隨後對其進行分割。“我們的模型使用頻譜圖,即音頻信號的時頻表示法作為輸入。”她補充說:“首先,我們計算數據庫中每個錄音的頻譜圖,然後將其分割成每個一秒鐘的片段。”
患者的性別很重要
該項目一個有趣的貢獻是研究不同版本的神經網絡,以調查患者的性別是否是分析咳嗽時的一個考慮因素。“直覺上,當我們接觸這項工作時,我們的一個假設是,男性和女性的咳嗽應該有不同的特徵,因為他們的聲道在大小和形狀上有所不同,”作者評論說。
從頻譜的角度來看,男性和女性產生的咳嗽不一定相等
從他們的工作所進行的實驗來看,最顯著的一個方面是,在作者評估的大多數情況下,包含患者性別信息的模型在預測中獲得了更好的結果,這證實了一個假設,即從頻譜的角度來看,男性產生的咳嗽和女性產生的咳嗽不一定相等。
咳嗽音軌- DiCOVA挑戰賽
DiCOVA挑戰賽的組織者為參賽者提供了一個數據庫(Coswara數據集),其中包含1040段1至15秒的人們咳嗽的音頻記錄。與錄音一起,這個數據庫提供了與每個錄音相關的一系列元數據:COVID-19的陽性/陰性,個人的性別和國籍。“基於這些數據,我們已經開發並評估了兩個不同的神經網絡,利用一秒鐘的音頻,預測COVID-19的陽性或陰性,”作者指出。
儘管這項工作只是通過自動咳嗽分析檢測COVID-19的第一種方法,但作者提出的實驗提供了一些線索,可以在這項研究的下一步中進行跟踪。我們仍需了解咳嗽信號在COVID-19陽性患者中是如何改變的。因此,可以提取特徵並設計特定的神經網絡以提高模型的質量。