基於人類聲音數據庫的AI工具最終可以診斷出嚴重疾病
研究人員正在建立一個人類聲音的數據庫,他們將用來開發基於人工智能的工具,最終可以診斷出嚴重的疾病。他們的目標是從阿爾茨海默氏症到癌症。週二美國國立衛生研究院宣布資助相關項目,把人的聲音變成可以作為疾病的生物標誌物,就像血液或溫度一樣。
語音數據的美妙之處在於,它可能是你能從人們身上收集到的最便宜的數據類型之一。這是一種非常容易獲得的信息,你可以從任何病人那裡獲得。過去幾年的研究已經探索了語音幫助診斷疾病的潛力,但大多數都是小規模和孤立的,也沒有任何大型的語音數據數據庫,而且這是一個新的研究領域,研究人員還沒有找出圍繞如何收集語音信息進行研究的最佳做法,現在這個項目將建立如何收集數據的標準。
該項目是通過美國國立衛生研究院的Bridge2AI項目資助的,該項目支持建立道德的、嚴格的和可訪問的數據集,可用於開發AI工具。該項目將持續四年,在此期間可獲得高達1400萬美元的資金。該研究團隊將首先建立一個應用程序,從患有聲帶麻痺、阿爾茨海默病、帕金森病、抑鬱症、肺炎和自閉症等疾病的參與者那裡收集語音數據。所有的語音收集將由臨床醫生監督。例如,患有帕金森病的人–他們的聲音可能更低,他們說話的方式也更慢,他們將被要求說出聲音,閱讀句子,並通過該應用程序閱讀全文。
然後,他們將使用這些數據集來建立可以檢測各種情況的人工智能模型。研究團隊正在與醫療人工智能公司Owkin合作,在該項目中建立和訓練人工智能模型。Owkin的框架讓病人數據留在收集數據的醫療中心,該模型在每個數據集上單獨學習,然後將這些訓練的結果返回到一個中心位置,在那裡將它們合併起來。然後,更新的綜合模型被送回每個地方,這個過程再次開始。
這為語音數據提供了額外的隱私保護,它的獨特之處在於它可以很容易地與它的來源者聯繫起來。人們的聲音很容易被識別,即使他們的名字被刪除。一個生物倫理學家團隊正在為該項目工作,研究語音數據庫和基於語音的診斷的倫理和法律影響。Bensoussan說,他們將思考,例如,聲音是否受到《健康保險可攜性和責任法案》(或HIPAA)的保護,以及病人是否擁有自己的聲音數據。
醫學研究人員並不是唯一對使用語音診斷疾病感興趣的群體,製造語音助手的大型科技公司也是如此。亞馬遜擁有專利,可以利用Alexa來找出人們是否有情緒問題,如抑鬱症,或身體問題,如喉嚨痛。理論上,如果某人的聲音顯示出阿爾茨海默氏症等疾病的跡象,被動的家庭語音助手可以標記出這種情況。這將引起另一層倫理和法律問題,專家們已經開始思考這個問題。