“刷臉”窺見遺傳病:深度學習算法助疾病診斷
圖片來源:FDNA
■本報記者唐鳳
Gripp曾閱讀過描述Wiedemann-Steiner綜合徵患兒牙齒過早生長的病例報告。該疾病是由KMT2A基因突變引起的一種極為罕見的疾病。但Gripp並不確定。
於是,Gripp將這個女孩的照片上傳到一個智能手機應用中,Wiedemann-Steiner綜合徵出現在該軟件的提示中。
Gripp後來通過有針對性的DNA測試確定了女孩的病情。Gripp表示,人工智能方法幫助她縮小了疾病的潛在範圍,並節省了昂貴的多基因面板測試的成本。
近日,研究人員在《自然—醫學》上撰文描述了這種診斷輔助手段(一個叫做Face2Gene智能手機應用)的技術特點。
它依靠機器學習算法和類腦神經網絡對先天性和神經發育障礙患者照片中的面部特徵進行分類。利用從圖片中推斷出的“經驗”,對可能的診斷進行定位,並提供可能的選項列表。
該研究負責人、馬薩諸塞州波士頓數字健康公司FDNA首席技術官Yaron Gurovich告訴《中國科學報》,以標準化方式描述顯型能力的增強,為未來的研究和應用,以及識別新的遺傳綜合徵打開了大門。“它展示瞭如何將先進的算法,比如深度學習,應用到一個具有挑戰性的領域。”
看“臉”識病
目前,人工智能蓬勃發展,甚至能“達到或超越人類表現”。在醫療健康領域,人工智能開始成為醫生的“小助手”。
例如,各種遺傳綜合徵會表現出獨特的面部特徵,然而,綜合徵數量巨大,要正確識別並非易事。利用人工智能或能幫助診斷遺傳綜合徵。
但是早期此類人工智能研究採用的訓練數據集規模不大,僅能識別少量綜合徵。而Face2Gene正是人工智能輔助診斷的再進一步。
FDNA研究人員首先訓練了人工智能係統,以區分狄蘭吉氏症候群和天使人綜合徵(這是兩種面部特徵截然不同的病症)與其他類似病症。他們還教會該模型對努南綜合徵的不同基因形式進行分類。
他們在算法中輸入了涵蓋216種不同綜合徵的17000多張確診病例的圖像。所有患者被確診的遺傳綜合徵總計達幾百種。
研究人員利用兩個獨立的測試數據集測試人工智能的表現,每一個數據集都包含數百張之前經過臨床專家分析的患者面部圖像。對於每一張測試圖像,Face2Gene按照一定順序列出各種潛在的綜合徵。
在兩組測試中,在約90%的情況下,Face2Gene提出的前10條建議中都包括了正確的綜合徵。當看到面孔新圖像時,該應用程序的最佳診斷率約為65%。
“這是人們期待已久的醫學遺傳學領域突破。”Gripp說,“通過這項研究,我們已經證明,在臨床工作中添加自動面部分析框架,如DeepGestalt,可以幫助實現更早地診斷和治療,並改善生活質量。”
此外,澳大利亞和巴西聯合研究團隊於近日基於人工智能技術出一種圖像處理算法,通過分析眼底相機拍攝的視網膜圖像,可以瞬時自動識別出糖尿病視網膜病變的關鍵特徵,即眼球內由於視網膜毛細血管破裂而滲漏出來的液體,準確率達98%。
“打敗”專家
FDNA希望不斷改善Face2Gene,以幫助其他公司在DNA分析過程中篩選、優先排序和解釋未知基因變異等。但是為了訓練它,FDNA需要大量數據。
Face2Gene目前對醫療專業人士是免費的。而且,許多醫生已經開始將該系統作為診斷罕見遺傳病的第二選擇。它還可以為醫生不知道如何判斷病人症狀的情況提供一個起點。“這就像谷歌搜索。”Gripp說。
隨著越來越多的醫療保健專業人員將患者照片上傳到應用程序,該應用的準確性略有提高。現在它的中有大約150000張圖像。
去年8月,Face2Gene和臨床醫生在出生缺陷研討會上進行了一次非官方的“較量”。結果顯示,該應用的表現優於人類。
南卡羅萊納州格林伍德遺傳中心遺傳學家Charles Schwartz分發了10名兒童的面部照片,這些照片具有“相當可識別的”綜合徵特徵,並要求與會者提出正確的診斷。
在49名參與研究的臨床遺傳學家中,只有一半人對兩個病例選擇正確。Face2Gene在其中7張圖片上做出了正確的選擇。
“我們慘遭失敗,Face2Gene完胜。”馬里蘭州貝塞斯達美國國家人類基因組研究所的臨床遺傳學家Paul Kruszka說,“我認為每個兒科醫生和遺傳學家很快都會有這樣的應用程序,並將像用聽診器一樣使用它。”
“目前的挑戰仍在於數據,如果有更多且更多樣化的數據,我們就能夠提供更好的結果。”Gurovich說。
存在風險
但是,該算法的好壞取決於它的訓練數據集,而且存在風險,尤其是在那些只影響全球少數人的罕見疾病開始受到關注的情況下,該公司和研究人員將對數據集進行存儲和商品化。
醫生可以把這項技術當作一種輔助手段,儘管它並不能提供明確的診斷。但研究人員表示,這也引發了一些倫理和法律方面的擔憂,例如培訓數據集的種族偏見和數據庫的商業碎片化。這兩種情況都可能限制診斷工具的使用。
英國牛津大學計算生物學家Christoffer Nellaker表示:“這威脅到了這項技術的主要潛在好處。”Nellaker一直在推動該領域的數據共享。
一直以來,在訓練數據集中的種族偏見都是一個問題。
2017年對智障兒童進行的一項研究發現,在比利時白人兒童中,Face2Gene對唐氏綜合徵的識別率為80%,而在剛果黑人兒童中這一比例僅為37%。
然而,隨著訓練數據集多樣化,該算法對非洲面部識別的準確性得到改善,表明更公平地代表不同人群是可以實現的。
“正因為如此,我們成功地開發和培訓了一種可以被認為是種族平等的人工智能解決方案。我們計劃繼續擴大和開發人工智能解決方案,幫助減少醫療保健領域的種族差異。”Gurovich告訴《中國科學報》,“隨著我們向前發展,技術偏見會越來越少。”
相關論文信息:DOI: 10.1038/s41591-018-0279-0