Google AI算法助力降低糖尿病患者失明風險
11月14日是世界糖尿病日。目前,全球防控糖尿病的形勢仍然嚴峻。國際糖尿病聯合會的數據顯示,在2019年,全球約有4.63億20歲到79歲的成年人患有糖尿病,到了2045年,預計這一數字將上升至7億;同時,這一疾病還造成了至少7600億美元的醫療支出,占到了全球成年人總醫療支出的10%。
特別值得注意的是,約有79%的糖尿病患者生活在低收入和中等收入國家,而在那些醫療技術不發達或者醫療資源緊張的地方,糖尿病及其並發症往往得不到及時的診斷和治療。例如,作為當下增長最快的致盲病因,雖然糖尿病視網膜病變(Diabetic Retinopathy)在早期發現後完全可以得到妥善的治療,但因為很多情況下沒有足夠多的醫生來為所有糖尿病患者進行及時的診斷,它常常導致不可逆的失明。
醫療技術應當對所有人都有所幫助,為了應對這一挑戰,改善糖尿病視網膜病變篩查,人們已經做出了很多努力。Google AI的研究人員們就利用機器學習和計算機視覺領域的最新進展,開發了一種能夠通過眼部掃描圖像判斷患者的視網膜是否發生了病變的深度學習算法。
現在眼科醫生診斷糖尿病視網膜病變的常用方法之一是觀察眼部掃描圖像,尋找病變徵兆(包括微動脈瘤、出血、硬性滲出物等等),並判斷其嚴重程度。當然,掌握準確解讀掃描圖像的能力,需要經過相當專業的培訓。然而,在世界上很多地方,具備這一能力的醫生的數量並不能滿足當地糖尿病患者的篩查需求。
以幫助醫生們在醫療資源有限的情況下檢查更多的病人為目標,Google與印度和美國的醫生們密切合作,創建了一個包含12.8萬張眼底掃描圖像的數據集,裡面的每張照片都經過了由54名眼科醫生組成的小組中的3-7位醫生的專業評估。基於這個數據集,Google訓練出了一個檢測糖尿病視網膜病變的深度神經網絡。
算法訓練完成的下一步就是測試它的性能。為此,Google安排它在由1.2萬張眼底掃描圖像組成的兩個獨立臨床驗證集上,與由上述54位醫生中一致性較高的8位組成的新小組進行“競賽”。以7到8位經美國專業委員會認證的視網膜專家中多數人的診斷結果作為參考標準,這一算法的F-score達到了0.95,好於醫生小組的0.91。所謂F-score,它的最大值是1,其衡量綜合了敏感性與特異性兩大指標,敏感性,指的是降低漏診的能力,特異性,則意味著避免誤診的能力。
在發表算法之後,Google的研究人員們並沒有止步,而是繼續提高它的性能和可解釋性。在這一過程中,檢測的分級尺度更加細化,由最初的2級變為後來的5級;臨床驗證的參考標準也從視網膜專家中的多數意見更改為他們經討論之後達成的一致意見,這一新標準既提高了精準度,也有助於發現那些最細微的病變,如微動脈瘤。
要想讓這一算法成為真正有效的診斷工具,還需要確保它在臨床環境中的適應性、透明度和可信度。換句話說,需要以適當的方式向醫生們展示算法給出的診斷結果,幫助提高他們進行糖尿病眼病診斷時的準確性和信心。
為了實現這一點,Google採用的解決方案是,向眼科醫生們展示算法對糖尿病視網膜病變的不同等級的預測分數(Model Score),同時突出顯示算法做出預測所依據的最主要區域的熱圖。如下圖所示,在沒有算法輔助時,3名眼科醫生中有2名沒有從眼部掃描圖像中發現糖尿病視網膜病變的跡象,而在算法的幫助下,它們都給出了準確的結果。可以說,算法確實能夠促使醫生們更仔細地檢查病理,留意到那些容易被忽略的細節。
目前,這一研究已經進入了臨床應用的階段。2019年,Google和同屬Alphabet的生命科學和醫療公司Verily合作,在印度馬杜賴市(Madurai)的Aravind眼科醫院首次實際應用了這一算法。首先,由經過訓練的工作人員拍攝患者的眼部圖像,然後通過軟件將它上傳到檢測算法中,算法會自動檢測其中的糖尿病視網膜病變和糖尿病性黃斑水腫(Diabetic Macular Edem)症狀,返回篩查結果。
此外,Google也在泰國巴吞他尼府和清邁府的診所裡進行了實地研究,研究這一算法如何更好地用於糖尿病護理中的眼部篩查。例如,針對護士們拍攝的眼部掃描圖像中常常存在模糊或暗區,算法會把它們標記為“無法分級”這一問題,Google改進了它的實際應用流程,讓專家們在查看患者病歷的同時,幫忙檢查這些圖像,而不是將它們一律轉診給眼科醫生。這一做法減少了不必要的誤診,也節約了醫生和患者的時間。