遺傳風險勝過年齡:機器學習模型對阿爾茨海默病的預測風險進行排序
根據最近的一項研究,一旦個人達到65歲,也就是阿爾茨海默病的發病門檻,他們的遺傳風險可能在決定他們是否會患上這種致命的大腦疾病方面發揮更大的作用,而不僅僅是他們的年齡。最近發表在《科學報告》雜誌上的這項研究利用機器學習模型對患阿爾茨海默病的風險因素進行排序。
這是通過使用遺傳風險分數、非遺傳信息和近50萬個人的電子健康記錄數據實現的。這項研究是第一個將這些數據來源結合起來並根據其與阿爾茨海默病的關聯強度對風險因素進行排名的研究。
研究人員利用這些模型對英國生物庫中的兩個人群的預測性風險因素進行排序: 40歲及以上的白人,以及65歲或以上的成年人的子集。
結果顯示,年齡–根據阿爾茨海默氏症協會的說法,到85歲時構成總風險的三分之一–是整個人群中阿爾茨海默氏症的最大風險因素,但對於老年人來說,由多基因風險得分決定的遺傳風險更具預測性。
“我們都知道阿爾茨海默病是一種晚發疾病,所以我們知道年齡是一個重要的風險因素。但是當我們只考慮65歲或以上的人的風險時,那麼由多基因風險評分所捕獲的遺傳信息就比年齡高,”研究的主要作者、俄亥俄州立大學醫學院眼科和視覺科學以及生物醫學信息學的副教授Xiaoyi Raymond Gao說。”這意味著當我們研究阿爾茨海默病時,考慮遺傳信息真的很重要。”
家庭收入低也是一個重要的風險因素,在年齡和遺傳的影響之後排名第三或第四。
“與收入有關的發現是非常非常有趣的,”高說,他也是俄亥俄州立大學人類遺傳學系的成員,他的實驗室使用生物醫學大數據和人工智能來研究阿爾茨海默病和眼部疾病背後的遺傳學。我們都希望有健康的生活,而收入可能是一個如此重要的因素,決定你能吃得起什麼,你能住得起哪裡,教育水平,獲得護理- 所有這些都可能導致阿爾茨海默氏病。”
在樣本中的457936名英國生物銀行參與者中,2177人已經患上阿爾茨海默病,455759人沒有,88309人是65歲或以上。
一些在阿爾茨海默病(AD)患者和非患者之間存在差異的非遺傳風險因素非常突出: 結果顯示,在阿爾茨海默病患者中,較高的收縮壓和較低的舒張壓更為常見,糖尿病更為普遍,家庭收入和教育程度較低,而最近的跌倒、聽力困難和母親有阿爾茨海默病的歷史則更高。
全部成人樣本的前20名風險因素清單還包括診斷為高血壓、尿路感染、抑鬱症發作、昏厥、未指明的胸痛、迷失方向和異常體重減輕。65歲及以上人群中排名前20的其他風險因素包括高膽固醇和步態異常。這些發現顯示了將電子健康記錄中的病情代碼加入模型的力量。
“機器學習可以探索所有這些特徵或變量之間的關係,挑選重要的特徵,並將某些對阿爾茨海默病風險的貢獻比其他特徵大得多的特徵排在最前面,”Gao說。”通常來說,高度肥胖是不好的,但我們在這裡也看到,較低的身體質量指數是不好的。高血壓通常不是好事,但在這裡我們看到較低的舒張壓也不是好事。這些模型揭示了一些有趣的模式”。
建立這些模型是一個兩步的過程。該團隊首先利用阿爾茨海默病遺傳學聯盟的數據進行了全基因組關聯研究,以確定與阿爾茨海默病總體風險和特定年齡後疾病發展有關的遺傳變異。這些獨立的變體集合被用來建立兩個多基因風險評分,將整個基因組的遺傳效應匯總為每個人的單一風險衡量。
這些分數被應用於英國生物銀行參與者的DNA數據,並與生物銀行的常規風險因素(如性別、教育、體重指數和血壓)以及個人記錄中引用的11000多個電子健康記錄條件代碼相結合。
該團隊在解釋模型的輸出時還使用了一種算法,以確保風險因素變量在分析中被客觀地加權。
他說,我們出生時的疾病遺傳風險已經確定,但是關於其他健康和社會經濟因素如何影響我們患阿爾茨海默氏症的風險的信息–以及高氏也研究的青光眼–給了我們採取預防措施的力量。
“如果人們對風險因素有更多了解,他們就有可能調整自己的生活方式。對於阿爾茨海默氏症和青光眼來說,沒有治療方法,所以預防可以有很大的幫助,”Gao說。”我也希望構建模型來進行這些預測可以幫助藥物開發和有效的、低成本的篩查項目。”