機器學習算法攻克難疾的新救星
近日,由劍橋大學領導的研究人員設計了一種用於藥物發現的機器學習算法,該算法的效率是工業標準的兩倍,可以加快開發新的疾病治療方法的進程。研究人員使用他們的算法來識別新的分子,激活了一種被認為與阿爾茨海默病和精神分裂症相關的蛋白質。
藥物發現的一個關鍵問題是預測一個分子是否會激活特定的生理過程。所以研究人員會構建一個統計模型尋找已知的激活過程的分子之間的化學模式,但是建立這些模型的數據是有限的,因為實驗成本很高,並且不清楚哪種化學模式在統計上是有意義的。
劍橋卡文迪什實驗室的阿爾法·李博士認為機器學習在計算機視覺等數據豐富的領域取得了重大進展,下一個前沿領域就是科學應用,例如藥物發現。雖然研究人員對這個問題有著物理上的洞察力,但最大的問題是如何將數據與基礎化學和物理學結合起來。
該算法由Lee和他的同事與生物製藥公司輝瑞合作,利用數學將與藥物相關的化學模式分離出來。重要的是,該算法研究已知活性分子和已知不活躍的分子,並識別分子中哪些部分對藥物作用很重要,哪些部分不重要。
一種被稱為“數學原理”的隨機矩陣理論給出了數據集,然後將其與活性和非活性分子的化學特徵的統計數據進行比較,得出哪些化學模式對結合是重要的,而不是產生於偶然。活性分子還能計算出另外六百萬個分子。研究人員購買並篩選了100個最相關的分子。由此,他們發現了四個激活CHRM 1受體的新分子,這是一種可能與阿爾茨海默病和精神分裂症相關的蛋白質。
從六百萬分子中提取出四個活性分子,就像在乾草堆中找到一根針,但是利用機器學習算法,事情會變得容易很多。
劍橋大學的研究人員目前正在開發算法,來預測合成複雜有機分子的方法,以及擴展機器學習的新算法。這項研究得到了溫頓可持續性物理方案的支持。