新結構預測方法助科學家建立起500個以往無法預測的蛋白質的模型
來自美加州大學伯克利分校的科學家們最近發表了一項工作,其為思考病原體進化的新方法奠定了基礎。“我們的研究強調,對於破壞性真菌病原體Magnaporthe oryzae的分泌蛋白,使用機器學習的無模板建模確實優於基於模板的建模,”發表在MPMI雜誌上的論文的第一作者Kyungyong Seong說道。
病原體利用的是一種被稱為效應器的毒力因子,這對病原體的生存非常重要。同源建模是最廣泛使用的方法之一,但這需要使用已解決的效應器結構模板,而解決所有的效應器結構是一項太艱鉅的任務。病原體基因組中編碼的效應蛋白太多,其無法簡單地依靠實驗來解決每一個結構。
Seong和同事Ksenia V. Krasileva則使用了一種新的結構預測方法,該方法能為以前基於模板的方法無法預測的500種分泌蛋白建立模型。
Krasileva表示:“在我們的研究中,1854個分泌蛋白中約有70%被建模,它們的結構根據它們彼此之間的相似性或其他已解決的蛋白結構提供了關於效應物的額外信息。我們證明了新的結構預測方法很適用於破譯病原體毒力因子和其他分泌蛋白的問題,這些蛋白之間或與其他蛋白之間的序列相似度往往很小。”
這種新方法使科學家能繪製出數以千計的分泌蛋白並在它們之間建立起缺失的進化聯繫。“我們相信我們的研究是在機器學習結構預測的新時代,首次在植物病原體上應用結構基因組學的概念,”Seong說道。
“隨著結構預測的準確性進一步提高,結合大規模蛋白質結構預測數據的文章將變得更加常見,”Krasileva預測道,“我們的文章可能會引發一些關於如何使用此類數據的想法並導致一些科學家在其他方面提前探索機會。”
他們還發現,在M. oryzae中有許多新的序列不相關的結構相似的效應器,並且結構相似的效應器在其他植物病原體中也有發現。這表明,病原體可能是依靠一套共同起源但在進化過程中序列基本分歧的效應器來感染植物。