中國科學家建立了新的蛋白質從頭設計方法
記者從中科院官網了解到,近期,中國科學技術大學教授劉海燕、副教授陳泉團隊採用數據驅動策略,提出一條全新的蛋白質從頭設計路線。據悉,該研究為工業酶、生物材料、生物醫藥蛋白等功能蛋白的設計奠定了基礎。
相關成果2月9日以“用於蛋白質設計的以主鍊為中心的神經網絡能量函數”為題發表於《自然》(Nature)雜誌。
蛋白質是生命功能的主要執行者,其結構與功能由氨基酸序列所決定。目前,能夠形成穩定三維結構的蛋白質幾乎全部是天然蛋白質,其氨基酸序列是長期自然進化形成。在天然蛋白結構功能不能滿足工業或醫療應用需求時,想要得到特定的功能蛋白,就需對其結構和序列進行設計。
據介紹,目前,國際上報導的蛋白質從頭設計工作主要使用天然結構片段作為構建模塊來拼接產生人工結構。然而這種方法存在設計結果單一、對主鏈結構細節過於敏感等不足,限制了設計主鏈結構的多樣性和可變性。蛋白質從頭設計中最困難的問題是如何充分地探索蛋白質主鏈結構空間,發現新穎的、“高可設計性”主鏈結構,目前還缺乏相關的系統性解決方法。
中國科大相關團隊長期深耕計算結構生物學方向的基礎研究和應用基礎研究。劉海燕、陳泉團隊十餘年來致力於發展數據驅動的蛋白質設計方法,經過長期不懈努力,建立並實驗驗證了給定主鏈結構設計氨基酸序列的ABACUS模型,進而發展了能在氨基酸序列待定時從頭設計全新主鏈結構的SCUBA模型。SCUBA採用一種新的統計學習策略,基於核密度估計(或近鄰計數,NC)和神經網絡擬合(NN)方法,從原始結構數據中得到神經網絡形式的解析能量函數,能夠高保真地反應實際蛋白質結構中不同結構變量間的高維相關關係,在不確定序列的前提下,連續、廣泛地搜索主鏈結構空間,自動產生“高可設計性”主鏈。
理論計算和實驗證明,用SCUBA設計主鏈結構,能夠突破只能用天然片段來拼接產生新主鏈結構的限制,顯著擴展從頭設計蛋白的結構多樣性,進而設計出不同於已知天然蛋白的新穎結構。“SCUBA模型+ABACUS模型”構成了能夠從頭設計具有全新結構和序列的人工蛋白完整工具鏈,是RosettaDesign之外目前唯一經充分實驗驗證的蛋白質從頭設計方法,並與之互為補充。在該研究中,團隊展示了9種從頭設計的蛋白質分子的高分辨晶體結構,它們的實際結構與設計模型一致,其中5種蛋白質具有天然蛋白質中尚未觀察到的新型拓撲結構。
Nature審稿人認為,“與現有方法不同,現有方法要么使用參數方程來描述預定義螺旋結構的空間,要么基於片段組裝的方法依賴於已知蛋白質片段。SCUBA方法原則上允許人們探索任意主鏈結構,然後填充序列,允許人們設計比自然界中觀察到的更廣泛的蛋白質幾何結構”,“蛋白質從頭設計仍然具有挑戰性,本工作中六種不同蛋白質的高分辨率設計是一項重要成就,表明此方法工作良好”,“本研究中報導的成功設計數量之多令人印象深刻,並提供了強有力的證據,證明了基礎技術是魯棒的。所採用的基於神經網絡的能量項是新穎的,因為它們刻畫了更傳統的統計方法無法企及的多維特徵,該方法具有足夠的新穎性和實用性”。