革新CRISPR:量子生物學與人工智慧結合增強基因組編輯能力
橡樹嶺國家實驗室在量子生物學和人工智慧方面的研究大大提高了CRISPR Cas9基因組編輯在微生物中的效率,有助於再生能源的開發。
橡樹嶺國家實驗室(ORNL)的Ezoic科學家利用他們在量子生物學、人工智慧和生物工程方面的專業知識,改進了CRISPR Cas9基因組編輯工具在微生物等生物體上的工作方式,這些生物體可以被改造以生產可再生燃料和化學品。
CRISPR 是一種強大的生物工程工具,用於修改遺傳密碼,以提高生物體的性能或糾正突變。CRISPR Cas9 工具依賴單一、獨特的引導RNA,引導Cas9 酶與基因組中相應的目標位點結合併裂解該位點。現有的用於計算預測CRISPR 工具有效引導RNA 的模型僅建立在少數模式物種的數據基礎上,應用於微生物時效率較弱且不一致。「許多CRISPR 工具都是針對哺乳動物細胞、果蠅或其他模式物種開發的。”ORNL 合成生物學小組組長卡莉-埃克特(Carrie Eckert)說:”CRISPR 工具很多都是針對哺乳動物細胞、果蠅或其他模式物種開發的,很少有針對微生物的,因為微生物的染色體結構和大小都非常不同。我們觀察到,設計CRISPR Cas9機器的模型在與微生物合作時表現不同,這項研究驗證了我們的傳聞。”ORNL 的科學家開發出一種方法,提高了用於改造微生物以生產可再生燃料和化學品的CRISPR Cas9 基因編輯工具的準確性。這項研究利用了實驗室在量子生物學、人工智慧和合成生物學方面的專業知識。資料來源:Philip Gray/ORNL,美國能源部為了改進導引RNA 的建模和設計,ORNL 的科學家試圖更了解細胞核中最基本的情況。他們求助於量子生物學,這是一個連接分子生物學和量子化學的領域,研究電子結構對核苷酸(DNA 和RNA 的組成分子)的化學性質和相互作用的影響。ORNL的計算系統生物學家Erica Prates說,電子在分子中的分佈方式會影響反應性和構象穩定性,包括Cas9酶指導RNA複合物與微生物DNA有效結合的可能性。在CRISPR研究中利用可解釋人工智慧科學家建立了一個名為迭代隨機森林的可解釋人工智慧模型。他們在《核酸研究》(Nucleic Acids Research)雜誌上介紹的一種方法中,以大腸桿菌基因組為目標,在約5萬個引導RNA的資料集上訓練了該模型,同時也考慮了量子化學特性。該模型揭示了核苷酸的關鍵特徵,有助於選擇更好的導向RNA。普拉茨說:”模型幫助我們找出了支撐我們的導向RNA效率的分子機制的線索,為我們提供了一個豐富的分子資訊庫,可以幫助我們改進CRISPR技術。”ORNL的研究人員透過在大腸桿菌上使用該模型選擇的大量引導RNA進行CRISPR Cas9切割實驗,驗證了可解釋人工智慧模型。論文第一作者、前ORNL計算系統生物學家賈克琳-諾謝(Jaclyn Noshay)說,使用可解釋人工智慧讓科學家們了解了驅動結果的生物機制,而不是植根於缺乏可解釋性的”黑箱”演算法的深度學習模型。Noshay 說:”考慮到跨[生物]王國訓練的模型不相容的知識,我們希望提高對以微生物物種為重點的最佳切割效率的指導設計規則的理解。”可解釋的人工智慧模型具有數千個特徵和迭代性質,是利用ORNL橡樹嶺領導電腦設施(OLCF)的Summit超級電腦訓練出來的,OLCF是能源部科學辦公室的使用者設施。埃克特說,她的合成生物學團隊計劃與ORNL的計算科學同行合作,利用他們從新的微生物CRISPR Cas9模型中學到的知識,並利用實驗室實驗或各種微生物物種的數據對其進行進一步改進。為不同物種開發CRISPR Cas9工具將量子特性考慮在內,為每個物種的Cas9 引導改進打開了大門。艾克特說:「這篇論文甚至對人類也有影響。如果你正在研究任何類型的藥物開發,例如,你正在使用CRISPR來靶向基因組的特定區域,你必須有最準確的模型來預測這些引導。”完善CRISPR Cas9模型為科學家提供了更高通量的管道,將基因型與表現型或基因與物理性狀聯繫起來,這一領域稱為功能基因組學。這項研究對ORNL領導的生物能源創新中心(CBI)的工作具有重要意義,例如改進生物能源原料植物和生物質的細菌發酵。埃克特說:”透過這項研究,我們大大改進了對導核糖核酸的預測。我們對起作用的生物過程了解得越多,能夠輸入到我們預測中的數據越多,我們的目標就會越好,從而提高我們研究的精度和速度”。“我們研究的一個主要目標是提高利用CRISPR 工具預測性修改更多生物DNA 的能力。這項研究表明,我們在了解如何避免在生物體的遺傳密碼中出現代價高昂的’錯字’方面取得了令人興奮的進展。」ORNL的生物分析化學家保羅-亞伯拉罕(Paul Abraham)說,他是能源部基因組科學計劃安全生態系統工程與設計科學重點領域(SEED SFA)的負責人,該領域為CRISPR研究提供了支持。”我很想知道,隨著我們產生更多的訓練數據,並繼續利用可解釋的人工智慧建模,這些預測還能提高多少”。