利用量子生物學、人工智能來銳化CRISPR Cas9基因組編輯工具

 二維碼
發表時間:2023-11-13 16:36

橡樹嶺國家實驗室的科學家們利用他們在量子生物學、人工智能和生物工程方面的專業知識,改進了CRISPR Cas9基因組編輯工具對微生物等生物的作用,這些生物可以被改造成生產可再生燃料和化學品。

CRISPR是一種強大的生物工程工具,用于修改遺傳密碼以提高生物體的性能或糾正突變。CRISPR Cas9工具依賴于一種單一的、獨特的引導RNA,該RNA指導Cas9酶與基因組中相應的靶向位點結合并切割。現有的計算預測CRISPR工具有效引導rna的模型僅建立在來自少數模型物種的數據上,當應用于微生物時,效率很弱且不一致。

許多CRISPR工具都是為哺乳動物細胞、果蠅或其他模式物種開發的。ORNL合成生物學小組的負責人Carrie Eckert:“很少有針對染色體結構和大小非常不同的微生物的研究。”“我們已經觀察到,設計CRISPR Cas9機制的模型在處理微生物時表現不同,這項研究證實了我們所知道的軼事。

為了改進引導RNA的建模和設計,ORNL的科學家們試圖更好地了解細胞核中最基本的水平發生了什么,遺傳物質儲存在細胞核中。他們轉向了量子生物學,這是一個連接分子生物學和量子化學的領域,研究電子結構對核苷酸的化學性質和相互作用的影響,核苷酸是構成DNARNA的分子。

ORNL的計算系統生物學家Erica Prates說,電子在分子中的分布方式會影響反應性和構象穩定性,包括Cas9酶引導RNA復合物與微生物DNA有效結合的可能性。

**的指南,通過森林的決定

科學家們建立了一個可解釋的人工智能模型,稱為迭代隨機森林iterative random forest。他們在大約5萬個引導rna的數據集上訓練了這個模型,這些rna以大腸桿菌的基因組為目標,同時也考慮了量子化學特性,這種方法發表在《核酸研究》雜志上。

該模型揭示了核苷酸的關鍵特征,可以使選擇更好的引導rna成為可能。Prates:“該模型幫助我們確定了支持指導rna效率的分子機制的線索,為我們提供了一個豐富的分子信息庫,可以幫助我們改進CRISPR技術。

ORNL的研究人員通過使用模型選擇的一大組向導對大腸桿菌進行CRISPR Cas9切割實驗,驗證了可解釋的AI模型。

這篇論文的**作者、前ORNL計算系統生物學家Jaclyn Noshay說,使用可解釋的人工智能讓科學家們了解了驅動結果的生物機制,而不是基于缺乏可解釋性的黑匣子算法的深度學習模型。

Noshay:“我們希望提高我們對指導設計規則的理解,以獲得**切割效率,并以微生物物種為重點,了解跨[生物]王國訓練的模型的不兼容性。

可解釋的人工智能模型具有數千個特征和迭代性質,使用ORNL的橡樹嶺領導計算機設施(OLCF)Summit超級計算機進行訓練,OLCF是美國能源部科學辦公室的用戶設施。

Eckert說,她的合成生物學團隊計劃與ORNL的計算科學同事合作,利用他們從新的微生物CRISPR Cas9模型中學到的知識,并利用實驗室實驗或各種微生物物種的數據進一步改進它。

為每個物種提供更好的CRISPR Cas9工具

考慮到量子特性,為每個物種的Cas9指南改進打開了大門。這篇論文甚至對整個人類都有影響。”“例如,如果你正在研究任何一種藥物開發,你使用CRISPR來針對基因組的特定區域,你必須有最準確的模型來預測這些指導。

完善CRISPR Cas9模型為科學家提供了一個更高通量的管道,將基因型與表型或基因與物理特征聯系起來,這是一個被稱為功能基因組學的領域。這項研究對ornl領導的生物能源創新中心(CBI)的工作有影響,例如,改善生物能源原料植物和生物質的細菌發酵。

通過這項研究,我們大大提高了對向導RNA的預測,埃克特說。我們對其中的生物過程了解得越好,我們可以為預測提供的數據越多,我們的目標就會越好,從而提高研究的精度和速度。

我們研究的一個主要目標是提高使用CRISPR工具預測修改更多生物體DNA的能力。ORNL的保羅·亞伯拉罕(Paul Abraham)是一位生物分析化學家,他領導著美國能源部基因組科學計劃的安全生態系統工程和設計科學重點領域(SEED SFA),該領域支持CRISPR研究,他說:“這項研究代表了一個令人興奮的進步……了解我們如何避免在生物體的遺傳密碼中造成代價高昂的錯別字”“我很想知道,隨著我們生成更多的訓練數據,并繼續利用可解釋的人工智能建模,這些預測還能提高多少。

本網站所有轉載文章系出于傳遞更多信息之目的,轉載內容不代表本站立場。不希望被轉載的媒體或個人可與我們聯系,我們將立即進行刪除處理。


相關閱讀
最新動態