2022年七大前沿科技:量子模擬和靶向基因醫療
日前《自然》雜誌最新列舉2022年七項重要科學技術,將對科學領域產生重大影響,其中包括:
1、完整版基因組
2019年,美國加州聖克魯茲分校基因組學研究員凱倫·米加(Karen Miga)和馬里蘭州貝塞斯達國家人類基因組研究所研究員亞當·菲利普(Adam Phillippy)啟動了“端粒至端粒(T2T)”的聯合研究項目,當時大約全球十分之一的人類基因組仍未完成測序,然而,現在該數據已降至零。2021年5月,該聯合研究項目聲稱發現第一個端粒至端粒的人類基因組序列,使用人類共識基因組序列圖譜GRCh38增加了近2億新鹼基對,並為人類基因組計劃寫上了最後一章。
最早發佈於2013年的GRCh38基因組序列圖譜是一個具有價值的研究工具,它是繪製基因序列讀數的“腳手架”,但它也存在許多漏洞,其主要問題在於基因序列讀數雖然精確,但過於簡短,無法明確繪製高度重複的基因組序列,包括:覆蓋染色體末端的端粒,細胞分裂期間協調新復制DNA分裂的著絲粒(centromeres)。
長讀測序技術被證明是改變遊戲規則的技術,該技術是美國太平洋生物科學公司和英國牛津納米孔技術公司共同開發的,它能在一次性基因序列讀取中,對數万至數十億個鹼基對進行排序,但至少在測序初期,並不是沒有錯誤。時值2020年,T2T項目研究人員重建了他們的第2、3條單獨染色體——X和8,然而,太平洋生物科學公司的測序工作已取得重大進展,T2T科學家能檢測到長時間重複序列的微小變化,這些微妙的“指紋”使長而重複的染色體片段變得更易處理,基因組剩餘部分則很快排列起來,牛津納米孔技術公司還捕獲了許多調節基因表達的DNA修飾,同時,T2T基因測序能在基因組範圍內繪製“表觀遺傳標記”。
已測序的T2T基因組源自包含兩組相同染色體的細胞株,正常的二倍體人類基因組的每個染色體有兩個版本,目前研究人員正在研究“階段策略”,能夠自信地將每個序列分配給合適的染色體副本。
T2T項目首席研究員之一、紐約洛克菲勒大學遺傳學家埃里希·賈維斯(Erich Jarvis)說:“我們的目標是掌握平均97%的人類等位基因多樣性,我認為未來10年之內,我們能將端粒至端粒基因組測序作為常規操作,同時,我們希望利用完整的基因組裝配能力提供地球每種脊椎動物的完整基因組序列。”
2、解析蛋白質結構
此前研究人員很難衡量蛋白質結構功能,在過去兩年時間裡,科學實驗和計算領域取得的進步,為研究人員以前所未有的速度和分辨率解析蛋白質結構。由DeepMind子公司Alphabet開發的AlphaFold2結構預測算法基於“深度學習”策略,能推算出氨基酸序列折疊蛋白質的結構。該算法自2021年7月發布以來,已被應用於蛋白質組學,用於確定人類和20個模型生物中表達的所有蛋白質結構,以及Swiss-Prot數據庫中近44萬個蛋白質結構,大幅增加了高可信度建模數據的蛋白質數量。
與此同時,低溫電子顯微鏡的技術改進使研究人員能以實驗方法解決最具挑戰性的蛋白質和復合物,低溫電子顯微鏡採用電子束掃描快速凍結的分子,生成多個方向的蛋白質圖像,然後可以通過計算重新組裝成一個蛋白質3D結構。2020年,低溫電子顯微鏡硬件和軟件的改進使研究團隊能夠生成分辨率小於1.5埃的水平解析蛋白質結構,捕捉到單個原子的位置。紐約結構生物學中心西蒙斯電子顯微鏡中心副主任布里奇特·卡拉格(Bridget Carragher)說:“此前我們曾深入討論’原子分辨率’這個術語,但它僅是接近原子,目前我們實驗證實獲得原子等級清晰度解析蛋白質結構是可行的。”
還有一種相關方法,即低溫電子斷層掃描(cryo-ET),它可以捕捉冷凍細胞薄片中自然蛋白質特徵,但利用該技術解析複雜而擁擠的圖像仍存在困難。卡拉格說:“採用機器學習世界的先進算法是必不可少的,相信未來我們能解決棘手的科學難題。”
3、量子模擬
原子在特定條件下,能被誘導至一個高度激發狀態,直徑達到1微米或者更大。目前物理學家現已證實,通過對數百個原子陣列進行這種可控激發,可以解決一些具有挑戰性的物理問題,實現傳統計算機“極限升級”。
量子計算機以量子位的形式管理數據,利用“量子糾纏”物理現象進行數據耦合,量子位可以在一定距離內相互影響,這些量子位可大幅提高計算能力。目前,已有幾個研究團隊成功利用單個離子作為離子位,但這些離子的電荷很難在高密度下組裝,物理學家正在探索另一種方法,其中包括法國國家科學研究中心的安東尼·布羅維(Antoine browwaeys)和美國哈佛大學的米哈伊爾·盧金(Mikhail Lukin),他們使用光學鑷子精確地將不帶電原子定位在緊密排列的2D和3D陣列中,然後應用激光將這些粒子成為大直徑的“里德堡原子(Rydberg atoms)”,使其與它們鄰近粒子糾纏在一起。
韓國高級科學技術研究所物理學家jaaewook Ahn稱,里德堡原子系統是獨立可控的,它們的相互作用可以打開和關閉,反之賦予了可編程性。量子模擬技術在短短幾年時間裡就獲得了重大突破進展,技術進步提高了里德堡原子陣列的穩定性和性能,以及從幾十個量子位快速擴展至幾百個。據悉,量子模擬領域的先驅者已成立了公司,正在開發實驗室使用的里德堡原子陣列系統,布羅維估計這種先進量子模擬器可以在一兩年內投入商業應用,但這項工作也可能為量子計算機的更廣泛應用鋪平道路,包括:經濟學、物流和數字加密領域等。
4、精準基因操控
儘管CRISPR–Cas9技術擁有強大的基因組編輯能力,但該技術更容易基因失活,而不是達到基因修復,因為儘管針對Cas9酶的基因組序列相對精確,但細胞對該技術產生的雙鏈切割修復卻並不精確,CRISPR–Cas9修復通過一種稱為“非同源端連接”的過程進行,通常會被微小的基因插入或者刪除所混淆。
美國哈佛大學化學生物學家大衛·劉指出,大多數遺傳疾病需要的是基因修正,而不是基因破壞。目前他和研究同事現已開發兩種頗有希望的基因操控方法,第一種叫做鹼基編輯(base editing),將一種催化受損Cas9與一種酶結合,該酶可以幫助一種核苷酸轉化為另一種核苷酸,例如:胞嘧啶轉化為胸腺嘧啶,腺嘌呤轉化為鳥嘌呤,但目前該方法僅對特定鹼基對有效;第二種叫做精準編輯(Prime editing),將Cas9與逆轉錄酶連接起來,並引導DNA將所需編輯內容精準插入基因組序列。通過一個多階段的生化過程,這些成分將引導RNA複製成DNA,最終取代目標基因組序列。重要的是,鹼基編輯和精準編輯都僅剪切一條DNA鏈,這對細胞而言是一個更安全、破壞性更小的過程。
鹼基編輯技術首次公佈於2016年,現已投入臨床應用,由大衛·劉創建的Beam Therapeutics公司已獲美國食品藥物管理局批准,首次應用於人類鐮狀細胞病基因修復。相比之下,精準編輯仍是一項新技術,但改進的迭代技術不斷出現,該技術的應用前景也非常明確。韓國首爾延世大學醫學院基因組編輯專家Hyongbum Henry Kim現已證實,使用精準編輯技術來糾正老鼠視網膜基因突變,可達到16%的治愈率。他說:“如果我們使用最近報導的更先進技術,治療效率將獲得大幅提高,在某些情況下,如果能以10%,甚至以1%的基因進行替換,就可以治愈該疾病。”
5、靶向基因治療
基於核酸的藥物可能會對臨床治療產生某些影響,但它們在可應用的組織方面仍受到限制,大多數治療方法要么需要局部給藥,要么需要體外操作,從患者體內提取細胞,然後將其移植到患者體內。一個顯著的例子是肝臟,可以過濾血液,被證明是選擇性藥物輸送的有效靶點,在這種情況下,靜脈注射,甚至是皮下注射,均可達到該效果。
美國麻省理工學院化學工程師丹尼爾·安德森(Daniel Anderson)說:“靶向基因治療存在很大的挑戰性,僅是將藥物輸送至人體任何組織進了困難的,我們的身體是基因信息集合體,而不是接受新的基因信息。”目前研究人員在開發基因治療方面正取得穩步進展,這些方案可以幫助引導藥物進入特定器官系統,而不影響其他非靶向組織。
近年來,腺相關病毒是許多基因治療工作的首選載體,相關動物研究表明,理性選擇合適的病毒,結合組織特異性基因啟動子,可以實現高效、器官靶向治療。然而,相關病毒有時難以大規模生產,並潛在引起人體免疫反應,破壞療效或者產生身體不良反應。
脂質納米顆粒提供了一種非病毒的替代方法,之前研究人員發表的研究報告強調了脂質納米顆粒具有組織特異性送遞的潛力,例如:研究人員能快速生成和篩選識別脂質納米顆粒,使其有效在肺等器官實現靶向治療。荷蘭埃因霍溫理工大學生物醫學工程師羅伊·范德米爾(Roy van der Meel)稱,目前首次研究表明,如果對這些脂質納米顆粒進行系統篩選,並且改變它們的成分,就可以改變它們在生物體中的分佈。
6、空間多組學分析
單細胞組學的迅速發展意味著研究人員可以常規地從單個細胞中獲得遺傳、轉錄、表觀和蛋白質組學的見解,有時是同時獲取,但是單細胞技術在將細胞從原生環境中剝離過程中,也失去了關鍵信息。2016年,瑞士皇家理工學院喬基姆·倫德伯格(Joakim Lundeberg)設計了一種策略克服了該問題,他和同事使用條形碼寡核苷酸(RNA或者DNA短鏈)製作載玻片,該載玻片能從完整的組織切片中捕獲信使RNA,這樣每個轉錄RNA可以依據條形碼被分配至樣本中的特定位置,他說:“無人相信我們能從組織切片中提取全轉錄RNA分析,但事實證明,該策略非常簡單。”
此後空間轉錄組學技術倍受科學家青睞,目前已有多個商業系統進行應用,包括:10x Genomics公司推出的Visium空間基因表達平台,該平台系統基於倫德伯格的最新技術。隨著學術團隊不斷開發創新的方法,將不斷增加深度和空間分辨率來繪製基因表達。
現在研究人員正在空間地圖領域進一步疊加“分層組學見解”,例如:美國耶魯大學生物醫學工程師Rong Fan開發了一個名為DBiT-seq16的平台,該平台採用一個微流體系統,可以同時為數千個mRNA轉錄基因和數百個蛋白質標註寡核苷酸標籤抗體。
7、基於CRISPR技術的診斷
CRISPR–Cas系統技術精確切割特定核酸序列的能力源於它作為細菌“免疫系統”對抗病毒感染的作用,這種關聯性激發了早期採用該技術的科學家考慮它對病毒診斷的適用性。美國麻省理工學院布羅德研究所、哈佛大學劍橋分校遺傳學家帕爾迪斯·薩貝提(Pardis Sabeti)說:“利用它們在自然界中設計的功能非常有意義,畢竟它們已演化了數十億年。”
但並不是所有Cas酶都是一樣的,Cas9是基於CRISPR的基因組操作的首選酶,但基於CRISPR的診斷的大部分工作都使用了被稱為Cas13的RNA靶向分子家族,該分子家族是2016年由分子生物學家張峰(音譯)首次發現的。美國加州大學伯克利分校詹妮弗·杜德納(Jennifer Doudna)解釋稱,Cas13利用其RNA嚮導通過鹼基對識別RNA靶標,並激活核糖核酸酶活性,該活性通過使用報告RNA作為診斷工作進行臨床應用。據悉,她與馬克斯·普朗克病原體科學研究所艾曼紐·卡彭特(Emmanuelle Charpentier)因這項研究發現共同獲得2020年諾貝爾化學獎。這是因為Cas13不僅會切割嚮導RNA靶向的RNA,還會對附近任何其他RNA分子進行“旁系切割”。許多基於Cas13的診斷使用報告RNA,使用熒光標記抑制熒光的淬滅分子,當Cas13識別病毒RNA後被激活時,它會切斷報告RNA,並從淬滅分子中釋放熒光標記,產生可檢測信號。有些病毒留下足夠強的信號,可以在不進行擴增的情況下進行檢測,從而簡化了即時診斷。例如:2021年1月,美國加州舊金山格萊斯頓病毒學研究所演示了一種基於鼻拭子的CRISPR-Cas13快速檢測方法,可以使用手機攝像頭對新冠病毒進行無擴增檢測。
同時,RNA擴增可以提高對微量病毒序列的靈敏度,研究人員現已開發一種微流體系統,僅利用幾微升樣本中擴增出的基因物質,就能同時篩選多種病原體。現在科學家已掌握一種同時檢測21種病毒的方法,而每個樣本的成本不足10美元。此外,研究人員還開發出基於CRISPR技術的工具,可以同時檢測169種以上的人類病毒。
杜德納稱,其他Cas酶可以充實診斷工具箱,包括Cas12蛋白,它表現出與Cas13相似的特性,但其目標是DNA而不是RNA。總體而言,這些技術可以檢測範圍更廣的病原體,甚至可以有效診斷其他非傳染性疾病。(葉傾城)