從程式碼到化學:掌握諾貝爾獲獎反應的人工智慧系統“Coscientist”
卡內基美隆大學開發的人工智慧”科學家”(Coscientist)已經自主掌握並執行了複雜的諾貝爾化學獎獲獎反應,在提高科學發現和實驗精度方面展現出巨大潛力。它控制實驗室機器人的能力標誌著人工智慧輔助研究領域的一大躍進。
一個基於人工智慧的系統成功地規劃和執行了真實世界的化學實驗,顯示出幫助人類科學家更快獲得更多發現的潛力。
在比你讀完這篇文章還短的時間內,一個人工智慧驅動的系統就能自主地了解某些諾貝爾化學獎得主的化學反應,並設計出一個成功的實驗室程式來進行這些反應。人工智慧在短短幾分鐘內就完成了所有這些工作,而且一試即中。
卡內基美隆大學化學家兼化學工程師加布-戈麥斯(Gabe Gomes)說:”這是第一次由非有機智能規劃、設計和執行這種由人類發明的複雜反應。他領導的研究團隊組裝並測試了基於人工智慧的系統。”
他們將自己的成果命名為”Coscientist”。Coscientist 所完成的最複雜的反應在有機化學中被稱為鈀催化交叉偶聯反應,它的人類發明者因此獲得了2010 年諾貝爾化學獎,以表彰這些反應在醫藥開發過程和其他使用棘手的碳基分子的產業中發揮的巨大作用。
Coscientist在《自然》(Nature)雜誌上發表的論文表明,人類有可能有效地利用人工智慧來加快科學發現的速度和數量,並提高實驗結果的可複製性和可靠性。這個四人研究小組包括博士生丹尼爾-博伊科(Daniil Boiko)和羅伯特-麥克奈特(Robert MacKnight),他們分別從西北大學美國國家科學基金會化學酶合成中心和聖母大學美國國家科學基金會電腦輔助合成中心獲得了支援和培訓。
人工智慧化學研究的藝術家概念圖。這項工作由卡內基美隆大學的加布-戈麥斯(Gabe Gomes)領導,並得到了美國國家科學基金會化學創新中心的支持。資料來源:美國國家科學基金會
“除了他們的系統所展示的化學合成任務之外,戈麥斯和他的團隊還成功合成了一種超高效的實驗室夥伴,”美國國家科學基金會化學部主任大衛-伯科威茨(David Berkowitz)說。”他們把所有部件組合在一起,最終的結果遠遠超出了各部分的總和–它可以用於真正有用的科學目的。”
Coscientist 的誕生
在Coscientist 的軟體和矽基元件中,最重要的是構成其人工”大腦”的大型語言模型。大型語言模型是一種人工智慧,可以從大量資料(包括文件中的書面文字)中提取意義和模式。透過一系列任務,團隊測試並比較了多個大型語言模型,包括GPT-4 和OpenAI 公司生產的其他版本的GPT 大型語言模型。
Coscientist 還配備了幾個不同的軟體模組,團隊首先對它們進行了單獨測試,然後又對它們進行了聯合測試。
“我們試圖將科學領域所有可能的任務分割成小塊,然後逐塊構建大圖,”設計Coscientist 總體架構和實驗任務的Boiko 說。”最後,我們把所有東西都整合到了一起。”
這些軟體模組讓Coscientist 能夠做所有研究化學家都會做的事情:搜尋有關化合物的公共信息,查找並閱讀有關如何控制機器人實驗設備的技術手冊,編寫計算機代碼以進行實驗,分析所得數據以確定哪些有效,哪些無效。
其中一項測試考察了Coscientist 準確規劃化學程序的能力,這些程序一旦執行,就會產生阿斯匹靈、對乙醯氨基酚和布洛芬等常用物質。對大型語言模型進行了單獨測試和比較,包括兩個版本的GPT,其中一個軟體模組允許它像人類化學家一樣使用Google在網路上搜尋資訊。然後,根據是否能得到所需的物質、步驟的詳細程度以及其他因素,對所得的程序進行檢查和評分。其中,支援搜尋的GPT-4 模組得分最高,它是唯一一個為合成布洛芬創建了可接受品質程式的模組。
Boiko 和MacKnight 觀察到Coscientist 演示了”化學推理”,Boiko 將其描述為使用化學相關資訊和先前獲得的知識來指導自己行動的能力。它使用了以簡化分子輸入行輸入系統(SMILES)格式編碼的公開化學資訊–這是一種表示分子化學結構的機器可讀符號–並根據SMILES 資料中仔細研究的分子的特定部分對實驗計劃進行了修改。這是化學推理的最佳版本。
進一步的測試包括軟體模組,允許Coscientist 搜尋和使用描述控制機器人實驗室設備的應用程式介面的技術文件。這些測試對於確定Coscientist 能否將其合成化合物的理論計劃轉化為電腦程式碼,從而在物理世界中指導實驗室機器人非常重要。
在實驗中引入機器人技術
實驗室通常使用高科技機器人化學設備,對微小的液體樣本進行吸入、噴出、加熱、搖動等操作,並精確地反覆進行。這些機器人通常由人類化學家編寫電腦程式碼進行控制,這些化學家可能在同一個實驗室,也可能在國家的另一端。
這是第一次用人工智慧編寫的電腦程式碼來控制這種機器人。
研究團隊在Coscientist 下達了一些簡單的任務,要求它讓機器人液體處理機將彩色液體分配到一個包含96 個小孔的平板上。他們告訴它”每隔一條線塗上你選擇的一種顏色”、”畫一條藍色對角線”,以及其他讓人想起幼兒園的作業。
從”液體處理機101″畢業後,團隊讓Coscientist 接觸了更多類型的機器人設備。他們與翡翠雲實驗室(Emerald Cloud Lab)合作,該實驗室是一個商業設施,裡面擺滿了各種自動化儀器,包括分光光度計,可以測量化學樣本吸收光的波長。然後,向Coscientist 展示了一個裝有三種不同顏色(紅、黃、藍)液體的盤子,要求他判斷盤子裡有哪些顏色以及這些顏色在盤子裡的位置。
由於Coscientist 沒有眼睛,因此它編寫了程式碼,以機器人的方式將神秘的色板遞給分光光度計,並分析每個孔吸收的光波長,從而確定色板上有哪些顏色及其位置。為了完成這項任務,研究人員不得不給Coscientist 一點正確的提示,讓它思考不同顏色是如何吸收光線的。剩下的就交給人工智慧了。
Coscientist 的期末考是將組裝好的模組和訓練整合在一起,完成團隊的指令,”執行鈴木和薗頭耦合反應”。這兩個反應發現於20 世紀70 年代,利用金屬鈀催化有機分子中碳原子之間的鍵結。事實證明,這種反應在生產治療發炎、氣喘和其他疾病的新型藥物方面非常有用。它們也被用於許多智慧型手機和顯示器中有機發光二極體的有機半導體中。2010 年,蘇古茲、理查德-海克和根岸英一共同獲得諾貝爾獎,正式肯定了這些突破性反應及其廣泛影響。
當然,Coscientist 公司之前從未嘗試過這些反應。因此,筆者在撰寫前文時,特意去維基百科上查了一下。
麥克奈特說:”對我來說,’尤里卡’時刻就是看到它提出了所有正確的問題。”麥克奈特設計了允許Coscientist 搜索技術文檔的軟體模組。
Coscientist 主要在維基百科以及其他許多網站上尋找答案,其中包括美國化學學會、英國皇家化學學會的網站,以及其他包含描述鈴木和薗頭耦合反應的學術論文的網站。
在不到四分鐘的時間裡,Coscientist 就利用團隊提供的化學物質設計出了產生所需反應的精確程序。當它試圖用機器人在物理世界中執行程序時,它編寫的控制液體樣品加熱和搖動裝置的程式碼出現了錯誤。在沒有人類提示的情況下,Coscientist 發現了問題所在,並查閱了設備的技術手冊,修改了程式碼,然後再次嘗試。
結果就出現在幾個微小的透明液體樣本中。博伊科對樣本進行了分析,發現了鈴木反應和薗頭耦合反應的光譜特徵。
當博伊科和麥克奈特告訴戈麥斯Coscientist 的研究成果時,戈麥斯感到難以置信。”我以為他們在耍我,”他回憶道。「但他們沒有。他們絕對沒有。就在那時,我突然意識到,我們這裡有一種非常新穎、非常強大的東西。”
有了這種潛在的力量,就需要明智地使用它,並防止濫用。戈麥斯說,了解人工智慧的能力和限制是製定知情規則和政策的第一步,這些規則和政策可以有效防止人工智慧的有害使用,無論是有意還是無意。他說:”我們需要對如何部署這些技術負責並深思熟慮。”
戈麥斯是為美國政府確保安全使用人工智慧的努力提供專家建議和指導的幾位研究人員之一,例如拜登政府於2023年10月發布的關於人工智慧發展的行政命令。
加速發現,實現科學民主化
自然世界的規模和複雜程度幾乎是無限的,其中蘊藏著難以計數的發現,等待著我們去發現。試想一下,新的超導材料可以大幅提高能源效率,新的化合物可以治癒原本無法治癒的疾病,延長人類壽命。然而,獲得實現這些突破所需的教育和培訓是一個漫長而艱辛的旅程。成為科學家很難。
戈麥斯和他的團隊將Coscientist 這樣的人工智慧輔助系統視為一種解決方案,它可以彌合尚未開發的浩瀚自然與訓練有素的科學家供不應求這一事實之間的差距,而且可能永遠如此。
人類科學家也有人類的需求,例如睡覺和偶爾走出實驗室。而由人類指導的人工智慧可以全天候地”思考”,有條不紊地翻閱每一塊箴言石,檢查並重新檢查實驗結果的可複制性。”我們可以讓一些東西自主運行,試圖發現新現象、新反應、新想法,」戈麥斯說。
“你還可以大大降低任何領域的入門門檻,”他說。例如,如果一個沒有受過鈴木反應訓練的生物學家想探索鈴木反應的新用途,他們可以請Coscientist 幫助他們規劃實驗,這可以實現資源和理解的大規模民主化。
戈麥斯說,科學中存在著一個嘗試、失敗、學習和改進的迭代過程,而人工智慧可以大大加快這個過程。”這本身就是一個巨大的變化”。
編譯來源:ScitechDaily