OpenAI o1 pro 深評博士醫學論文,震撼頂尖免疫學家
聖誕馬拉鬆的第一天,OpenAI 對外發布了o1 pro。幾乎全網都震驚於o1 pro 高達博士級的數學、科學、程式設計能力。最近,OpenAI 總裁Greg Brockman 在X 上轉發了世界頂尖免疫學專家Derya Unutmaz 的貼文。
這位專家分享了他與o1 pro 的一次合作經歷,他讓o1 pro 批判性地評估了自己和學生寫的一篇關於一種特定免疫細胞——粘膜相關不變T 細胞(MAIT 細胞)及其在癌症中作用的綜述文章。
讓他感到震驚的是,o1 pro 在這個領域的洞察比他還要深刻——Derya 是全球為數不多的頂尖專家之一,曾經做出過一些關鍵性發現。
他也提到,雖然他曾測試過o1 和Gemini Advanced 模型,它們也都非常優秀,但與o1 pro 相比,還是差了一截。
Greg 轉發了這條長帖,並說:“推理型AI 提供了有價值的反饋和洞察,幫助全球專家解決科學問題,並有潛力改善每個人的生活品質。”
除了搞數理化很厲害,o1 pro 的人文社科能力也不差。 OpenAI 行銷研究員Kay Sorin 親自示範了o1 pro 處理人文研究的能力,其效果遠超4o 或o1。
o1 pro 震撼免疫學專家
世界頂尖免疫學專家Derya Unutmaz 將他和他學生撰寫的、關於黏膜相關恆定T(MAIT)細胞及其在癌症中的作用的綜述文章發給o1 pro,並請它進行批判性的評估。
論文地址: https://pmc.ncbi.nlm.nih.gov/articles/PMC10965779/
在看到結果之後,Derya 被o1 pro 的回饋深深震撼,認為它的洞察力比自己還要深刻。
這個說法可不簡單,畢竟他本人不僅是這個領域少數的頂尖專家之一,而且還作出過一些關鍵性的發現。
Derya 談道:「當我閱讀它的回饋時,我發現自己盯著電腦螢幕,目不轉睛,心中充滿了混合的情感:難以置信、敬畏、喜悅和深深的謙遜。它提出的每一個觀點,每一個問題,所有的一切都異常深刻!
他驚嘆道,若o3 還更出色,那又意味著什麼?生物學的進步將比他想像中的更為迅猛。 Derya 進一步指出,他曾測試過o1 和Gemini Advanced,這些模型也都非常優秀,但與o1 pro 相比,根本無法達到這種深度的洞察力。
「o1-pro 太特別了! 」
以下是o1 pro 讀完文章後給予的回饋建議。當然了,根據Derya 所說,大概只有少數具備豐富免疫學知識的人才能完全理解o1 pro 批評建議的精彩。
o1 pro 從多個維度對綜述文章進行了批判性評估。
首先,o1 pro 指出文章涉及的主題範圍過廣,雖然涵蓋了MAIT 細胞的基本生物學、在傳染病中的作用以及在癌症中的雙重效應等,但在每個方面的探討深度不夠。
例如,關於腫瘤中MAIT 細胞衰竭的部分提到了表面標記和表型,但並未深入探討導致MAIT 細胞衰竭的分子途徑、訊號事件或表觀遺傳機制。
另外,文章提到MAIT 細胞具有治療潛力,特別是在CAR-MAIT 細胞和iPSC 來源的MAIT 細胞形式下,但未充分討論轉化性障礙—— 如製造可擴展性、體內持久性以及早期臨床試驗中的安全性問題。
接著,o1 pro 指出文章在結構與概念清晰度上也有提升空間。
文章一再提到MAIT 細胞的雙重性質— 既能促進又能抑制腫瘤進展。雖然提供了多個例子,但敘述可以透過更結構化的框架加以完善,例如用一個概念模型或決策樹圖來解釋MAIT 細胞在何時、為何展現出對立的功能。
此外,關於腫瘤異質性的問題,雖然文章提到了MAIT 細胞在不同腫瘤類型中的作用差異,但並未進行系統比較,這一部分可以透過更清晰的比較分析受益。
在很多細節方面,o1 pro 指出,這篇綜述文章也沒有探討清楚。
其中提到MAIT 細胞響應微生物代謝物並可能在腫瘤微環境(TME)中衰竭,但未深入探討調控其分化、衰竭或細胞毒性的訊號路徑、轉錄因子和代謝線索。
以及頻繁提到了MR1 在腫瘤辨識中的作用,卻並未深入探討為何MR1 在某些腫瘤中上調,MR1 的表達如何與腫瘤進展相關,或在癌細胞與正常細胞中控制MR1 的調控路徑。
還有,文章列舉了各種細胞因子對腫瘤微環境的影響,但未深入討論這些細胞因子與特定臨床結果或癌症進展階段的具體關聯。
對於MAIT 細胞在不同癌症中的相互矛盾的預後數據,文裡也沒有提供批判性的視角來調和這些矛盾。
另外,儘管提到微生物組在塑造MAIT 細胞功能中的作用,卻未具體說明哪些微生物物種或代謝物與腫瘤調節密切相關,或如何透過調控微生物組來改善MAIT 細胞。
對於兩種MAIT 細胞治療策略(CAR-MAIT 細胞治療和iPSC 來源的MAIT 細胞治療)的探討,o1 pro 也給了相應的建議。
CAR-MAIT 細胞治療部分可以透過討論安全性問題(如脫靶效應、長期持久性和新型免疫病理)以及借鑒CAR-T 治療的經驗教訓(如細胞激素釋放症候群和神經毒性)來改進。
而iPSC 來源的MAIT 細胞雖然創新,但文章中未充分評估其局限性,如未完全重現原生MAIT 細胞庫、重編程過程中的潛在基因組變化,以及在臨床規模上生產這些細胞的難度。
o1 pro 也討論了綜述文章在方法學方面的不足,具體涉及文獻選擇方法和人類與動物模型的比較。
文章缺乏系統性文獻選擇方法,可能引入偏差,且未對研究文獻的篩選標準進行解釋,影響可信度。
同時,文章未討論MAIT 細胞在不同物種(如人類與小鼠)之間的生物學差異,可能會限制了讀者關注人類治療時的轉化意義。
最後,o1 pro 強調,儘管文章在結論中提到需要更多研究,但缺乏具體的方向性建議。
例如,作者可以提出關鍵實驗或突出顯示緊迫的臨床試驗,這些研究將澄清MAIT 細胞在癌症免疫治療中的作用,或詳細說明應優先開發哪些分子標靶(例如MR1 或相關信號通路)。
o1 pro 還能搞人文研究
在人文研究方面,o1 pro 也有了大顯身手的機會。
Kay Sorin 的這位朋友是著名出版社的記者,但一直以來非常抗拒AI 為工作提供幫助的建議。
目前,他在撰寫一本需要複雜歷史研究的傳記時,遇到了一個困難—— 無法從資料中,找出名為Jonathan 這位默默無聞作家的姓氏。而且,這些文件沒有任何識別信息,更像是感謝信和便條之類的東西。
由此,Kay Sorin 決定嘗試提供協助。
她上傳了4 張圖片給GPT-4o,並問道「這位Jonathan 在1980 年代是《紐約書評》的作家和知識分子。他的姓是什麼」?
GPT-4o 思考了52 秒,給予答案:
抱歉,我在這些信件或圖片中沒有看到任何能夠透露Jonathan 姓氏的資訊。這裡展示的摘錄和筆記從未提到他的姓氏,所以我沒有足夠的資訊來確定他是誰。
接下來,她又將同樣提示丟給o1 pro,在思考了1 分57 秒後,它找到了全名「Jonathan Lieberson」。
Kay Sorin 朋友對此感到非常驚訝,並再次問o1 pro,「你是找到更多關於Jonathan 的消息來源」? o1 pro 給了幾段解釋,並提出了連記者本人都沒有想到的建議。
o1 pro 在STEM 領域的表現,已經屢見不鮮,這也是它在人文領域很好的證明。
來源:新智元