OpenAI總裁Greg:需要AGI治療妻子綜合性罕見疾病谷歌醫療AI已有重大突破
我們為什麼需要AGI?很多人可能沒有仔細思考過這個問題,只看到了結果。部分人認為,科技進步就應該無條件推進。至於原因為何,可能並沒有加以深思。也許追問到最後,也只是得出一個讓我們的生活更便利的結論。而究竟在哪些方面提供了何種便捷,可能也沒辦法說那麼完善。事實上這種思路也不能說錯。
畢竟,有些事是先有動力驅使,再去逐漸實現。有些事是先做到了,再看看能幫我們什麼。
今天我們提供大家一個現實脈絡下的切入點,來看看AGI究竟能幫到我們什麼。
最全面的醫生
首先我們來介紹一個人,Greg Brockman。
熟悉AI圈的朋友應該對他都不陌生,他是OpenAI的共同創辦人+總裁。
2010年到2015年,他在Stripe任職CTO。之後到今天,他一直是OpenAI的總裁。
不過今天要講的是他的妻子,Anna Brockman。
2019年,他們兩人結婚,美滿的婚姻背後,是他妻子不可忽視的身體狀況。
在最近的一篇推文中,Greg寫道:「在經歷了長達五年的身體多系統疼痛之後,我的妻子最近被診斷出患有一種名為過度活動型埃勒斯-當洛斯綜合徵(hEDS)的遺傳性疾病。”
要知道,hEDS是一種遺傳性結締組織疾病,會導致全身關節過度活動、關節不穩定和慢性疼痛。
同時hEDS也伴隨各種其他症狀和相關病症,影響身體許多不同的部位。
而Greg的妻子是之前當了快六年的演員,目前的職業還是名健身教練。可想而知這個病會帶給她多大的痛苦。
從這個病的介紹來看,這是一個綜合性的疾病。牽涉到全身很多系統,如骨科、心臟科、神經科、腸胃科、皮膚科等等。
Greg在Twitter中表示,目前的醫療體係都是針對各專科建立的。hEDS要看的醫生可太多了。
「五年來,我們看了比Anna之前一生還要多的醫生和各種專科醫生。大部分醫生只聚焦於自己所熟悉的領域,而並沒有能把這些碎片化的信息整合在一起。”
後來,Anna的一位專精過敏的大夫細緻聽取了她的所有症狀和存在的問題,把有關她身體狀況的細節都拼湊在了一起。
Greg表示,隨著人類醫學的進步,我們似乎有一種趨勢,那就是以犧牲廣度為代價來增加醫生的深度。但對病人來說,我們需要的是足夠的廣度和足夠的深度,二者缺一不可。
最理想的情況是,未來我們可以把這種全面的醫療服務變得口袋化,就好像一個集結了眾多科室的醫生組成的專家小組,共同為我們的身體健康保駕護航。
而這正是需要AGI出場的地方了。
Greg最後在Twitter中表示,雖然在技術方面還有很長的路要走,AGI要學習如何在像醫療這樣的高風險領域將其與人類專家的監督結合起來,如何一起部署,但前景已經越來越明朗。
透過技術開發人員、醫療保健提供者、政府和社會的通力合作,未來人們有希望為所有家庭成員提供更好的醫療保健服務。
不少網友也是跟帖發表了自己的看法。
Bacarella表示,如果醫療AI即使能像平均水平的醫生那樣聰明,同時又像GPT4那樣有耐心、專注,還懂得多,那估計行,未來將會有很大的改變。
Paul也認為,AI發展到一定階段,就一定可以把醫學上的新診療手段推而廣之,讓普羅大眾都能接觸到各種醫療技術。
而這可能是AI最該投身的領域了。
谷歌的嘗試
要知道,Greg的想法先前曾被Google印證過。
美國哈佛大學、史丹佛大學、耶魯醫學院、加拿大多倫多大學等多所頂尖高校、醫療機構的研究人員在Nature上聯合提出了一種全新的醫學人工智慧範式,即“全科醫學人工智慧”,可以靈活地編碼、整合和大規模解釋醫學領域的多模態數據,如文字、影像、基因組學等。
而GoogleResearch和GoogleDeepMind也曾共同發布論文,對全科醫學人工智慧概念進行了實現、驗證。
研究人員首先策劃了一個全新的多模態生物醫學基準資料集MultiMedBench,包含100多萬個樣本,涉及14個任務,如醫療問題回答、乳房和皮膚科圖像解讀、放射學報告生成和總結以及基因組變異識別。接著提出了一個新模型Med-PaLM Multimodal(Med-PaLM M),驗證了通用生物醫學人工智慧系統的可行性。
這是一個大型多模態生成模型,僅用一組模型權重就可以靈活地編碼和解釋生物醫學數據,包括臨床語言、影像和基因組學數據。在所有MultiMedBench任務中,Med-PaLM M的性能都與最先進的技術相差無幾,在部分任務上甚至超越了專用的SOTA模型。
文中也報告了該模型在零樣本學習下可以泛化到新的醫學概念和任務、跨任務遷移學習以及湧現出的零樣本醫學推理能力。
文中也進一步探討了Med-PaLM M的能力和局限性,研究人員對比了模型生成的及人類編寫的胸部X光報告進行了放射科醫師評估,在246份病例中,臨床醫生認為Med-PaLM M的報告在40.5%的樣本中比放射科醫生寫的要更好,也顯示Med-PaLM M具有潛在的臨床實用性。
為了訓練和評估大模型在執行各種臨床相關任務的能力,Google的研究人員收集了一個多任務、多模態的全科醫療基準資料集MultiMedBench。
此基準由12個開源資料集以及14個獨立任務組成,包含100多萬個樣本,涵蓋了醫療問答、放射學報告、病理學、皮膚病學、胸部X光、乳房X光和基因組學等多個領域。
而之後沒多久,Google又繼續推出了Med-PaLM 2,第二代產品。
它是Med-PaLM的繼任者,它要比其前身更強大,在USMLE樣式的問題上達到了86.5% 的準確率,提高了19%。
Med-PaLM 2是在海量醫學文本和代碼資料集(包括醫學期刊、臨床試驗和教科書)上進行訓練的。這使它能以高準確度理解和產生醫學語言。
不僅如此,Med-PaLM 2還能根據醫學知識進行推理與推論。
有專家分析,Med-PaLM 2有可能在多個方面徹底改變醫療保健。比如說:
·提高診斷的準確性:Med-PaLM 2可以幫助醫生綜合考慮患者的所有醫療信息,包括症狀、病史和檢查結果,為患者確定正確的診斷。
·提高效率:Med-PaLM 2可以幫助醫生自動完成總結病歷和從研究論文中找到相關資訊等任務。這可以讓醫生騰出更多時間與病人溝通。
·改善溝通:Med-PaLM 2可以幫助醫生以簡單易懂的方式向病人傳達複雜的醫療訊息。這可以幫助病人對自己的治療做出明智的決定。
·降低成本:Med-PaLM 2可以透過自動化任務和提高效率來降低醫療成本。
目前,Google的Med-PaLM 2仍在開發中,但它有可能對醫療保健產業產生重大影響。
不過,說到Google還是得再提一句前兩天才剛出爐的醫學對話AI——AMIE,而且還直接通過了圖靈測試!?
到目前為止,Google還在積極地進行測試,努力使它在未來得到更廣泛的應用。
不知道像Google的這類產品,以及未來可能出現的其它醫療AI,甚至醫療AGI,能不能解決Greg的問題。