這位上海醫生帶頭搞的AI 要讓癌症診斷進入好時代了
不知道大夥們還記得,那名用50 張1080 TI 顯示卡對抗癌症的「 業餘」程式設計師不。他曾自掏腰包訓練了個AI ,還整了個免費的網站,讓人工智幫你“ 看片子”,能快速診斷出乳腺癌。當時負評君就在暢想,未來,AI 技術在醫學領域,鐵定能濺起不小的水花兒。但誰也沒想到,這未來來得實在有些快,而且比起水花,AI 掀起的更像是大浪。
這不在前不久,醫學頂刊Nature Medicine 上就登了一篇論文,說是用AI 大模型+ 簡單的平掃CT ,就可能大規模地篩檢出早期胰腺癌了。
這消息,直接就在醫學圈兒炸開了。
Nature Medicine 就罕見地附帶了一篇評論文章,標題是這樣的:在AI 加持下的醫療影像,即將迎來黃金時代。
各大媒體也都爭相報道, “ 突破難題”“ 人類首次” 等讚美之詞毫不吝嗇。
而如果用一句話,來形容這技術的含金量的話。
差評君覺得比較貼切的是:放在過去,這事兒想都不敢想。
這麼說吧,這次的大反派“ 胰腺癌” ,在所有癌症裡有個可怕的名字—— “ 癌症之王” 。
只要確診胰臟癌,幾乎就是被判了死刑,近90% 的人在確診胰臟癌後,活不過5 年,這在癌症裡算是一個相當可怕的數字了。
好多名人像吳尊友、帕瓦羅蒂等都是因為胰臟癌過世的。
死亡率這麼高的原因,在於胰臟癌早期太難被發現了,一旦發現,大機率就是晚期。
因為胰臟這玩意兒,位置非常隱蔽,藏在胃後面,被十二指腸、脾臟和肝臟等器官包圍住了。
而我們一般會去醫院體檢的項目,像超音波、平掃CT 等等這些,很難發現早期胰臟癌的特徵。
當然,增強CT 或者是增強核磁共振,能把胰臟看得更清楚些。
但胰臟癌的發生率其實並不高,在所有癌種中只排在十名外。
所以考慮到輻射、醫療資源擠兌等問題……為了胰腺,每個人每年都去做增強CT 或增強核磁共振,其實劃不來。
基本上只有病人發現了異樣,才會去做這些項目。
但在症狀上想發現早期胰臟癌,也很難行得通。
前期患者們的症狀一般是噁心、嘔吐、身體虛弱等,這和普通生病的症狀沒啥兩樣,醫生們很容易就會被「 忽悠」 。
而癌症會影響胰臟功能,早期胰臟癌還很可能偽裝成糖尿病…
於是在影像+ 症狀雙重Debuff的情況下,想大規模篩檢早期的胰臟癌就變成了一件難上加難的事。
所以這些年來,醫學界為了能早點發現胰臟癌,可脫了不少發、禿了不少聰明腦瓜,但最後的成果呢,寥寥無幾。
前幾年,業界還有個很紅的滴血驗癌( ctDNA ),一度被大家看好,它是從病人的血液裡找有沒有癌症的碎片。
但這個方法,同樣也很難發現癌症一期、二期的血液碎片,到現在快十年過去了,依舊沒啥進展。
而這次,研究者們想到了用AI 大模型,來解這題。
負評君也去到Nature Medicine 官網上,翻了翻論文原文,有一說一,它還真有可能在早篩胰腺癌這塊豁出個口子。
這次,他們整出了個名叫PANDA( pancreatic cancer detection , with artificial intelligence )的AI 大模型,根據簡單的平掃CT 圖像,它就能做出胰腺癌相關的診斷。
這麼說吧,在臨床驗證中,研究團隊試驗了兩萬多個病例, PANDA 幾乎就沒咋漏診,99.9%有胰臟癌的都給診斷出來了。
偶爾有些誤診,也都是很容易排除的病變,像什麼脂肪浸潤、胃腸內容物等,醫師簡單審核下就能排除掉。
而用AI 這點子,最早是上海市胰臟疾病研究所的曹凱醫生( 也是這篇論文的共同第一作者)想到的。
在他身上還有這麼一小段故事,在大學期間,曹凱的實習導師也因胰臟癌過世,和許多病人一樣,他在確診的時候就已經是晚期了。
不過後來他在整理導師的病例資料時發現,在確診十個月前,導師就曾做過一次平掃CT 。
雖然當時沒發現什麼苗頭,但帶著結論回過頭來分析,就能隱約看到到胰臟那裡有病變的跡象。
在這樣一個契機下,曹凱就想,既然人眼很難辨識到平掃CT 影像裡,早期胰臟癌病變的跡象,那不如借助AI 幫醫師先篩檢一次。
後來,他遇到了達摩院醫療AI 團隊負責人呂樂,他們兩個在這塊不謀而合,這才有了現在的PANDA 模式。
PANDA 幫忙篩檢胰臟癌的過程說起來也很簡單,跟醫生看片子也沒啥兩樣。
不過它憑藉著強大的演算法,注意到的細節比醫師肉眼看到的多得多,自然也能順利找到疑似病變的地方。
但要練好這麼一個AI ,可不是動動嘴皮那麼容易的事。
它不像語言模型出錯了打個哈哈就能過去, PANDA 對準確性的要求非常高。
而判斷它看病好不好,還有兩個維度,一個是特異性,一個是敏感性。
要是特異性高了,就很容易漏診,敏感度高了,又會誤診。
而調這個漏診、誤診的「 天平」 ,歸根究底,還得看餵給模型的資料集和訓練模型的方法。
先是資料集,都說寵物毛髮順不順還得看主人餵什麼,在訓練模型上也是同樣的道理。
這塊研究團隊是下了血本,他們召集了來自各個醫院的48 個醫生,總共收集了3000 個病人的腹部CT 影像。
其中有大概2200 多個胰臟癌患者,和將近1000 個非胰臟癌的病人。
這3000 個病人的數據,都是醫生自己一個個手動標註的。
而且因為平掃CT 圖的對比太低,手動標註不太現實,所以他們都是在患者的增強CT 圖上標註。
標註的過程也是相當專業,醫生們要勾勒每一層CT 圖上腫瘤的二維影像,每張有十多二十層,非專業人士是一點都乾不了。
畫出來的十多張二維影像,疊起來差不多就是整個腫瘤的立體圖。
要餵的資料準備好了,接下來就是選擇模型+ 訓練。
研究團隊先搞了個配準演算法,把之前標示的增強CT 資料移轉到平掃CT 圖上,讓AI學會看平掃的CT 影像。
後面,就是重頭戲了,雖說在醫學領域3000 個數據已經算是相當多了,但對於深度學習來說這些量就是中規中矩。
所以他們只好在模型演算法上更下功夫,好找補回來一些。
根據達摩院團隊的張靈介紹,在選擇模型的時候,他們團隊先先後後試了好多種技術路線,最後搞出了一個「 混合版」 的模型,集分割、檢測和分類功能於一身。
而且這三個功能還不是各幹各的,而是層層遞進、環環相扣。
就拿正常的一套完整的檢測流程舉例。
PANDA 拿到平掃CT 圖之後,先用分割功能在整張影像中找到胰臟的位置。
找到胰臟後,再啟動偵測功能,去看胰臟裡有沒有啥不對勁的地方。
要是找到有異常的地方,就用第三步驟的分類功能,去辨識這情況屬於哪一種胰臟病變。
靠著這套模型和演算法, PANDA 也開始在臨床試驗中,不斷迭代更新。
這個過程就是個典型的「 出錯—回饋—糾錯」 的循環了,前前後後研究團隊大概花了一年的時間。
演算法修正倒不是什麼大問題,比較麻煩的是前期的回饋:要怎麼修改這個AI …
就拿期間的一個例子來說, PANDA 有時會把脂肪浸潤的情況檢測出來。
光是這個情況,研究團隊就和醫生們討論了三個月,要不要讓它這麼“ 敏感” ,糾結了幾次最後才斃掉了。
當然,雖說PANDA 的準確性已經相當高了,但在實際的檢測過程中,它只能起到一個初篩的作用。
它把醫生們看不到的病變找出來後,還是得讓醫生們再次把關,確保沒有誤診啥的。
去年PANDA 模式已經成功上線,有些醫院以及體檢中心已經在用這個AI 幫忙篩檢了。
根據張靈的說法,到目前為止,他們已經用PANDA 模型幫忙篩檢了超過了50 萬人。
而且這裡面,也成功發現並救治了兩個臨床漏診的胰臟癌患者。
其中有一個男人,每年都會去醫院的體檢中心定期體檢,當時他在體檢時並沒發現任何異常。
結果七個月後,在PANDA 進行臨床試驗的時候,他的CT 圖被檢測出了有95% 的機率是胰臟神經內分泌腫瘤。
後來,醫院直接找他,用增強磁振造影檢查了一通,發現PANDA 還真沒判斷失誤。
幸好腫瘤還在早期,早早手術割了,後續檢查時也沒再復發。
現在,研究團隊也還沒停下來,他們還想進一步拓寬PANDA 的篩檢範圍。
張靈透露道,眼下在考慮的,是要不要把囊腫加到PANDA 的檢測範圍內。
在未來,他們還打算把更多的癌症、甚至慢性病都納入進來,讓大家只要在體檢的時候做一次平掃CT ,醫生透過AI 輔助,就能看出這些疾病的苗頭。
或許有一天,在這個AI 的協助下,所有的癌症,都能透過一次簡單的平掃CT 在早期被發現…
最後,我覺得穆克吉寫的《 重病之王· 癌症傳》中的一段話,還挺應景的:
為了追上疾病的步伐( 癌症),人類一而再、再而三地創造、學習新知識,揚棄舊策略。我們執著地與癌症抗爭,時而精明,時而絕望,時而誇張,時而猛烈,時而瘋狂,時而凜然。這場戰爭,人類已經持續了數千年。
而負評君也希望,在這次AI 開闢的「 新戰場」 上,人類可以徹底降伏癌症這頭猛獸。