這位上海醫生帶頭搞的AI 要讓癌症診斷進入好時代了
不知道大夥們還記得,那名用50 張1080 TI 顯示卡對抗癌症的「 業餘」程式設計師不。他曾自掏腰包訓練了個AI ,還整了個免費的網站,讓人工智幫你“ 看片子”,能快速診斷出乳腺癌。當時負評君就在暢想,未來,AI 技術在醫學領域,鐵定能濺起不小的水花兒。但誰也沒想到,這未來來得實在有些快,而且比起水花,AI 掀起的更像是大浪。
![](https://i0.wp.com/static.cnbetacdn.com/article/2023/1205/fb3fb0b6ed312af.webp?w=640&ssl=1)
這不在前不久,醫學頂刊Nature Medicine 上就登了一篇論文,說是用AI 大模型+ 簡單的平掃CT ,就可能大規模地篩檢出早期胰腺癌了。
這消息,直接就在醫學圈兒炸開了。
Nature Medicine 就罕見地附帶了一篇評論文章,標題是這樣的:在AI 加持下的醫療影像,即將迎來黃金時代。
![](https://i0.wp.com/static.cnbetacdn.com/article/2023/1205/1b37ab26a98cd04.webp?w=640&ssl=1)
各大媒體也都爭相報道, “ 突破難題”“ 人類首次” 等讚美之詞毫不吝嗇。
而如果用一句話,來形容這技術的含金量的話。
差評君覺得比較貼切的是:放在過去,這事兒想都不敢想。
![](https://i0.wp.com/static.cnbetacdn.com/article/2023/1205/f53a4da70f73020.webp?w=640&ssl=1)
這麼說吧,這次的大反派“ 胰腺癌” ,在所有癌症裡有個可怕的名字—— “ 癌症之王” 。
只要確診胰臟癌,幾乎就是被判了死刑,近90% 的人在確診胰臟癌後,活不過5 年,這在癌症裡算是一個相當可怕的數字了。
好多名人像吳尊友、帕瓦羅蒂等都是因為胰臟癌過世的。
死亡率這麼高的原因,在於胰臟癌早期太難被發現了,一旦發現,大機率就是晚期。
因為胰臟這玩意兒,位置非常隱蔽,藏在胃後面,被十二指腸、脾臟和肝臟等器官包圍住了。
![](https://i0.wp.com/static.cnbetacdn.com/article/2023/1205/5ed6192335dd4b4.webp?w=640&ssl=1)
而我們一般會去醫院體檢的項目,像超音波、平掃CT 等等這些,很難發現早期胰臟癌的特徵。
當然,增強CT 或者是增強核磁共振,能把胰臟看得更清楚些。
但胰臟癌的發生率其實並不高,在所有癌種中只排在十名外。
所以考慮到輻射、醫療資源擠兌等問題……為了胰腺,每個人每年都去做增強CT 或增強核磁共振,其實劃不來。
![](https://i0.wp.com/static.cnbetacdn.com/article/2023/1205/0ddb09a4eb0d560.webp?w=640&ssl=1)
基本上只有病人發現了異樣,才會去做這些項目。
但在症狀上想發現早期胰臟癌,也很難行得通。
前期患者們的症狀一般是噁心、嘔吐、身體虛弱等,這和普通生病的症狀沒啥兩樣,醫生們很容易就會被「 忽悠」 。
而癌症會影響胰臟功能,早期胰臟癌還很可能偽裝成糖尿病…
於是在影像+ 症狀雙重Debuff的情況下,想大規模篩檢早期的胰臟癌就變成了一件難上加難的事。
![](https://i0.wp.com/static.cnbetacdn.com/article/2023/1205/2401e0d7f6f44e4.webp?w=640&ssl=1)
所以這些年來,醫學界為了能早點發現胰臟癌,可脫了不少發、禿了不少聰明腦瓜,但最後的成果呢,寥寥無幾。
前幾年,業界還有個很紅的滴血驗癌( ctDNA ),一度被大家看好,它是從病人的血液裡找有沒有癌症的碎片。
但這個方法,同樣也很難發現癌症一期、二期的血液碎片,到現在快十年過去了,依舊沒啥進展。
![](https://i0.wp.com/static.cnbetacdn.com/article/2023/1205/49167fc6e984f86.webp?w=640&ssl=1)
而這次,研究者們想到了用AI 大模型,來解這題。
負評君也去到Nature Medicine 官網上,翻了翻論文原文,有一說一,它還真有可能在早篩胰腺癌這塊豁出個口子。
![](https://i0.wp.com/static.cnbetacdn.com/article/2023/1205/370b270e4e16d91.webp?w=640&ssl=1)
這次,他們整出了個名叫PANDA( pancreatic cancer detection , with artificial intelligence )的AI 大模型,根據簡單的平掃CT 圖像,它就能做出胰腺癌相關的診斷。
這麼說吧,在臨床驗證中,研究團隊試驗了兩萬多個病例, PANDA 幾乎就沒咋漏診,99.9%有胰臟癌的都給診斷出來了。
偶爾有些誤診,也都是很容易排除的病變,像什麼脂肪浸潤、胃腸內容物等,醫師簡單審核下就能排除掉。
而用AI 這點子,最早是上海市胰臟疾病研究所的曹凱醫生( 也是這篇論文的共同第一作者)想到的。
在他身上還有這麼一小段故事,在大學期間,曹凱的實習導師也因胰臟癌過世,和許多病人一樣,他在確診的時候就已經是晚期了。
![](https://i0.wp.com/static.cnbetacdn.com/article/2023/1205/6644462619b17b4.webp?w=640&ssl=1)
不過後來他在整理導師的病例資料時發現,在確診十個月前,導師就曾做過一次平掃CT 。
雖然當時沒發現什麼苗頭,但帶著結論回過頭來分析,就能隱約看到到胰臟那裡有病變的跡象。
在這樣一個契機下,曹凱就想,既然人眼很難辨識到平掃CT 影像裡,早期胰臟癌病變的跡象,那不如借助AI 幫醫師先篩檢一次。
後來,他遇到了達摩院醫療AI 團隊負責人呂樂,他們兩個在這塊不謀而合,這才有了現在的PANDA 模式。
PANDA 幫忙篩檢胰臟癌的過程說起來也很簡單,跟醫生看片子也沒啥兩樣。
不過它憑藉著強大的演算法,注意到的細節比醫師肉眼看到的多得多,自然也能順利找到疑似病變的地方。
但要練好這麼一個AI ,可不是動動嘴皮那麼容易的事。
![](https://i0.wp.com/static.cnbetacdn.com/article/2023/1205/73f3bfec85bbe6a.webp?w=640&ssl=1)
它不像語言模型出錯了打個哈哈就能過去, PANDA 對準確性的要求非常高。
而判斷它看病好不好,還有兩個維度,一個是特異性,一個是敏感性。
要是特異性高了,就很容易漏診,敏感度高了,又會誤診。
而調這個漏診、誤診的「 天平」 ,歸根究底,還得看餵給模型的資料集和訓練模型的方法。
先是資料集,都說寵物毛髮順不順還得看主人餵什麼,在訓練模型上也是同樣的道理。
這塊研究團隊是下了血本,他們召集了來自各個醫院的48 個醫生,總共收集了3000 個病人的腹部CT 影像。
![](https://i0.wp.com/static.cnbetacdn.com/article/2023/1205/addd9d9b34d164a.webp?w=640&ssl=1)
其中有大概2200 多個胰臟癌患者,和將近1000 個非胰臟癌的病人。
這3000 個病人的數據,都是醫生自己一個個手動標註的。
而且因為平掃CT 圖的對比太低,手動標註不太現實,所以他們都是在患者的增強CT 圖上標註。
標註的過程也是相當專業,醫生們要勾勒每一層CT 圖上腫瘤的二維影像,每張有十多二十層,非專業人士是一點都乾不了。
畫出來的十多張二維影像,疊起來差不多就是整個腫瘤的立體圖。
![](https://i0.wp.com/static.cnbetacdn.com/article/2023/1205/c25db9bba5110d6.webp?w=640&ssl=1)
要餵的資料準備好了,接下來就是選擇模型+ 訓練。
研究團隊先搞了個配準演算法,把之前標示的增強CT 資料移轉到平掃CT 圖上,讓AI學會看平掃的CT 影像。
後面,就是重頭戲了,雖說在醫學領域3000 個數據已經算是相當多了,但對於深度學習來說這些量就是中規中矩。
所以他們只好在模型演算法上更下功夫,好找補回來一些。
根據達摩院團隊的張靈介紹,在選擇模型的時候,他們團隊先先後後試了好多種技術路線,最後搞出了一個「 混合版」 的模型,集分割、檢測和分類功能於一身。
![](https://i0.wp.com/static.cnbetacdn.com/article/2023/1205/7a980f90742249d.webp?w=640&ssl=1)
而且這三個功能還不是各幹各的,而是層層遞進、環環相扣。
就拿正常的一套完整的檢測流程舉例。
PANDA 拿到平掃CT 圖之後,先用分割功能在整張影像中找到胰臟的位置。
找到胰臟後,再啟動偵測功能,去看胰臟裡有沒有啥不對勁的地方。
要是找到有異常的地方,就用第三步驟的分類功能,去辨識這情況屬於哪一種胰臟病變。
![](https://i0.wp.com/static.cnbetacdn.com/article/2023/1205/787eb4f5934bbb9.webp?w=640&ssl=1)
靠著這套模型和演算法, PANDA 也開始在臨床試驗中,不斷迭代更新。
這個過程就是個典型的「 出錯—回饋—糾錯」 的循環了,前前後後研究團隊大概花了一年的時間。
演算法修正倒不是什麼大問題,比較麻煩的是前期的回饋:要怎麼修改這個AI …
就拿期間的一個例子來說, PANDA 有時會把脂肪浸潤的情況檢測出來。
光是這個情況,研究團隊就和醫生們討論了三個月,要不要讓它這麼“ 敏感” ,糾結了幾次最後才斃掉了。
![](https://i0.wp.com/static.cnbetacdn.com/article/2023/1205/e60ea4a3a27848b.webp?w=640&ssl=1)
當然,雖說PANDA 的準確性已經相當高了,但在實際的檢測過程中,它只能起到一個初篩的作用。
它把醫生們看不到的病變找出來後,還是得讓醫生們再次把關,確保沒有誤診啥的。
去年PANDA 模式已經成功上線,有些醫院以及體檢中心已經在用這個AI 幫忙篩檢了。
根據張靈的說法,到目前為止,他們已經用PANDA 模型幫忙篩檢了超過了50 萬人。
而且這裡面,也成功發現並救治了兩個臨床漏診的胰臟癌患者。
![](https://i0.wp.com/static.cnbetacdn.com/article/2023/1205/16a2b854fe8b933.webp?w=640&ssl=1)
其中有一個男人,每年都會去醫院的體檢中心定期體檢,當時他在體檢時並沒發現任何異常。
結果七個月後,在PANDA 進行臨床試驗的時候,他的CT 圖被檢測出了有95% 的機率是胰臟神經內分泌腫瘤。
後來,醫院直接找他,用增強磁振造影檢查了一通,發現PANDA 還真沒判斷失誤。
幸好腫瘤還在早期,早早手術割了,後續檢查時也沒再復發。
![](https://i0.wp.com/d.ifengimg.com/w1024_h682_q90_webp/x0.ifengimg.com/res/2023/D354CEE67D3C9AECAEBF917EF317A80B18F29CFD_size722_w1024_h682.png?w=640&ssl=1)
現在,研究團隊也還沒停下來,他們還想進一步拓寬PANDA 的篩檢範圍。
張靈透露道,眼下在考慮的,是要不要把囊腫加到PANDA 的檢測範圍內。
在未來,他們還打算把更多的癌症、甚至慢性病都納入進來,讓大家只要在體檢的時候做一次平掃CT ,醫生透過AI 輔助,就能看出這些疾病的苗頭。
![](https://i0.wp.com/d.ifengimg.com/w948_h533_q90_webp/x0.ifengimg.com/res/2023/FA7E7F0C917DD618290624A643B4E2F4A2F8681D_size430_w948_h533.png?w=640&ssl=1)
或許有一天,在這個AI 的協助下,所有的癌症,都能透過一次簡單的平掃CT 在早期被發現…
最後,我覺得穆克吉寫的《 重病之王· 癌症傳》中的一段話,還挺應景的:
為了追上疾病的步伐( 癌症),人類一而再、再而三地創造、學習新知識,揚棄舊策略。我們執著地與癌症抗爭,時而精明,時而絕望,時而誇張,時而猛烈,時而瘋狂,時而凜然。這場戰爭,人類已經持續了數千年。
而負評君也希望,在這次AI 開闢的「 新戰場」 上,人類可以徹底降伏癌症這頭猛獸。