科學家：生物醫藥研究使用AI技術或導致結論不准確

據英國《金融時報》報導，一組頂尖科學家和醫學統計學家上週五警告稱，在某些生物醫藥領域使用人工智能技術會得出一些不准確的結論。

“使用機器學習技術對大數據進行分析得出的研究結論中，有很多都無法獲得我的信任。”美國萊斯大學貝勒醫學院的基尼維拉·艾倫（Genevera Allen）在美國科學促進會年會上警告說。

機器學習已經被用於研究科學和醫學數據與某些現象之間的關係，例如基因與疾病之間的關聯性。在精準醫療中，研究人員會尋找擁有相似DNA的病人，讓治療方案能夠瞄準特定的致病基因。

“很多技術都是為了進行預測。”艾倫說，“但從來沒有返回過’我不知道’或者’我沒有發現任何東西’這樣的結論，因為它們設計過程中就沒有考慮這種情況。”

她不太願意指出具體的案例，但卻表示，機器學習對癌症數據得出的研究結論就是很好的例子。

“有很多案例都無法重複。”艾倫說，“一項研究中發現的集群跟另外一項研究中發現的截然不同。為什麼會出現這種情況？因為當今的多數機器學習技術都會說：’我發現了一個群體。’但有的時候，如果換一種說法反而更有幫助，可以說：’我認為其中一些確實是被分成一組，但我不確定另外一些。’”

一旦機器學習發現病人基因與疾病特徵之間存在特定聯繫，人類研究人員可能就會對相應的發現提供合理的科學解釋。但這並不意味著這些發現就是正確的。

艾倫說：“你總能找到理由來說明為什麼某些基因被分成一組。”

計算機科學家直到最近才開始意識到這個問題，這可能導致醫學研究人員走上錯誤的道路，還會浪費資源來確認無法重複的結果。

艾倫和她的同事正在努力改進統計技術和機器學習技術，好讓人工智能可以對自己的數據分析展開批判，並指出某些發現有多大概率是真實存在的，而非隨即相關的。

“有一種想法是專門擾亂數據，看看結果是否會保持不變。”她說。(書聿)

WONGCW 網誌