最新研究發現AI也會得老年癡呆版本越老越糊塗
以色列特拉維夫大學的一項研究顯示AI已有數位癡呆症。在這項研究中,科學家測試了幾乎所有全球頂尖AI大型語言模型,結果都表現出類似早期老年癡呆的認知障礙,且版本越老,表現就越差。
為了評估實驗效果,科學家使用了經常被用來測試老年癡呆症的蒙特利爾認知評估量表,針對幾種公開的領先大型語言模型進行測試,包括ChatGPT的新舊版本,Gemini新舊版本等。設定的測驗最高分為30分,26分或以上被認為是正常的。
實驗結果顯示,只有GPT-4o在測試中獲得了最高分26分,其次是GPT-4是25分,Gemini 1.0僅得16分。
研究也發現幾乎所有模型在視覺空間能力和執行任務方面都表現不佳,無法表現出同理心或準確解釋複雜的視覺場景。
科學家指出,所有大型語言模型在需要視覺抽象化和執行功能的任務中都一致失敗,這凸顯了一個可能阻礙其在臨床環境中使用的重要弱點。因此,他們做出了有數字癡呆症的AI,不可能很快取代醫生的這個結論。