人類研究首次展示了多巴胺如何教導我們的大腦玩新把戲
維克森林大學醫學院(Wake Forest University School of Medicine,WFUSM)的研究人員在一項新研究中揭示了大腦決策機制的關鍵訊息,這有助於我們更好地理解多巴胺訊號在精神和神經疾病中的不同之處。這項研究首次在三個人的大腦深處即時繪製了多巴胺調節圖,揭示了大腦神經傳導物質在識別獎勵和從錯誤中學習方面的重要作用。
“先前的研究表明,多巴胺在動物如何從’獎勵’(也可能是’懲罰’)經驗中學習方面發揮著重要作用,”WFUSM 生理學、藥理學和神經外科副教授Kenneth T. Kishida 博士說。「但很少有人直接評估多巴胺在人腦中的快速作用。這是首次在人類中研究多巴胺如何編碼獎懲,以及多巴胺是否反映了當今最先進的人工智慧研究中所使用的’最佳’教學訊號。”
在這項研究中,研究人員使用了快速掃描循環伏安法,配上機器學習來即時測量多巴胺水平。由於這只能在侵入性手術中進行,因此三名計劃接受這種治療–腦深部刺激治療本質性震顫–的患者得以參與研究。
研究人員將一根碳纖維微電極插入參與者的大腦深處,以監測紋狀體中的多巴胺,這是大腦中參與決策、習慣養成和獎賞的區域。
然後讓他們玩一個簡單的電腦遊戲,遊戲分為三個階段,要求參與者透過經驗學會做出選擇,以獲得最大獎勵,同時減少懲罰。玩家如果做出正確的決定,就會得到真正的金錢獎勵;如果做出錯誤的決定,就會失去金錢作為懲罰。在遊戲的各個階段,每隔100 毫秒對每位參與者的多巴胺進行一次測量。
他們的發現出乎意料: 多巴胺路徑可能比我們想像的要多得多、複雜得多,它在處理輸錢和贏錢的過程中發揮著同樣重要的作用。而且這些通路在不同的時間尺度上運作。
岸田說:「我們發現,多巴胺不僅在大腦中發出積極和消極體驗的信號方面發揮作用,而且在試圖從這些結果中學習時,它似乎以一種最佳的方式這樣做。同樣有趣的是,大腦中似乎有一些獨立的通路,可以分別讓多巴胺系統參與獎勵和懲罰體驗。我們的研究結果揭示了一個令人驚訝的結果,這兩個通路可能會在時間尺度上稍有變化地編碼獎賞和懲罰體驗,時間上僅相隔200至400毫秒。”
這項研究表明,多巴胺是我們如何從好的和壞的經驗中學習的關鍵因素,它幫助我們的大腦調整行為,做出與正面結果相關的選擇。
“傳統上,多巴胺通常被稱為’快樂神經傳導物質’,”Kishida 說。「然而,我們的工作提供的證據表明,多巴胺並非如此。相反,多巴胺是一個複雜系統的重要組成部分,它教導我們的大腦並指導我們的行為。多巴胺也參與教導我們的大腦有關懲罰性的經歷,這是一個重要的發現,可能會提供新的研究方向,幫助我們更好地理解憂鬱症、成癮以及相關精神和神經疾病的內在機制。”
這項研究發表在《科學進展》(Science Advances)期刊。