我們離《黑客帝國》中的虛擬世界還有多遠?
今年,AI 技術的爆發式發展和腦機接口的新實驗進展,讓不少人對科幻走入現實有了新的期待:我們是否能像《黑客帝國》裡那樣,通過刺激大腦就讓自己置身於各種奇幻的虛擬世界?我們能否通過腦機接口破譯殘障病人大腦中的電信號而幫他們重新走路或說話?我們是否能讓機器像人類一樣“認識”和“感受”世界?
這些命題的核心,其實是一個困擾了腦科學領域幾十年的問題:大腦是如何編碼外界信息的?
試想,你現在正盯著屏幕閱讀這篇文章,而此時你的大腦中正呈現著各種各樣的信息:眼前的屏幕、屏幕上的文字、房間中燈光的亮暗、遠處的聲音、你讀文章產生的思考、你此時的心情……
我們無時無刻不生活在一個充滿各種信息的世界中,而大腦的一個關鍵任務就是將這些信息一一編碼並呈現在腦海中,這樣我們才能利用這些信息產生記憶、進行思考、並做出行動。
計算機將二進制的“0” 和“1” 作為其編碼的基本單位,而大腦是由成千上萬的神經元組成的,那麼神經元又是如何編碼抽象的信息的呢?這就是我們今天要討論的問題。
01、神經元如何被激活?
動作電位是神經元激活並溝通的基本方式。研究大腦如何將信息轉化為神經元的電信號,這就是“編碼”的問題;研究如何通過神經元的活動反推大腦的所見所想,這就是“解碼”。
如果我們有一天了解了大腦的編碼和解碼,就好比成為了出色的“大腦程序員”,能夠使用這些代碼,破譯代碼,甚至改寫代碼——這已經無限接近於文章開頭的科幻故事了。
所以,研究大腦中的神經編碼是當今腦科學界毋庸置疑的核心問題之一。在神經科學五大分支之一中,整個系統神經科學領域基本都是在研究該問題。
那麼,回到上文“你此時正在對著屏幕讀這篇文章”的例子中,現如今,我們對大腦如何編碼視覺、環境等信息已經有了哪些具體了解呢?
當今風口浪尖上的腦機接口又是如何對腦電信號實現破譯解碼的呢?
下面,我們來簡要回顧腦科學對神經編碼這一問題探究的3 個階段:
02、第一階段 “超級細胞”
上世紀60 年代,哈佛大學的大衛·休伯爾(David Hubel)和托斯坦·維厄瑟爾(Torsten Wiesel)開啟了用精密電極記錄大腦中單個細胞活動的先河,並因揭示視覺皮層中單個神經元如何編碼視覺刺激獲得了諾貝爾生理學與醫學獎。
大衛·休伯爾(左)和托斯坦·維厄瑟爾(右),圖片來源:braintour.harvard.edu
彼時,一個重要的想法也隨之誕生了:各種各樣的信息或許是由大腦中的一個個“超級細胞”編碼的,例如有的神經元編碼“花”,有的神經元編碼“草”,有的編碼“紅燒肉”,甚至有的編碼“我的祖母”等抽象內容。
2005 年一篇《自然》(Nature)上轟動一時的文章支持了這一想法,他們發現人類受試的大腦中有專門編碼《老友記》中演員詹妮弗·安妮斯頓的細胞:這個細胞對其他人和物體都沒反應,但是一看安妮斯頓的照片就會被激活。
只在看到詹妮弗·安妮斯頓時才激活的細胞。圖片來源:《Invariant visual representation by single neurons in the human brain》
類似的,該文章還找到了“悉尼歌劇院細胞”:該細胞只在看到悉尼歌劇院的照片時才激活,對其他場景或人物都不感興趣。
只在看到悉尼歌劇院時才激活的細胞。圖片來源:《Invariant visual representation by single neurons in the human brain》
在“超級細胞”的理論中,每個細胞各司其職;就好比在一個班集體中,有專門的學習委員負責學習、體育委員負責運動會、勞動委員負責值日,大家各有分工。
這樣的細胞在大腦中還有很多,譬如海馬體中的“位置細胞”:當我們在一個房間中行走時,海馬體中的單個細胞會對應編碼二維空間中的一個位置,每當我們走到房間中某特定位置時,與其對應的細胞會被激活。
位置細胞的發現也獲得了2014 年的諾貝爾獎——在“超級細胞”理論的黃金年代,似乎大家相信只要拿著電極去大腦裡“淘金”,總能找到一些神奇的“超級細胞”。
但是,“超級細胞”的理論存在一個致命問題:大腦中的細胞一共就那麼多,如果真是每一個細胞編碼一種信息,細胞用完了怎麼辦?
要知道我們一生都在不斷學習新的信息。“超級細胞”確實不是一種高效的編碼方法,於是,“混合編碼”的想法也隨之誕生。
03、第二階段 混合編碼
混合編碼的想法也很自然:班裡的學習委員、體育委員和勞動委員不應該只負責自己的那攤事。例如大掃除來了,體育委員可以幫著勞動委員承擔一部分工作;通知要春遊時,可以臨時由學習委員和文藝委員共同組織。
換言之,每個人雖然有主要負責的內容,但這種特異性分工並不絕對,可根據任務情況混合處理,體現出一種“混合特異性”。
在斯坦福大學2013 年的一項研究中,研究人員發現猴子前額葉的神經元對刺激信號的顏色、運動、環境等多個實驗因素體現出混合特異性,其激活程度取決於這些因素的排列組合:例如有的細胞對紅色、向左的刺激最敏感,有的細胞則對藍色、向右的刺激最敏感。
混合特異性很好地解決了“超級細胞”理論中一對一編碼信息低效的問題:細胞是“一專多能”的,同一細胞能同時編碼多種信息,每種信息也散佈在多個細胞之中。
混合編碼的想法在近些年得到了越來越多的關注。已經有計算機建模研究表明,混合編碼的方式相比超級細胞編碼更高效,其能編碼的信息也更複雜。
04、第三階段 群體編碼
上文中我們關注了像安妮斯頓細胞、位置細胞、甚至混合特異性細胞等有較明確編碼信息的細胞。
但其實這類細胞只佔大腦全部細胞的一小部分——還有大量的細胞也在放電,但我們卻很難清晰界定他們具體在編碼什麼。即便如此,這些細胞身上是否也攜帶著信息呢?
基於這個疑問,科學家提出了“群體編碼”的想法:與其關注個別的編碼細胞,或許我們可以用機器學習等數據分析方法將神經元群體作為一個整體來考慮,以求從更多的神經元中讀取出多更多的信息。
這也不難理解,100 個神經元儲存的信息總是可以比10 個神經元儲存的信息更多。
如果對應之前舉的班幹部的例子的話,與其把班裡的工作全都交給班幹部,何不由全班同學共同合作完成呢?所以我們可以將整個班級看作一個整體,研究這個班集體是如何開展大掃除,如何組織春遊,以及在運動會上團體表現如何的。
目前最前沿的腦機接口正是基於群體編碼的想法來實現的:科研人員記錄受試腦內全部神經元的電信號,然後用這些電信號來訓練一個機器學習的解碼器,這個解碼器會實時讀取神經元群體的電信號,並以此來預測受試想要移動的方向並操作機械手。
這一革新技術正在開始給一些殘障病人的生活帶來新的希望。
利用腦機接口幫助殘障病人實現實時書寫。圖片來源:《High-performance brain-to-text communication via handwriting》
例如,2021 年斯坦福大學Shenoy 組就利用群體神經元的電信號訓練循環神經網絡,幫助脊椎癱瘓病人以接近95% 的準確率完成書寫。
近十幾年來,隨著活體光學成像技術的發展,我們已經能夠同時記錄成百甚至上千個神經元的群體活動。
隨著這一技術進步,人們又開始思考一種理解群體編碼的新思路:將每個神經元的電活性作為一個維度,那麼每個時刻N 個神經元的激活就對應了N 維空間的一個點——我們的感知、思考和意識過程也就對應了這個N 維空間中的一條線,這條線就叫做神經軌跡。
你可以這樣想像:
有這樣一個抽象的N 維空間對應了我們所有可能的思想活動,而我們的思想就像這個N 維空間中一條游來游去的小魚。
這條小魚會響應外部的刺激,也被我們自己的思考和情緒所驅使。它無時無刻都在我們的腦海世界中暢遊。
這是理解大腦編碼的一種全新思路,研究神經軌跡能進一步理解神經元群體的活動,也能預測了我們的行為。
在2012 年的《自然》雜誌一篇文章中,對群體神經元的光學成像技術讓研究人員不僅能記錄小鼠腦內實時的神經軌跡,還可以預測小鼠在幾秒後會向左轉還是向右轉的決策——小鼠已經通過神經軌跡在腦海中做好了決定,神經軌蹟的方向就決定了小鼠要行動的方向。
05、總結:向未來提問
大腦曾經像一個黑箱,神秘而不可知。
如今,我們開始走進這個黑箱,試圖理解大腦的密碼,這是非常令人激動的。最後,作為日常研究神經編碼的科研人員,談談我個人對這個問題未來的展望。
我們離開篇提到的腦機接口等科幻場景到底有多遠?很遠。
一個科研中常見的現象時,即便我們收集到了成百上千神經元的激活“代碼”,這份代碼依舊像一本無字天書,基本搞不懂它在說什麼。
這就好比編程的初學者,面對著滿眼的“for loop”和“end”全然摸不著頭腦。
例如,我自己在做數據分析時,面對著成百上千神經元幾個TB 的數據,經常第一步要做的就是把所有能想到的數據分析方法諸如ANOVA、PCA、SVM 等通通都先盲試一遍,然後看看有沒有什麼發現。
這個現象背後的原因就是,我們對大腦的編碼還缺乏一些根本性、原理性的認識,於是只能從表層的數據中做文章。
一個腦科學乃至整個生物學界被大家詬病許久的問題是,我們對生物系統缺乏像“牛頓三定律”一樣的根本規律性的認識。
這一問題依舊存在,也似乎還會存在不短的時間,但它卻是我們想要更深入了解大腦繞不過去的。
當然,我們還是可以期待新技術的發展能不斷為這一領域持續輸入新鮮血液。
從單細胞電極記錄到光學成像,我們能同時記錄的神經元由10 個變成了100 個,現在又變成了1000 個,不斷成指數增長。
最新的光學成像技術更是能讓我們同時記錄多個腦區、甚至小鼠整個大腦皮層的神經元——神經元數量已經距離突破10000 這個數量級非常接近了。
這要多虧了許多物理學、光學、機械工程背景的科學家近些年來湧入神經科學領域,使得這些先進的電記錄和光學成像技術成為可能。
所以在最後,我更樂意去幻想,或許在幾十年後《黑客帝國》中的橋段不再是天方夜譚。
參考文獻:
[1] Quiroga, RQ, Reddy, L., Kreiman, G., Koch, C., & Fried, I. (2005). Invariant visual representation by single neurons in the human brain. Nature, 435(7045), 1102-1107.
[2] Mante, V., Sussillo, D., Shenoy, KV, & Newsome, WT (2013). Context-dependent computation by recurrent dynamics in prefrontal cortex. nature, 503(7474), 78-84.
[3] Willett, FR, Avansino, DT, Hochberg, LR, Henderson, JM, & Shenoy, KV (2021). High-performance brain-to-text communication via handwriting. Nature, 593(7858), 249-254.
[4] Kim, TH, & Schnitzer, MJ (2022). Fluorescence imaging of large-scale neural ensemble dynamics. Cell, 185(1), 9-41;
[5] Harvey, CD, Coen, P., & Tank, DW (2012). Choice-specific sequences in parietal cortex during a virtual-navigation decision task. Nature, 484(7392), 62-68.
[6]https://braintour.harvard.edu/archives/portfolio-items/hubel-and-wiesel