意念打字破新紀錄心中想著“說話”詞就蹦躂出來斯坦福團隊出品

2023-02-01 Comments 0 Comment

意念打字新紀錄誕生！受試者通過植入設備，平均輸入速度能達每分鐘62 個單詞，是團隊之前紀錄的3 倍。同時準確率也有明顯提升，面向50 個單詞詞彙表，識別準確率比先前紀錄提升2.7 倍。據研究者稱，這已開始接近正常人溝通速度（每分鐘160 個單詞）。

不信？那就看看現場實況。

受試者“按詞輸入”，點點頭就出了個句子，還是蠻絲滑的：

相比下，此前研究按“字母”逐個輸入，顯得更費勁不少：

△

2021 年登Nature 封面的成果展示

創造該紀錄的團隊來自斯坦福，前兩天，他們剛將相關論文預印本放上bioRXiv，引來不小關注。

未參與項目的加州大學舊金山分校研究員Philip Sabes，將之稱為“重大突破”。他認為，相關技術很快將走出實驗室，進入落地階段。

不少網友也對該成果也相當興奮，Reddit 點贊上萬，有人恨不能立馬給家人整一套。

值得一提的是，論文發表同一天，共同主要作者之一的Krishna Shenoy 因胰腺癌去世，不少學者與研究機構為此悼念。

所以這回，科學家們如何創造出意念打字新紀錄？與之前方式有什麼不同？

繼續往下看。

識別開口說話的神經活動情況

意念打字過去一直是腦科學領域的熱門研究方向，也備受社會大眾關注，更早之前的實現方法是—— 讓受試者在腦中手寫字母，或是在腦中讀出特定讀音，再靠系統識別。

此次，科學家們用了不同的信息識別辦法—— 直接讓受試者“說”出來，哪怕只在大腦裡。

具體來說，他們依靠一套語音腦機接口（BCI）系統，識別人類說話中相關的口腔、面部神經活動情況，通過解碼其動作控制信號，再去輸出受試者想表達的文本。

基於上述思路，科學家們開展了一系列實驗。

此番受試者是一位女性，時年67 歲，她在57 歲時被診斷出患有肌萎縮性側索硬化症(ALS)，該病症讓她在很長時間被吐字發音不清折磨，說話僅能發出幾個元音，輔音幾乎很難分辨。

為保護隱私，該受試者被團隊稱為T12，2021 年的研究中，他們也用了同樣方法，將另一位男性受試者稱為T5。

2022 年3 月，經當事人同意，科學家為其在腦中植入四個微電極陣列，以檢測語言相關神經活動情況。

在植入後的實驗中，科學家先讓受試者嘗試做不同動作，觀察相關區域的神經活動狀況。

比如，讓受試者睜眼、閉眼、眨眼以觀察控制眼皮相關神經元活動；再比如讓嘴唇張開、閉合、微笑，以檢測相關腦區活動。當然，實驗觀察部位還包括：額頭、下巴、喉部、舌頭等。

科研團隊發現，不同動作之間神經活動高度分離，在特定檢測頻率下，他們針對34 個口部面部動作進行解碼，準確率為92.7%，若面向39 個音素，解碼準確率為60%。這側面說明原計劃具備可操作性。

下一步是將說話的相關神經活動和文本關聯起來。

科研工作者預先準備了一個RNN 解碼器，以80ms 為間隔，檢測識別神經活動信號，這當中，神經網絡會依靠最大概率判斷輸出單詞，錯誤的發音也將被糾正，最終輸出文本。

為訓練該網絡，受試者需要每天嘗試輸出260-280 語句的數據。

百天之後的測試中，無論是否發出聲音，對單詞的識別速度均在每分鐘50 詞以上，該表現大約是該團隊此前2021 年紀錄的3 倍。

且無論面向50 個單詞，還是12500 個單詞，解碼效率差異不大。

識別錯誤率也有大幅改善。

針對50 個單詞的表達，識別錯誤率在9.1%，即便受試者進行不發聲表達，錯誤率也僅11.2%。

針對12500 單詞庫時，表達識別的錯誤率為23.8%，不發聲輸出錯誤率為24.7%，該錯誤率與之前研究面向50 詞的測試情況正誤情況基本持平，能看出該方法準確度大幅上升。

上述測試之外，科學家還探究了哪些方向能進一步優化該系統。

他們考慮了三個維度—— 語言模型詞彙量、植入腦部電極數量、訓練數據集大小。

結果顯示，隨著單詞數量提高，錯誤率的確會升高，但在1000 詞量級趨於平緩（下方左圖），團隊由此認為，日後研究通過壓縮單詞數不一定有效。

但對於植入電極數量來說，更多的通道數（精度）的確會帶來錯誤率降低。如下方右圖，從500 提升到1000，錯誤率從4%，降低到了1.9%。

另值得一提的是，即便未經訓練，面向新數據，系統單詞錯誤率也只有30%。且通過訓練，錯誤率會不斷下降。

對於後續研究，團隊指出該成果目前還不是完整的、臨床上可落地的系統。此外，24% 錯誤率在日常生活中也還不夠低，後續研究將在各方面努力。

意念打字一直熱度不減

本文一作是Francis Willett，來自斯坦福霍華德休斯醫學研究所，主要研究領域為腦機接口、運動神經科學，他也對人工神經網絡模型有所涉獵。

2021 年登上Nature 封面的意念打字研究中，他也是一作。跟上次一樣，此番他表示—— 將會公佈研究的代碼和數據。

另一位主要作者是Erin Kunz，來自斯坦福電氣工程系在讀博士，此前，她還曾在通用擔任自動駕駛工程師。

前文提及剛剛過世的Krishna Shenoy 也是本文主要作者。

2021 年登Nature 的論文，他亦是貢獻者之一，此前研究中，他破譯了與手寫筆記相關的大腦信號，讓截癱患者快速準確地打字。

該項工作十分關鍵，因為當時他們使用的方法是——讓受試者在腦中“寫出”字母。

除該團隊，在“意念打字”這件事上，還有更多科學家在努力。

比如2022 年11 月，加利福尼亞大學舊金山分校（UCSF）提出的一種不同方法。他們通過植入128 通道皮質電圖（ECoG）陣列，外加一個經皮連接器，用來連接植入設備和外部系統。

在識別方式上，他們所想到的是—— 讓受試者在腦中默念字母NATO 代碼（比如α 代替a，β 代替b），完成逐個字母輸入，平均2 秒可鍵入一個字母，最終平均字符錯誤率僅6.13%。

之前，量子位智庫對該趨勢也有所展望，認為“意念打字”乃至背後的腦機接口技術已在商業化發展上初具雛形。

清華李路明團隊、瑞金醫院、浙江大學及浙大二院神經外科等團隊或機構，均有所積累。

另值得一提的是，去年末馬斯克及Neuralink 還讓猴子搞了一回“意念打字”，雖說是用訓練猴子意念點擊屏幕中的黃色按鈕，但也算“蹭”了一波。

當時，馬斯克還說，他和Neuralink 已向FDA 遞交了諸多文件，預計6 個月後（預計今年六月）開啟人體試驗。

但能不能等到，還真不一定……

畢竟同樣的話，他在2022 年4 月已說過一次了。（狗頭）

參考鏈接：

[1]https://www.technologyreview.com/2023/01/24/1067226/an-als-patient-set-a-record-for-communication-via-a-brain-implant-62-words-per -分鐘/

[2]https://www.freethink.com/hard-tech/speech-bcis

[3]https://www.biorxiv.org/content/biorxiv/early/2023/01/21/2023.01.21.524489.full.pdf

來源：量子位

WONGCW 網誌

記錄生活經驗與點滴

意念打字破新紀錄心中想著“說話”詞就蹦躂出來斯坦福團隊出品

2023-02-01 Comments 0 Comment

相關

發表迴響取消回覆

2023 年 2 月
一	二	三	四	五	六	日
		1	2	3	4	5
6	7	8	9	10	11	12
13	14	15	16	17	18	19
20	21	22	23	24	25	26
27	28

分享此文：

相關

發表迴響取消回覆