Meta推出人工智慧模型可將大腦活動準確轉化為文本
Meta公司與國際研究人員合作,透過兩項開創性的研究,宣布了在理解人類智慧方面的重大里程碑:他們創建的人工智慧模型可以讀取和解釋大腦訊號,以重建鍵入的句子,並繪製將思想轉化為口頭或書面文字的精確神經過程。

第一項研究由位於巴黎的梅塔公司基礎人工智慧研究(FAIR)實驗室與位於西班牙聖塞巴斯蒂安的巴斯克認知、大腦和語言中心合作完成。 研究人員利用腦磁圖(MEG)和腦電圖(EEG)記錄了35 名健康志願者在輸入句子時的大腦活動。
該系統採用由影像編碼器、大腦編碼器和影像解碼器三部分組成的架構。 影像編碼器獨立於大腦,建立了一套豐富的影像表徵。 然後,大腦編碼器學習將MEG 訊號與這些影像嵌入對齊。 最後,圖像解碼器根據這些大腦表徵生成可信的圖像。
研究結果令人印象深刻:人工智慧模型可以解碼多達80%用腦電圖記錄大腦活動的參與者輸入的字符,其效果至少是傳統腦電系統的兩倍。 這項研究為非侵入式腦機介面開啟了新的可能性,可以幫助失去說話能力的人恢復溝通。
第二項研究的重點是了解大腦如何將思想轉化為語言。 透過使用人工智慧來解讀參與者輸入句子時的MEG 訊號,研究人員能夠精確定位思想轉化為單字、音節和單個字母的時刻。
這項研究揭示,大腦會產生一連串的表象,從最抽象的層次(句子的意思)開始,逐步將它們轉化為具體的動作,如手指在鍵盤上的移動。 這項研究還證明,大腦使用”動態神經代碼”將連續的表象串聯起來,同時長時間保持每個表象。
雖然該技術前景廣闊,但要將其應用於臨床仍面臨一些挑戰。 解碼性能仍不完善,且MEG 要求受試者在磁屏蔽室內保持靜止。 MEG 掃描儀本身體積龐大、價格昂貴,而且需要在屏蔽室內操作,因為地球磁場的強度是大腦磁場的數兆倍。
Meta 計劃在未來的研究中解決這些局限性,提高解碼過程的準確性和可靠性,探索更適合日常使用的其他非侵入性腦部成像技術,並開發能更好地解讀複雜腦部訊號的更複雜的人工智慧模型。 該公司還希望擴大研究範圍,納入更廣泛的認知過程,並探索在醫療保健、教育和人機互動等領域的潛在應用。
雖然這些研究成果還需要進一步研究才能幫助腦損傷患者,但它們讓我們更接近建立一個能像人類一樣學習和推理的人工智慧系統。