最新AI技術無創解碼“大腦語言”,準確率達73%
據報導,目前,人工智能技術使得非侵入式大腦解碼技術更進一步!儘管該技術尚不能使無法語言交流人群像正常人那樣談笑風聲,但可使科學家精準解碼他們的語音內容。
這項人工智能技術可從參與者大腦活動中解碼單詞和句子,其準確性令人不可思議,但仍無法達到100%精準,人們僅需幾秒鐘的大腦活動數據,即能通過人工智能技術推測出人們聽到什麼內容,他們在一項初步研究中發現,參與者從選擇性測試中找到正確答案的概率平均達到73%。
未參與該項研究的愛爾蘭都柏林三一學院計算機科學家喬瓦尼•迪•利伯托(Giovanni Di Liberto)稱,人工智能的表現已超出許多人認為可能實現的水平。
8月25日,有媒體報導稱,Facebook母公司Meta研發一項最新人工智能技術,最終有望應用於全球數以萬計無法通過語音、打字或者手勢進行交流的人群,其中包括:最低限度的意識狀態、閉鎖綜合症或者“植物人狀態”患者,現在他們通常被稱為無反應清醒綜合症人群。
據悉,目前大多數幫助語言表達障礙人群的技術具有一定程度的身體侵入性,需要進行高風險腦部手術植入電極,Meta公司AI研究員、神經科學家珍妮-雷米·金(Jean-Remi King)表示,最新研發的人工智能技術有望提供一種可行方案來幫助溝通障礙患者,而不是使用侵入性方法。
珍妮和同事研發了一種計算工具,可以檢測53種語言的56000小時語音錄音中的單詞和句子,該工具也被稱為語言模型,學習如何在細微等級(例如:字母或者音節)和更廣泛等級(例如:單詞或者句子)識別語言的具體特徵。
該研究團隊將帶有語言模型的人工智能係統應用於4個機構的數據庫,其中包括169名志願者的大腦活動,在這些數據庫中,參與者傾聽不同的故事和句子,例如:作家歐內斯特·海明威的《老人與海》和劉易斯·卡羅爾的《愛麗絲夢遊仙境》,期間工作人員使用腦磁波描記器(MEG)或者腦電圖儀對參與者的大腦進行掃描,這些設備可以測量大腦信號的磁成分或者電成分。
之後在一種有助於解釋實際大腦間物理差異的計算方法幫助下,研究團隊試著利用每位參與者3秒鐘的大腦活動數據來解碼他們聽到的內容,他們指示人工智能係統將故事錄音中的語音與人工智能計算出人們聽到的內容相對應的大腦活動模式進行匹配,然後依據1000多種可能性,預測參與者在短時間內可能聽到的內容。
研究人員發現使用腦磁波描記器進行測試,參與者選擇的前10種可能性答案的準確率達到73%,然而通過腦電圖儀的測試結果,該準確率下降至不足30%,因此腦磁波描記器性能非常好。利伯託說:“但是我們預測該系統的實際應用並不樂觀,它能有什麼用途呢?腦磁波描記器是一部笨重且成本昂貴的機器,將該項技術應用於診所需要技術創新改良,從而使該設備成本更低、更易於使用。
美國密歇根大學安娜堡分校語言學家喬納森·布倫南(Jonathan Brennan)說:“在這項最新研究中,理解’解碼’的真正含義非常重要,這個詞經常被用於描述直接從信息源破譯信息的過程,這里特指從大腦活動中破譯語言,人工智能技術可以實現這一點,因為該系統能提供一個有限範圍的可能性答案,大幅提高的準確率。對於語言來講,如果我們想將該人工智能係統擴展至實際應用,這是很難實現的,因為語言應用是無限的。”
更重要的是,人工智能能解碼被動傾聽音頻的參與者信息,這與非語言患者沒有直接關聯,為了使它成為一種具有意義的交流工具,科學家需要學習如何從大腦活動中解密患者想表達的信息,例如:飢餓、不適表情或者簡單的“是”或者“不是”的表情。
事實上,這項人工智能技術是解碼語音感知,而不是語音生成,雖然語音生成是科學家的最終目標,但就目前而言,亟待進一步完善提升相關的科學技術。