動物版Google翻譯來了? Nature:用AI解碼野性的呼喚
海豚的口哨聲、大象的隆隆聲、鳥鳴聲的顫音,都具有該物種用於傳遞訊息的模式和結構。對人類來說,這些微妙之處可能難以辨識和理解,但尋找模式正是AI所擅長的領域。每一種動物都有其獨特的歷史。來自加拿大Carleton University的鯨魚生物學家Shane Gero,花了20年時間試圖了解鯨魚是如何溝通的。
例如,同一個家族的鯨魚會發出特定的聲音,而不同區域的抹香鯨(Physeter macrocephalus)有自己的「方言」。
海豚的口哨聲、大象的隆隆聲、鳥鳴的顫音都有特定的模式和結構。
對人類來說,這些微妙之處可能難以辨識和理解,但尋找模式正是AI所擅長的領域。
在過去的一年裡,AI不斷幫助研究者「解碼」自然界中的這些聲音。
密碼破解者
鯨魚以氏族的形式聚集在一起,每個氏族都有獨特的飲食、社會行為和棲息地。一個氏族可以包含數千頭鯨魚,每個家庭以雌性鯨魚為首。
鯨魚大部分時間都在海洋深處尋找食物,最遠可達海面以下2公里處。陽光照不到那裡,它們透過迴聲定位尋找獵物。
而在不需要迴聲定位的水面上,它們還會使用稱為尾音(codas)的一系列咔嗒聲來與其他鯨魚保持聯繫,每次持續3到40下。
不同氏族的鯨魚使用尾音的節奏和停頓不同,這些「方言」標誌著氏族之間的「文化界線」。
在加勒比海域,Gero和他的同事花了數千小時,收集了居住在附近的30多個鯨魚家庭的資料。
為了了解尾音的節奏和速度,團隊手動創建了鯨魚聲音記錄頻譜圖,將音量和頻率等特徵視覺化。
Gero表示,這項任務非常耗時,交給機器學習演算法之後大大加快了工作速度,同時也有助於區分哪種聲音來自哪種動物。
另外,人工智慧也讓研究走得更遠。
手動操作基本上只能對單字進行分類,但AI可以處理相當於句子甚至整個對話的尾聲。 「機器學習非常擅長發現標準統計方法難以捕捉的模式」。
研究人員收集了8,719個尾聲的數據集,在AI的幫助下發現了“抹香鯨音標”,作為鯨魚之間共享複雜信息的基礎。
請以我的名字呼喚我
抹香鯨並不是唯一使用特定發聲來辨識自己的生物。曾在科羅拉多州立大學工作的行為生態學家Mickey Pardo,透過AI發現了野生非洲像有自己的名字。
大象們使用低沉的隆隆聲彼此交流,在不同的情況(遠距離、面對面、或親子互動)下,聲音會有差別。
Pardo和他的同事發現,大象會對某些叫聲做出反應,而忽略其他叫聲。
研究人員訓練了AI模型來學習這些「呼叫」的聲學特徵,並根據新呼叫的特徵來預測接收者。
最終,模型以27.5%的準確率匹配了呼叫者——儘管看起來分數不高,但人家大像也不是每次呼叫都「直呼其名」。
另一種被AI發現了「真名」的動物是下面這哥們:狨猴(Callithrix jacchus)。
除了預測名字之外,Pardo還嘗試利用AI解碼其他的“大象詞彙”,例如位置術語。
當大象招呼同伴向特定地點移動時,會發出特別的叫聲。模型識別這些叫聲的含義,研究人員播放叫聲並驗證大象的去向。
在另一項關於大象的研究中,Pardo發現肯亞兩個族群中大象的叫聲有明顯差異。
所以,進行瀕危物種保護時,不能簡單將個體與其他同類放在一起,因為「新人」可能面臨語言不通的麻煩。
另外,大象的叫聲還包含了性別、年齡、生理狀況等訊息,科學家可以透過梳理這些訊息,使用被動聲學監測來了解特定大象的情況。
加州大學的動物行為生態學家Caroline Casey,在博士論文中證明了像海豹(Mirounga spp)也會為自己取名字。
Casey認為,使用基於AI的分類器來解釋動物的叫聲,可以減少研究中的人為偏見,但同時,人類直覺的價值也不應該被忽視。
「人類的大腦能夠整合我們對自己世界的理解和運作方式,並利用它來幫助解釋動物的行為」。
泛化到烏鴉
機器學習專家Olivier Pietquin是地球物種計畫(Earth Species Project)的AI研究主管,計畫團隊目前正在使用AI解碼動物物種的交流。
Pietquin希望利用神經網路從一個資料集泛化到另一個資料集的能力,在訓練模型時,不僅能夠使用來自不同動物的大量聲音,還可以使用其他聲學資料(包括人類語音和音樂)。
“電腦可以在建立理解以專門識別動物發聲特徵之前,需要先推導出聲音的一些基本特徵。這與在人臉圖片上訓練的圖像識別演算法學習像素的一些基本特徵的方式相同。”
像素先描述橢圓,然後描述眼睛。所以,即使使用人臉作為大部分訓練數據,AI模型依然可以利用這些基礎知識來辨識貓咪的臉部。
“我們可以想像使用人類語音數據,並希望它能轉移到任何其他具有聲帶的動物身上。”
以這種方式訓練的模型有助於識別哪些聲音傳達了訊息,哪些只是噪音。當然,要弄清楚這些叫聲的具體指向,仍然需要人類觀察動物的行為,為電腦辨識的內容加上標籤。
地球物種計畫的研究人員已經創建了一個名為Voxaboxen的神經網絡,他們正在將其應用於烏鴉交流的研究。
與歐洲其他地方的同類不同,西班牙北部的腐肉烏鴉族群(Corvus corone)共同承擔照顧幼崽的責任。一群烏鴉將輪流守護巢穴、清潔巢穴和照顧雛鳥,它們必須透過語音溝通協調才能完成這些任務。
研究人員將標籤貼在烏鴉的尾羽上,其中包含一個微型麥克風,一個加速度計和磁力計,用於測量鳥類的運動和叫聲。標籤能夠收集大約六天的數據,然後掉到地上並發出一個信號,方便工作人員檢索和研究這些數據。
儘管有抹香鯨、非洲大草原象、狨猴、海象、烏鴉這些例子,但用AI打造「動物版的Google翻譯」還為時過早。
動物是否能夠進行超過基本層次的溝通──即有無語言的構成,還沒有公認的定義。
Pardo表示,他的主要目標不是能夠與野生動物和寵物交談,而是了解它們的想法以及它們如何看待自己和世界。
例如,有些動物似乎有名字的事實意味著,它們能夠將其他個體視為實體並提出標籤,這表明它們具有複雜的抽象思考水平。
如果他能和大象交談,他會問它們對人類對待它們的方式有何感受。 “如果人類能聽到其他動物用它們自己的語言說’嘿,別再殺我們了’,也許人們真的會這麼做。”