人工智能被用來幫助考古學家破解死海古卷的密碼
大約七十年前發現的死海古卷因包含希伯來聖經(舊約)最古老的手稿和許多迄今未知的古代猶太文本而聞名。但是,由於當年的抄寫人員是匿名的,所以科學家們一直無法了解這些捲軸背後的個人身份。現在,通過結合科學和人文科學,格羅寧根大學的研究人員已經破解了密碼,這使他們能夠發現捲軸背後的抄寫員。他們於2021年4月21日在《PLOS ONE》雜誌上發表了他們的成果。
創作捲軸的抄寫員並沒有在他們的作品上簽名。學者們建議,根據筆跡,一些手稿應該歸於一個抄寫員。格羅寧根大學神學和宗教研究學院希伯來聖經和古代猶太教教授姆拉登-波波維奇解釋說:”他們會試圖在筆跡中找到決定性證據,例如,在一封信中的一個非常具體的特徵。”他是該大學庫姆蘭研究所的主任,致力於研究死海古卷。然而,這些鑑定有些主觀,而且經常有激烈的爭論。
這就是為什麼波波維奇在他由歐洲研究理事會資助的”書寫聖經的手”項目中,與他的同事、科學和工程學院的計算機科學和人工智能教授蘭伯特-肖梅克合作。肖梅克長期以來一直致力於研究讓計算機讀取筆蹟的技術,通常是從歷史材料中讀取。他還進行了研究,調查生物力學特徵,如某人握筆或手寫筆的方式,會如何影響筆跡。
在這項研究中,他們與博士生Maruf Dhali一起,特別關註一個捲軸:庫姆蘭第1窟中著名的大以賽亞捲軸(1QIsaa)。該捲軸的筆跡似乎近乎一致,但有人認為它是由兩個具有類似書寫風格的抄寫員所寫。那麼,這怎麼能決定呢?肖梅克表示:”這個捲軸包含字母aleph,或”a”,至少有五千次。光靠眼睛是不可能把它們全部比較出來的”。計算機很適合分析大型數據集,比如5000個手寫的a。數字成像使各種計算機計算成為可能,在字符的微觀層面,如測量曲率(稱為紋理),以及整個字符(稱為異體字)。
“人的眼睛很神奇,大概也會考慮到這些層面。波波維奇說:”這使專家能夠”看到”不同作者的手,但這一決定往往不是通過一個透明的過程達成的。”此外,這些專家幾乎不可能處理畫卷提供的大量數據”。這就是為什麼他們的結果往往不是結論性的。
最好的方法是訓練一種算法,將文本(墨水)與背景(皮革或紙莎草)分開。對於這種分離,或”二進制化”,Dhali開發了一個最先進的人工神經網絡,可以用深度學習來訓練。這個神經網絡保持了2000多年前抄寫員所做的原始墨水痕跡在數字圖像上的完整呈現。”這很重要,因為古老的墨水痕跡直接關係到一個人的肌肉運動,是針對個人的,”肖梅克解釋說。
隨後,對紋理和異體字特徵的分析表明,《以賽亞書大卷》中的54列文字分為兩個不同的組別,這些組別在整個捲軸中不是隨機分佈的,而是聚集在一起的,在一半處有一個過渡。在重新計算了各列之間的相似性,現在使用的是字母碎片的模式。這第二個分析步驟證實了兩個不同的存在。還進行了一些進一步的檢查和控制。他們還成功地證明了第二個抄寫員比第一個抄寫員在其書寫中表現出更多的變化,儘管他們的書寫非常相似。
第三步是可視化分析,他們創建了”熱圖”,將整個捲軸上一個字符的所有變種納入其中。然後,他們為前27列和最後27列的這個字符製作了一個平均版本。用眼睛比較這兩個平均字母,發現它們是不同的。這就把計算機和統計分析與人類對數據的近似解釋聯繫起來了,因為熱圖既不依賴,也不是由初級和二級分析產生的。
捲軸的某些方面和文字的定位曾使一些學者認為在第27欄之後有一個新的抄寫員開始工作,但這並沒有被普遍接受。而現在可以通過對筆蹟的定量分析以及強有力的統計分析來確認這一點。在計算機的智能協助下,可以證明這種分離在統計學上是有意義的,而不是基於或多或少的印象主義證據進行判斷。
除了改變捲軸的古文字學–以及潛在的其他古代手稿體–對《以賽亞大卷》的研究開闢了一種基於物理特徵的庫姆蘭文本分析的全新方式。現在,研究人員可以進入個別抄寫員的微觀層面,仔細觀察他們如何在這些手稿上工作。
通過這種方式,我們將有可能更多地了解產生死海古卷的社區。現在能夠識別不同的抄寫員,雖然永遠不會知道他們的名字。但經過七十年的研究,這感覺就像我們終於可以通過他們的筆跡與他們握手一樣。