DeepMind推AI模型Ithaca:幫考古學家破譯古代文字
機器學習在提供各項新工具的同時,也可以幫助考古學家更好的了解過去,尤其是在破譯古代文字方面。Alphabet 子公司DeepMind 近日創建了一項新的人工智能模型,它不僅可以幫助恢復古希臘銘文中缺失的文字,還可以為文字的寫作時間(30年內)和可能的地理來源提供建議。
在一次新聞發布會上,幫助創建該模型的歷史學家和機器學習專家Thea Sommerschield 表示:“碑文真的很重要,因為它們是直接的證據來源……由古代人自己直接寫的。人類真的很難駕馭所有現有的相關數據”。
由於年代久遠,這些文本往往被損壞,使修復工作成為一項有意義的挑戰。而且,由於它們經常被刻在石頭或金屬等無機材料上,這意味著像放射性碳測年這樣的方法不能用來找出它們的寫作時間。Sommerschield 說:“為了解決這些困難,外文學家在類似的銘文中尋找文本和背景的相似之處。然而,人類真的很難駕馭所有現有的相關數據並發現潛在的模式”。
這款名為Ithaca 的新軟件是在約78,608 個古希臘銘文的數據集上訓練出來的,每個銘文都標有元數據,描述了它的寫作地點和時間(根據歷史學家的知識)。像所有的機器學習系統一樣,Ithaca在這些信息中尋找模式,將這些信息編碼在復雜的數學模型中,並使用這些推斷來建議文本、日期和起源。
在《自然》雜誌上發表的一篇描述Ithaca 的論文中,創建該模型的科學家說,在修復受損文本中的字母時,它的準確率達到62%。它能以71%的準確率將碑文的地理起源歸於古代世界的84個地區之一,並能將文本的日期確定在其已知寫作年份的平均30年內。
例如,DeepMind強調的測試顯示,該模型有助於將歷史學家恢復古代碑文中缺失文字的準確性從25%提高到72%。但迪克指出,那些被測試的人是學生,而不是專業的書畫師。她說,人工智能模型可能會被廣泛使用,但這並不意味著它們可以或應該取代破譯文本的一小批專業學者。