SpaceX天才實習生課餘用AI破解上古卷軸獲Nature頭版關注
Nature官網頭版,最新刊發的是最新考古成果,轟動全球的成果-時隔2000年,上古卷軸(赫庫蘭尼姆捲軸)的神秘面紗,終於被揭開!而且,這項研究還是AI完成的,背後的背後則是一名年僅21歲的天才少年,馬斯克點讚的SpaceX實習生。
不同於一般的密碼破解,分析這份捲軸之難,無異於解讀一本「無字天書」——
因為在西元79年,這組捲軸在一次火山爆發中被燒成了碳,1752年才被挖掘出土。只要稍有不慎,脆弱的捲軸就會分分鐘變成殘片,想要透過物理方式展開,難如登天。
直到今時今日,三名大學生,終於藉助AI的力量,成功破解了其中的段落,開啟了全新的考古研究範式。
他們透過給捲軸拍攝CT影像並藉助機器學習技術分割識別,把捲軸中的2000餘個字符,揭示開來。
這項消息也迅速引發了全球轟動,目前為止,瀏覽量已經超過了1500萬次,轉評讚接近6萬。
馬斯克也給了三人團隊點贊,表示這實在是泰褲辣。
DeepMind的創辦人Demis也大為讚嘆,還表示自己已經迫不及待想讀讀這段神秘的文字了。
那麼,這份神秘的捲軸是如何一步步被破解的呢?
不用打開,也能破解內容
交出這份成果的,是三位學生組成的隊伍,他們分別是:
Youssef Nader,來自埃及,在德國柏林的一家院校攻讀博士
Luke Farritor,SpaceX 實習生,在內布拉斯加大學林肯分校電腦專業讀本科
Julian Schilliger,瑞士蘇黎世聯邦理工學院機器人碩士
想要在沒有損傷的前提下破解這團被燒成碳的捲軸,打開看幾乎是不可能的。
1865年,有人嘗試用物理方式把捲軸打開,結果以失敗告終,一部分捲軸直接成為了碎片。
此後近兩百年,便再也沒有人敢嘗試物理展開了。
直到2019年,肯塔基大學EduceLab的Brent Seales教授透過粒子加速器為捲軸拍攝了分辨率高達4μm的三維CT影像。
Seales教授的博士生Stephen Parsons長期致力於使用機器學習模型來偵測CT影像中的墨水,他利用已經展開的部分帶有可見墨水的捲軸碎片,建立了一個ground-truth資料集。
網友們對此事展開了熱烈討論,並透過一場播客中傳到了Luke的耳朵。
這引起了他極大興趣,並開始利用空閒時間訓練機器學習模型,以便對墨跡進行分析。
最終,Luke的模型成功分析出了捲軸中肉眼不可見的符號,並發現了一個完整的單字。
這個字是希臘文的「ΠΟΡΦΥΡΑ?」(小寫:πορφυ?ρ?α??,拉丁文轉寫:porphyras),意思與「紫色」有關。
這項發現,讓他成為歷史上第一個從赫庫蘭尼姆古卷內部讀出整個單字的人。
Youssef是第二個破解這個單字的人,他採用了不同的方法,但得到了內容相同且更清晰的結果。
也正是看到Youssef提交的結果之後,專家們對Luke的發現,更加確認了。
Julian則參與研發了EduceLab的3D模型分割工具Volume Cartographer。
Volume Cartographer將三維CT影像沿著捲軸展開,並映射到了二維平面,為Luke和Youssef的破解工作奠定了基礎。
此後,Julian又提出了新的分割方法ThaumatoAnakalyptor,透過重新分割的方式對已破解區域進行了驗證,並探索了更多未知片段。
此後,為了更快破解更多內容,三人組成了超級團隊,最後成功解讀了2000多個字符。
他們使用了三種不同模型架構進行了分析,之間的結果可以相互印證,墨水偵測程式碼也直接在GitHub上做了開源。
他們分析出的這兩千多個字符,位於其中一卷的結尾,篇幅大約是該卷的5%,內容被認為與伊壁鳩魯哲學有關。伊壁鳩魯(Epicurus)是古希臘哲學家,主要關注個人的幸福和心靈的平靜,但講理性、在自然科學領域提出了原子論,對後世的倫理學和心理學發展都產生了重要影響。
而在這個捲軸的兩個連續片段中,作者提及了商品(例如食物)的可獲得性(availability)是否以及如何影響它們能帶來的快樂(pleasure)。
所以這次考古發現,其實或許能進一步幫助了解古人對於世界的認知與探究。
一場挑戰賽,三名學生,500萬獎金
而讓這三位學生走在一起的,是一場名為「維蘇威火山」的挑戰賽。
在Stephen建立了數據集之後,矽谷企業家、GitHub前CEONat Friedman對此產生了濃厚興趣,並出資贊助了這場比賽。
主辦單位於去年3月公佈了評選標準,參賽者需要破解至少4個段落,每個段落140個字符,其中至少85%的字符可恢復。
當時,專家組普遍認為一年之內有人挑戰成功的機率還不到三成,但結果卻出乎意料——
據介紹,比賽的消息發布後他們收到了許多作品,直到ddl之前幾分鐘還有團隊交出成果。
經過為期一個月的審查,這份包含了2000個字符的文本,被認定破解成功。
這三位得獎者將瓜分70萬美元的獎金,折合人民幣500多萬。
此外,還有三個團隊因提交的結果具有顯著可讀性,獲得了二等獎,這三個團隊將各獲得5萬美元的獎勵。
其中包括谷歌華人工程師Shao-Qian Mah所帶領的團隊。
下一步,比賽主辦單位希望在一年的時間內破解四組捲軸的90%,後續比賽資訊也將在3月公佈。
當然,這樣的挑戰賽獎金只是一方面,更重要的是展現瞭如何用AI解決各行各業挑戰的可能性和可行性,包括考古這樣的學科。
或許你也有所耳聞,更早之前,AI對於甲骨文的研究也開始了。你要還知道其他的項目?也歡迎分享分享~~
參考連結:
[1]https://scrollprize.org/grandprize
[2]https://twitter.com/natfriedman/status/1754519304471814555
來源:量子位