AI打敗1000多名人類選手贏得填字遊戲冠軍
在上週舉行的美國填字遊戲錦標賽(American Crossword Puzzle Tournament,ACPT)上,一位人工智能選手從1000多名參賽者中脫穎而出,獲得勝利,它就是填字遊戲程序“菲爾博士(Dr. Fill)”。
儘管在兩道題上出現了錯誤,但Dr. Fill仍在一分鐘內完成了遊戲,比最快的人類參賽者快了整整兩分鐘。Dr. Fill的背後有著加州大學伯克利分校(UC Berkeley)伯克利自然語言處理小組的強大支持,它會分析題目線索生成答案列表,並根據數據庫中的800多萬組線索和答案來解謎。
一、神經網絡與數據庫加持
Dr. Fill是由計算機科學家馬特·金斯伯格(Matt Ginsberg)製作的,他同時也是一名填字遊戲製作者。
自2012年以來,金斯伯格就開始讓Dr. Fill非正式地參加ACPT,並在每年的比賽中對它的軟件進行改進。
▲馬特·金斯伯格(Matt Ginsberg)和Dr. Fill
而在今年,金斯伯格與加州大學伯克利分校(UC Berkeley)的伯克利自然語言處理小組合作,該小組由教授丹·克萊恩(Dan Klein)領導的研究生和本科生組成。
克萊恩是自然語言處理和無監督學習領域的專家,他曾獲得2016 AMiner自然語言處理領域十大最具影響力學者獎。AMiner是由清華大學創立的新一代智能型科技情報平台。
▲丹·克萊恩(Dan Klein)
就在ACPT開始前兩週,他們共同為Dr. Fill開發了一個混合系統。其中,伯克利小組用神經網絡的方法來幫助Dr. Fill分析線索,而金斯伯格編寫了用來填寫遊戲網格的代碼。
Dr. Fill還有一個包含800多萬條線索和答案的訓練數據庫,這些數據來自以往在各種媒體上出現過的填字遊戲。為了解決謎題,它的程序會參考以往的線索和答案。
和人類一樣,當面對新的挑戰時,Dr. Fill必須依靠經驗,尋找新舊問題之間的聯繫。
例如,ACPT 2021中第二題的答案,就是一個長單詞後加上後綴-ITY構成的新詞。不過幸運的是,類似的題目曾出現在2010年《洛杉磯時報(the Los Angeles Times)》發表的一個填字遊戲中,Dr. Fill的數據庫當中包含了這道題,所以它順利地解出了答案。
二、會分析題目線索,還能篩選答案
儘管Dr. Fill的數據庫十分龐大,但它並不能靠“抄作業”拿第一。
在實際的解題過程中,Dr. Fill會分析題目線索,並生成與題目線索匹配的候選答案列表,根據可能性對它們進行排序,並檢查它們是否能填字遊戲網格中和其他單詞恰當連接。只要題目給出了足夠的上下文語境,Dr. Fill就能最終解出正確答案。
例如,對於“imposing groups”這個線索,Dr. Fill將正確的答案“ARRAYS”列為首選詞。“imposing”一詞從未出現在與正確答案相關的線索中,但這些線索中出現過其他同義詞,如“impressive”,這使Dr. Fill可以推斷出語義上的聯繫,並解出正確答案。
▲Dr. Fill從題目線索直接推斷出正確答案
Dr. Fill還會將字母進行交叉比對來篩選正確答案。比如,在五個字母的答案中,知道第二個字母是O,答案的線索是“Aw, that’s a shame!(太可惜了!)”,它就可以找到正確的答案“SO SAD”。
▲Dr. Fill將字母進行交叉比對來篩選答案
題目中涉及雙關語或其他文字遊戲的線索會比較麻煩,不過,伯克利的神經網絡系統使Dr. Fill能夠識別出這類線索。克萊恩解釋說,雖然這些語義上的把戲無法明確地教給Dr. Fill,但通過機器學習,它能明白要尋找沒有常規線索那麼直接的選項。
三、人腦仍勝在跳躍性邏輯
《紐約時報》的填字遊戲編輯威爾·肖茨(Will Shortz)指出,今年的ACPT可能發揮了Dr. Fill的優勢,因為“每一個答案都是語義簡單,很好理解的”。肖茨說,他對Dr. Fill的獨創性感到敬畏,但他認為人類參賽者在很多方面仍有優勢。
他說:“現在,仍然是人類更擅長像填字遊戲這樣非邏輯的現實世界問題。”在他看來,即使是在比較簡單的題目中,Dr. Fill仍然會犯一些人類不會犯的錯誤。
克萊恩也看到了這一點,同時他也提到,在自然語言處理領域經常會出現類似的挑戰。例如,人類的大腦經常進行所謂的“多跳推理”,就是說,人腦會利用很多不直接相關的知識完成一個跳躍性的推理。
而要教會人工智能遵循這樣的邏輯跳躍,就意味著人們要從很多間接表意的語言中提取並歸納出表達的邏輯。但在當下,Dr. Fill仍然難以理解這些不是“大白話”的語言。
克萊恩認為,Dr. Fill這次的表現只是我們從填字遊戲的線索中解讀自然語言意義的第一步。當涉及到表意特別委婉的語言樣本時,克萊恩說:“那些難倒人們的語言更會難倒Dr. Fill。”
結語:AI自然語言處理進階,從輸出到“思考”
Dr. Fill在APCT中的勝利標誌了人工智能在自然語言處理方面的進步。也就是說,人工智能已經不僅可以實現簡單的自然語言交流,而且還能“理解”比較複雜的語義、“思考”如何解謎。
在未來,隨著科學家們對自然語言的意義拆解更加深入和系統化,這些人工智能的“思考”能力或許還會更接近人腦、更加強大。