麻省理工學院的新型人工智慧模型能準確預測人類行為
麻省理工學院和其他研究人員開發了一個框架,根據人類或人工智慧代理的計算約束條件,對其非理性或次優行為進行建模。他們的技術有助於預測代理的未來行為,例如在國際象棋比賽中。
要建立能與人類有效協作的人工智慧系統,首先要有一個好的人類行為模式。但是,人類在做決策時往往會有一些次優行為。這種非理性尤其難以建模,通常歸結為計算上的限制。人類不可能花幾十年的時間去思考一個問題的理想解決方案。
開發新的建模方法
麻省理工學院和華盛頓大學的研究人員開發了一種為代理(無論是人類還是機器)的行為建模的方法,這種方法考慮到了可能妨礙代理解決問題能力的未知計算限制。
他們的模型只要看到代理之前的一些行為痕跡,就能自動推斷出代理人的計算限制。其結果,即一個代理的所謂”推理預算”,可用於預測該代理的未來行為。
實際應用和模型驗證
在一篇新論文中,研究人員展示了他們的方法如何用於從先前的路線推斷某人的導航目標,以及預測棋手在國際象棋比賽中的後續行動。他們的技術與另一種用於此類決策建模的流行方法不相上下,甚至更勝一籌。
最終,這項工作可以幫助科學家教導人工智慧系統人類的行為方式,從而使這些系統更能回應人類合作者。電子工程與電腦科學(EECS)研究生、這項技術相關論文的第一作者阿圖爾-保羅-雅各布(Athul Paul Jacob)說,能夠理解人類的行為,然後從這種行為推斷出他們的目標,會讓人工智慧助理變得更有用。
“如果我們知道人類即將犯錯,看到他們以前的行為方式,人工智慧代理可以介入並提供更好的方法。或者,人工智慧代理可以適應人類合作者的弱點。”他說:”能夠為人類行為建模,是建立一個能夠真正幫助人類的人工智慧代理的重要一步。
雅各與華盛頓大學助理教授阿比舍克-古普塔(Abhishek Gupta)以及資深作者雅各布-安德烈亞斯(Jacob Andreas)共同撰寫了這篇論文,雅各布-安德烈亞斯是電子工程科學系副教授和電腦科學與人工智慧實驗室(CSAIL)成員。這項研究將在學習表徵國際會議(International Conference on Learning Representations)上發表。
行為建模
幾十年來,研究人員一直在建立人類行為的計算模型。許多先前的方法都試圖透過在模型中加入雜訊來解釋次優決策。模型可能會讓代理人在95% 的情況下做出正確的選擇,而不是讓代理人總是選擇正確的選項。
然而,這些方法可能無法捕捉到這樣一個事實,即人類並不總是以同樣的方式做出次優行為。麻省理工學院的其他人也研究了在決策不理想的情況下制定計劃和推斷目標的更有效方法。
為了建立他們的模型,雅各和他的合作者從先前對西洋棋選手的研究中汲取了靈感。他們注意到,棋手在走簡單的棋步時,在行動前花費的思考時間較少,而在具有挑戰性的比賽中,實力較強的棋手往往比實力較弱的棋手花費更多的時間進行規劃。
雅各說:”最後,我們發現,規劃的深度,或者說一個人思考問題的時間長短,可以很好地代表人類的行為方式。”
他們建立了一個框架,可以從先前的行動中推斷出代理的規劃深度,並利用這些資訊來模擬代理的決策過程。方法的第一步是在一定時間內運行演算法,以解決所研究的問題。例如,如果研究的是一場國際象棋比賽,他們可能會讓下棋演算法運行一定步數。最後,研究人員可以看到演算法在每一步做出的決定。他們的模型會將這些決策與解決相同問題的代理行為進行比較。它將使代理的決策與演算法的決策保持一致,並確定代理停止規劃的步驟。
由此,模型可以確定代理的推理預算,或該代理將為這一問題計劃多長時間。它可以利用推理預算來預測該代理人在解決類似問題時會如何反應。
可解釋的解決方案
這種方法非常高效,因為研究人員不需要做任何額外工作,就能獲得解決問題的演算法所做的全部決策。此框架也可應用於任何可以用某一類演算法解決的問題。
“對我來說,最令人震驚的是,這種推理預算是非常可解釋的。它是說,更難的問題需要更多的規劃,或者說,成為一名強者意味著需要更長時間的規劃。 “雅各說:”我們剛開始著手做這件事的時候,並沒有想到我們的演算法能夠自然而然地發現這些行為。
研究人員在三個不同的建模任務中測試了他們的方法:從先前的路線推斷導航目標、從某人的語言暗示猜測其交流意圖,以及預測人與人國際象棋比賽中的後續棋步。
在每次實驗中,他們的方法要么與流行的替代方法相匹配,要么優於後者。此外,研究人員還發現,他們的人類行為模型與棋手技能(西洋棋比賽)和任務難度的測量結果非常吻合。
展望未來,研究人員希望利用這種方法為其他領域的規劃過程建模,例如強化學習(機器人技術中常用的一種試誤方法)。從長遠來看,他們打算在這項工作的基礎上繼續努力,以實現開發更有效的人工智慧合作者這一更遠大的目標。
編譯來源:ScitechDaily