僅憑聊天頻率 這個演算法就能辨別誰是潛在網路違法者
隨著網路的普及,網路違法事件也成為了不容忽視的社會問題。 互聯網消弭了潛在違法者和受害者之間的時空距離,使得人人都有客觀條件違法,而人人也有被傷害的危險。 中國司法大數據研究院發佈的《網路犯罪特點和趨勢(2016.1—2018.12)》報告指出,社交類平臺,尤其是QQ、微信等已經成為虛擬犯罪的主要工具,不法分子通過它們在網路上策劃、實施犯罪行為。
這種過程不需要現實接觸,因此非常難捕捉,給執法帶來了許多困難。
近日,日本德島大學的計算機研究者聯合日本大型網路公司代理商Cyber Agent在《人類行為計算》上發表論文,他們用機器學習的方法,分析了Cyber Agent旗下一款社交類遊戲的使用數據,並且在不監測聊天內容的情況下,僅基於聊天次數、聊天物件、聊天時間等基本資訊,就能較為精準地識別出潛在網路違法者,並預測出違法行為的大概時間。
疑犯追蹤”的理論基礎
這不是一個異想天開的想法。 儘管在遊戲中大家只是依靠網線交流,但我們在網上的行為也留下了海量數據,為預測網路違法行為提供了豐富的材料。
研究者基於兩種傳統犯罪學理論開發了這套演算法:日常活動理論和社會傳染理論。
日常活動理論提出,許多犯罪行為並不是隨機發生的,犯罪者和被害人往往在日常活動中有交集。 例如,在現實生活中,小偷在盜竊前會去目標地點踩點,並觀察目標人物的行為規律;同樣的,網路上的犯罪者更需要提前與”獵物”取得聯繫,套取信任。 因此,玩家的社交活動數據中或許就藏著”犯罪預告”。
另外,社會傳染理論還補充了重要的一點:違法傾向或違法行為也會傳染。 最常見的例子就是網路暴力。 網路暴力往往來源於某種過激情緒的廣泛傳播:在群體的裹挾下,有的人不知不覺就失去了獨立判斷能力,無意間成為了網上的施暴者。 有研究指出,在”目睹”群體內其他人的網络騷擾行為后,旁觀者也很容易對同一名受害者發起攻擊,或者嘗試騷擾其他人。 這樣的傳染行為也為預測網路違法事件提供了重要的對象和時間線索。
在這兩種理論的基礎上,研究者選擇了是一款名叫Pigg Party的手機遊戲。 它主打社交功能,使用者登錄帳號后,可以裝扮虛擬的房間和個人形象,與朋友或陌生人以私聊、群聊、公聊的方式進行交流。 研究人員採用擅長從複雜數據中提取特徵的演算法——多層非線性模型,對55萬使用者6個月內產生的聊天數據,包括每名使用者的聊天頻率、聊天時間、消息的接收者等進行了分析。
想做壞事的心逃不過AI的眼
研究者組合多種神經網路模型和演算法,搭建了預測違法事件的人工智慧。 性能測試結果顯示, AI 能根據使用者數據,較為準確地預測未來的違法者和受害者帳戶。 輸入使用者兩個月內聊天的時間、頻率、物件,AI對接下來兩個月內違法帳戶的預測準確率可以達到84.85%,對受害者帳戶的預測準確度也接近85%。
除了對個體賬戶違法或受害的風險有較好的預測能力外,只需提供一周內的用戶活動數據,AI就能基本精準地預測接下來的一周網路社區里發生違法事件的時間,對小時和日期的預測準確率高達95.83%和85.71%,並且結果與預測受害給出的時間相吻合。 更有趣的是,AI分析數據後預警發生違法事件的時間,並不一定處在以往發生違法事件的時間段中,可見它掌握的並不僅僅是固定的規則,還有違法者言行中的真正”邏輯”。
可進行違法預測的AI將海量、零散分佈的使用者日常活動記錄壓縮轉化成可以定量分析的數據,並從中提煉、理解規律,最終形成了強大的預測能力。 研究者認為,藉助AI,系統管理員能更好地維護網路安全和用戶權益。 儘管目前的AI並且不能進一步預測違法事件的具體類型,但它或許能抓住網路上”隱形”的違法者,更好地保護我們的安全。
(據《環球科學》)◎孫琳鈺