研究人員展示了數據科學技術如何找到Twitter上的“擴散”機器人賬戶
思科系統公司旗下的認證服務公司Duo Security的研究人員發表了一篇博客文章,解釋瞭如何有條不紊地識別“擴散機器人”。這些機器人被定義為自動Twitter賬戶,主要任務是轉發和人工擴散內容的範圍。
閱讀全文:
標題為“Twitter機器人解剖:擴增機器人”由研究人員Jordan Wright和Olabode Anise撰寫。該研究創建了一個包含5.76億個帖子的數據集,並對其進行過濾,以顯示那些有超過50個轉推的帖子並嘗試定義它是正常的推文。通過他們的分析,他們發現發現有一半的推文喜歡和轉發的比例為2:1,大約80%的推文喜歡和轉發的比例大於1:1。
一條可能被人工擴散的推文會讓人感覺更加輕鬆,並且會有更多的轉推。研究人員認為如果它的轉發和點讚之比大於5,則認為推文是人為膨脹的。該研究還認為,時間在識別虛假賬戶方面發揮著重要作用,真正用戶的推文按時間順序排列。另一方面,假賬戶更有可能採取更分散的方式發布。
利用這些線索,研究人員創建了一種方法,可以在某種程度上確信一個帳戶是否是一個擴散機器人。第一點很明顯:它轉發帖子很多。如果超過90%的帳戶帖子是轉推,那這個賬戶很可能就是一個擴散機器人。
下一步是分析這些推文中有多少被“擴散”。如果至少有一半的推文比例大於5:1,那麼也可以確定這個賬戶很可能就是一個擴散機器人。下一步是查看推文的時間,以便按時間順序計算“反轉”的數量。該研究對聲稱使用這種方法在短短一天內確定了超過7000個擴散機器人,但這完全有可能是冰山一角。

