研究人員展示了數據科學技術如何找到Twitter上的“擴散”機器人賬戶

2018-12-12 Comments 0 Comment

思科系統公司旗下的認證服務公司Duo Security的研究人員發表了一篇博客文章，解釋瞭如何有條不紊地識別“擴散機器人”。這些機器人被定義為自動Twitter賬戶，主要任務是轉發和人工擴散內容的範圍。

閱讀全文：

https://duo.com/blog/anatomy-of-twitter-bots-fake-followers

標題為“Twitter機器人解剖：擴增機器人”由研究人員Jordan Wright和Olabode Anise撰寫。該研究創建了一個包含5.76億個帖子的數據集，並對其進行過濾，以顯示那些有超過50個轉推的帖子並嘗試定義它是正常的推文。通過他們的分析，他們發現發現有一半的推文喜歡和轉發的比例為2：1，大約80%的推文喜歡和轉發的比例大於1:1。

一條可能被人工擴散的推文會讓人感覺更加輕鬆，並且會有更多的轉推。研究人員認為如果它的轉發和點讚之比大於5，則認為推文是人為膨脹的。該研究還認為，時間在識別虛假賬戶方面發揮著重要作用，真正用戶的推文按時間順序排列。另一方面，假賬戶更有可能採取更分散的方式發布。

利用這些線索，研究人員創建了一種方法，可以在某種程度上確信一個帳戶是否是一個擴散機器人。第一點很明顯：它轉發帖子很多。如果超過90％的帳戶帖子是轉推，那這個賬戶很可能就是一個擴散機器人。

下一步是分析這些推文中有多少被“擴散”。如果至少有一半的推文比例大於5：1，那麼也可以確定這個賬戶很可能就是一個擴散機器人。下一步是查看推文的時間，以便按時間順序計算“反轉”的數量。該研究對聲稱使用這種方法在短短一天內確定了超過7000個擴散機器人，但這完全有可能是冰山一角。

一	二	三	四	五	六	日
					1	2
3	4	5	6	7	8	9
10	11	12	13	14	15	16
17	18	19	20	21	22	23
24	25	26	27	28	29	30
31

WONGCW 網誌

記錄生活經驗與點滴

研究人員展示了數據科學技術如何找到Twitter上的“擴散”機器人賬戶

2018-12-12 Comments 0 Comment

相關

發表迴響取消回覆

分享此文：

相關

發表迴響取消回覆