谷歌搜索2021 Webspam報告:過濾垃圾網站數量是2020年的六倍
由周四發布的“網絡垃圾”(Webspam)報告可知,谷歌搜索在2021 年過濾的垃圾網站數量、竟是2020 年的六倍。據悉,作為Alphabet 旗下子公司,Google 有一套名為SpamBrian 的人工智能垃圾過濾系統,並且可在超過99% 情況下實現“不受垃圾所困擾”(spam-free)的搜索體驗。
(來自:Google Search Central Blog)
此前,SpamBrain 已被這家搜索巨頭用於防止用戶點擊那些可能被注入了惡意軟件的有害網站、或旨在誘騙人們洩露個人信息/ 匯款的詐騙站點。
Google 表示,鑑於垃圾信息散播者在持續不斷地找到繞過過濾機制的方法,基於人工智能的篩查系統也是相當必要的。
需要指出的是,搜索是Google 的重要收入來源之一。而高質量和安全的網站搜索結果,也對該公司來說至關重要。
經過多年摸索,垃圾網站製作方早已精通搜索引擎優化(SEO)技術,來人為地提升其搜索排名。
作為應對,Google 也迫切需要排除掉那些利用欺詐算法的垃圾網站。
截至目前,Google 已借助SpamBrain 將垃圾站點砍掉70%,其中包括被黑客入侵並植入有害代碼的感染站點。若被其得逞,受害者將被竊取登錄憑據等機密信息。
其它類型的垃圾站點,還涉及將惡意軟件注入受害者的計算機、或誘導重定向至惡意站點。慶幸的是,Google 聲稱SpamBrain 能夠將這類害群之馬排除在搜索結果之外。
Google 政策溝通經理Ned Adriance 在一封電子郵件中提到:
欺詐者經常拙劣地模仿其它網站,常見套路是填充替換關鍵詞、假借品牌徽標、並附上想要引誘受害者撥打的電話號碼。
而Google 的SpamBrain 算法方案,能夠基本上確保此類欺詐型站點出現在相關搜索結果頁面中,且過濾了75% 的亂碼垃圾站點。
這些垃圾站點往往在一堆無意義的文本中填充大量關鍵詞,以試圖提升其搜索排名。有時甚至會砸錢掛上垃圾鏈接,來誘騙搜索引擎的爬蟲和抬升PageRank 品質評分。
對於用戶來說,時間總是相當寶貴的。而Google 的各種解決方案,就希望為用戶帶來更好的內容檢索體驗。
【背景資料】
Google 於2018 年推出的SpamBrain 系統,且與近20 年前剛開始治理惡意網站時相比,去年搜索過濾的垃圾站點數量已暴增200 倍。
即便如此,這場“道高一尺魔高一丈”的垃圾信息攻防戰,顯然不會輕易完結。