研究者開發新模型可更高效檢測垃圾郵件
垃圾郵件檢測器模型可以自動檢測垃圾郵件,但我們需要在大型電子郵件數據集上訓練它們,並對它們進行人工標註。這就是印度Sinhgad 理工學院Lonavala 分校的研究人員希望解決的問題。相關論文發表在《International Journal of Intelligent Robotics and Applications》上。
該項目的研究人員之一Vikas Samarthrao Kadam 說:“垃圾郵件檢測是至關重要的,因為它可以確保賣家的公正,並保留買家對網店的信任。與其他方法相比,它提高了訓練速度和分類效率。我們的模型可以隨著收到大量電子郵件的人的生活質量的提高,使他們能夠順利地瀏覽他們的電子郵件,並且只為他們的預期目的使用他們的賬戶”。
該團隊開發了一個基於多目標特徵選擇和自適應膠囊網絡的模型,並在圖像和文本數據集上進行訓練。據稱,這種使用深度學習技術的模型提供了簡單的實現方式,可以在短時間內快速訓練。Kadam 說,他們的初步評估顯示,新模型擁有比其他現有方法更高的準確性。該團隊指出,這可以幫助提高用戶的安全性,並幫助他們更好、更容易地撇開無關的電子郵件。
在接受TechXplore 採訪的時候,Kadam 表示:“我們的模型也降低了訓練速度,並導致了更高的分類效率。與其他模型相比,它提高了垃圾郵件檢測的收斂率,取得了更好的效果”。
另一方面,該小組表示,該模型仍然需要開發,以確保在速度和精度方面的最大效率。不過,一旦準備就緒,這種垃圾郵件過濾技術就可以大規模使用,包括在Gmail、雅虎郵箱和Outlook上使用。
Kadam 表示:
垃圾郵件檢測和過濾系統的安全性對於實現更好的準確性和可靠的結果至關重要,這可以在未來使用集合學習來改進。許多模型的誤報率仍然高於要求,但今後應減少到盡可能小的數值。實時垃圾郵件分類是非常需要的,因為大多數提出的模型在實時數據中不能很好地工作……
幾乎所有的研究人員都根據他們的模型的準確性、精確性和召回率來展示他們的結果,但我們覺得機器學習模型的時間複雜性也應該被視為一個評估指標。
一些研究人員在使用詞包進行特徵提取的過程中顯示出有希望的結果,因為他們聲稱電子郵件的標題對於垃圾郵件的檢測和正文內容一樣重要。因此,未來也可以考慮對標題行進行深度特徵提取。