微軟新專利揭示檢測“有毒”內容的新技術
美國專利商標局已授予微軟一項新專利,公佈了一種計算機實現的檢測“有毒”內容的方法的細節。該專利–具有可解釋性特徵的“有毒”內容檢測–已於10月1日授予微軟,並將張曉然、Emilia Stoica和Clayton Holz列為發明人。
該技術以概率方式確定一個“有毒”關鍵詞標識符作為“有毒”內容的指示。
以下是背景介紹。在組織中,人力資源人員經常進行調查,以徵求和獲得員工的意見,評估和改善公司的健康狀況。審查可能包括工作場所可能存在不良內容的標識符,包括粗魯、不尊重、威脅、淫穢、侮辱和包含基於身份的仇恨的評論。這類組織會很感激能夠幫助他們在員工提交的數万或數十萬條評論中快速識別這些“有毒”評論的解決方案。如果調查回复顯示出“毒性”,人力資源部門就可以對回復進行挖掘,以便採取進一步的行動。
公開了用於準確和可解釋的“有毒”內容檢測的計算機實現的技術。該技術包括使用概率“有毒”關鍵字標識符來概率地確定指示“有毒”內容的關鍵字。在一個實施方案中,“有毒”關鍵詞是基於比較一組示例“有毒”人際電子通信中的關鍵詞的術語頻率與一組示例“無毒”人際電子通信中的關鍵詞的術語頻率來確定的。如果一個關鍵詞在一組“有毒”實例中的術語頻率比其在一組“無毒”實例中的術語頻率多出一個閾值數倍,則該關鍵詞被確定為指示“有毒”內容。通過這種方式,可以確定指示“有毒”內容的多個關鍵詞的集合。然後,包含被確定為“有毒”的關鍵詞的調查評論在用戶界面中被標記為潛在的“有毒”內容,供人審查。
科技公司申請了多項專利,但這些專利往往不會出現在面向消費者的產品中,所以任何關於這項專利技術應用的猜測都是猜測。微軟還可以將這種技術的用途擴大到分析微軟Teams中聊天和視頻記錄中的“有毒”行為。