商業用途遭曝光後微軟刪除包含1000萬張人臉圖像的數據庫
據外媒OnMSFT報導,微軟已經悄然刪除了MS Celeb。這是一個包括1000萬張圖像的訓練數據庫,其目的是被用於識別人臉圖像。根據英國《金融時報》的一份報告,包含來自一百萬名名人的圖片的數據庫已經成為問題,因為它還包括來自“有爭議的個人”的圖像。
更令人不安的是,據報導數據庫已經被包括IBM,松下,Nvidia在內的科技巨頭所使用,以及其他涉嫌利用它來改進監控技術的公司。
微軟於2016年創建了MS Celeb數據庫,在Creative Commons授權下從網上收集圖像。當時,該公司聲稱MS Celeb是世界上最大的公共面部識別數據庫。但是,該特定過程的問題在於,微軟創建的數據集包括一些對此不知情的人士的圖片,從而導致一些潛在的隱私問題。
但是,微軟拒絕承認刪除其MS Celeb數據庫是由於隱私問題。“該網站旨在用於學術目的,”該公司告訴英國《金融時報》。“這是由一名已從微軟離職的員工運營的。”
儘管MS Celeb現已被刪除,其內容並未完全從互聯網上消失。熟悉類似海量數據庫的研究員Adam Harvey告訴英國《金融時報》,人們將其發佈在GitHub上,將文件上傳到Dropbox和百度雲上,因此沒有辦法阻止他們繼續發布並將其用於他們自己的目的。”