IBM被指未經授權使用Flickr照片進行面部識別訓練
據外媒The Verge報導,IBM使用了近100萬張從Flickr獲取的照片來研究如何進行面部識別訓練計劃,並與外部研究人員分享。但正如NBC所指出的那樣,在Flickr上分享照片的人並不同意將他們的照片用於開發麵部識別系統,考慮到這些系統最終可以被用來監視和識別他們。
雖然攝影師可能已經獲准拍攝這些人的照片,但有些人告訴NBC,被拍照的人不知道他們的照片是用面部識別筆記註釋的,可以用來訓練算法。
“我拍攝的人都不知道他們的照片是以這種方式被使用的,”一位攝影師告訴NBC。
這些照片最初並非由IBM編制, – 它們是9920萬張照片的一部分,被稱為YFCC100M,前Flickr所有者雅虎最初組織進行研究。所有照片都是在Creative Commons許可下共享的,這通常是一個可以自由使用的信號,但有一些限制。
但是,作為一個例子,它們可能被用於訓練面部識別系統以按種族劃分,這可能不是Creative Commons的最寬鬆許可證所預期的用途。這不完全是一個理論上的例子:IBM之前製作了一個分析產品,使用隨身相機來識別人們的種族。但IBM否認將“參與涉及種族貌相的工作” 。
另外值得一提的是,IBM的初衷可能已根植在防止AI被偏置對某些群體,雖然該公司曾解釋說,需要這麼大的數據集是為了幫助訓練“公平”以及準確性。
無論哪種方式,普通人都很難檢查他們的照片是否被包含在內並要求將其刪除,因為IBM會將數據集保留給不進行學術或企業研究的任何人。NBC從不同來源獲取數據集,並在其文章中為攝影師製作了一個工具,以檢查他們的Flickr用戶名是否已包含在IBM的數據集中。然而,如果他們對參與不感興趣,那對拍攝的人來說並不一定有幫助。
IBM 在一份聲明中告訴The Verge,“我們非常重視個人隱私,並且非常謹慎地遵守隱私原則。”該公司指出,數據集只能由經過驗證的研究人員訪問,並且只包含公開可用的圖像。IBM補充說,“個人可以選擇退出這個數據集。”
IBM只是探索面部識別領域的幾家公司之一,並且在沒有明確要求他們同意的情況下使用普通人的照片並不是唯一的。例如,Facebook有80萬張人臉照片供其他研究人員下載。