失敗者還是啦啦隊長?AI能識別自拍照給人分類了
早在2009年,美國斯坦福大學和普林斯頓大學的科學家就曾提出設想,希望教授計算機識別世界上的任何物體。為了實現這個目標,他們需要很多圖片,除了貓、狗、蘋果、叉子、勺子等,還需要無數人類的圖片。
這些圖片被劃分為不同的類別,然後被展示給機器學習算法。隨著時間的推移,算法將慢慢學會如何分辨出勺子和叉子的區別。研究人員建立了包含1400多萬張圖片的數據集ImageNet,所有這些圖片被分成2萬多個類別,每個類別平均有1000張圖片。
如今,ImageNet已經成為世界上被引用最多的物體識別數據集,在研究論文中被引用超過1.2萬次。不過,ImageNet不僅僅包括物體對象,它還有近3000個專門用於人的類別,包括使用相對無害的術語描述這些人類,如“啦啦隊長”或“明星”。
但是,通過亞馬遜平台Mechanical Turk使用人力眾包,許多分類描述令人深感不安。這些類別包括“壞人”、“偽君子”、“失敗者”和“懦夫”等,而且每個類別中都有大量圖片,它們是從Flickr和其他社交媒體網站上收集而來的,且未經圖片所有者的同意就被使用。
ImageNet和其他類型訓練數據集是米蘭普拉達基金會(Prada Foundation)新展覽的主題。這個名為“訓練人類”的展覽由特雷弗·帕格倫(Trevor Paglen)和教授兼研究員凱特·克勞福德(Kate Crawford)策劃。它展示了組成ImageNet等數據集的圖片,並向訪問者展示了為計算機視覺和麵部識別系統提供支持的各類圖片。
其中ImageNet受到特殊對待,它在畫廊裡有自己的展廳,人們的照片在那裡被粘貼到卡片上,而卡片上印有它們的類別標籤。這與過去製定科學卡片目錄的方式相似,就像昆蟲標本被定在印有它們學名的卡片上那樣。
對於不能訪問米蘭的人,帕格倫和克勞福德創建了名為ImageNet Roulette的在線工具,該工具針對ImageNet的人類分類功能進行培訓。它可以讓你用網絡攝像頭拍攝照片,使用鏈接或者上傳某個人的任何照片,然後它向你提供ImageNet對該照片中目標人物的分類。
帕格倫和克勞福德在今年早些時候奧斯汀的South by Southwest會議上演示了該工具,並附上了一些照片。里奇是帕格倫工作室的開發者,但他的一些照片被認為是“馬屁精”,克勞福德的頭像則獲得了“女英雄”的分類。
當我(本文作者,Fastcompany記者凱瑟琳·施瓦布(Katharine Schwab))用電腦的網絡攝像頭親自嘗試時,ImageNet認定我是個“心理語言學家”,原因尚不清楚。帕格倫說:“我認為,總體上來說,對人類進行分類是一件值得進行更多審查的事情。”
帕格倫將機器學習的興起和人們對其算法是否客觀的看法比作19世紀末20世紀初的攝影史,當時許多人認為這些新奇的圖像天生就是中立的。他說:“當攝影被發明時,人們認為它是客觀和中立的,並鼓勵我們現在認為的那群偽科學學者測量人們的面部,以確定他們是不是罪犯。”
當然,如今我們已經可以確定,攝影帶有主觀意識,帕格倫和克勞福德希望揭示當今人工智能(AI)系統的真相,改變人們的普遍看法,即它們在某種程度上是中立的,因為它們是用數學模型構建的。克勞福德解釋稱:“無論構建什麼樣的系統對人類進行分類,它總是具有主觀性,並有一種內在的觀察方式。”
這次展覽可能是許多人第一次瞥見算法系統的基礎訓練圖像,但有些最重要的照片卻不見了。雖然“訓練人類”展覽包括開源或可供研究使用的數據集,但它排除了我們這個時代某些最強大數據集中的圖像,如Facebook上的大量圖像。
克勞福德還想強調,這些複雜的技術系統的根源在於人們日常生活中的世俗形象。他說:“它們不是那些沒有人能理解的極其抽象的數學系統,而是我們日常生活中的真實反映,它們已經被攝取到這些大型系統中,以使AI更好地進行面部識別或進行’情感檢測’。”
但這並不意味著它們是無害的。面部識別是極具爭議性的,而情感識別的真相也開始被科學家揭穿。
展覽中包括的數據集之一是1997年的日本女性面部表情數據集,其中有213張照片,被分為六種面部表情,這些表情被認為與內心的情緒狀態相對應,分別是喜悅、驚訝、悲傷、厭惡、憤怒和恐懼。克勞福德指出,這是個典型例證,表明僅僅用六個類別來表達人類情感絕對不夠。
另一個被稱為FERET的數據集是由美國中情局在20世紀90年代末資助創建的,它使用了在德克薩斯大學奧斯汀實驗室工作的研究人員、實驗室助理和看門人的圖像來訓練檢測人臉的算法。
雖然許多機器學習數據集都有很大的缺陷,但無論是學術研究人員還是公司都在部署它們。但克勞福德對於如何更好地對數據集的固有偏差進行編目有自己的想法,這樣未來的AI科學家使用它們時,他們至少會意識到這個問題。
2018年,克勞福德與其他八名研究人員合作進行了一個項目,該項目為訓練集創建標籤,其中包括關於圖像來自何處、人口統計學劃分、創建者、圖像受試者是否同意、任何隱私問題以及數據集的原始意圖等信息。這些“數據集的數據表”已經在行業中得到了部分採用,這是研究人員向理解他們AI數據含義邁出的一小步。
對於帕格倫來說,可以做些什麼來減少機器學習訓練集的簡單化和完全不准確是個更大的問題,因為他相信技術永遠不可能是中立的,他認為這些系統的設計者應該質疑對人類進行分類是否真的是他們想要做的工作的一部分。他說:“你想生活在一個什麼樣的世界裡?這是首先需要弄清楚的問題。” (選自:Fastcompany 作者:Katharine Schwab 編譯:網易智能參與:小小