資料工作者在DAIR報告中詳述科技業內容節制過程中所存在的剝削行為
資料工作的基本勞動,如修改和註釋被系統性地隱藏起來,不讓那些從勞動成果中受益的人看到。一個新計畫將世界各地數據工作者的生活經驗置於聚光燈下,以第一手資料展示海外科技工作的成本和機會。
許多乏味、吃力不討好或有損心理健康的工作被外包給了更貧窮的國家,那裡的工人樂於以美國或歐洲工資的一小部分來從事這些工作。這種勞動市場與電子產品”回收”和拆船等其他”乏味、骯髒或危險”的工作一樣。適度工作或註釋工作的條件不可能讓你失去一隻手臂或罹患癌症,但這並不意味著它們是安全的,更不會讓你感到愉快或有成就感。
資料工人調查”是人工智慧倫理研究小組DAIR和柏林工業大學的合作項目,名義上是以馬克思在19世紀末的工作為藍本,在”集體製作和政治上可操作”的報告中確定勞動條件。
所有報告均可免費獲取,並在今天舉行的線上活動上發布:
人工智慧應用範圍的不斷擴大必然建立在人類專業知識的基礎上,而這種專業知識至今仍是以公司所能提供的最低價值購買的,同時又不會引發公共關係問題。當你舉報一個帖子時,它不會說:”很好,我們會把這個帖子發給敘利亞的一個人,他只需支付3 美分就能搞定。”但是舉報的數量(以及值得報道的內容的數量)如此之高,除了將工作大規模外包給廉價勞動力市場之外,其他解決方案對相關公司來說並無實際意義。
細讀這些報告,它們大多是傳聞,而且是有意為之。這些報告與其說是定量分析,不如說是系統性的人類學觀察。
對這類經驗進行量化往往無法捕捉到真正的成本–你最終得到的統計數據都是公司喜歡大肆宣揚的類型(因此在研究中也會徵求這些數據):比該地區其他公司更高的工資、創造的就業機會、轉嫁給客戶的成本節約。很少有人提及節制工人因噩夢而失眠或藥物依賴猖獗等問題,更不用說對其進行衡量和介紹了。
以Fasica Berhane Gebrekidan關於肯亞數據工作者在精神健康和毒品問題中掙扎的報告為例。 ( PDF 全文請點擊此處)。她和她的同事為Sama 公司工作,該公司標榜自己是一個更有道德的數據工作管道,但實際工作情況正如實際工作者所描述的那樣,是無盡的苦難和缺乏當地辦事處的支持。
舉報人拍攝的肯亞Samasource 公司的審核工作空間。 圖片來源:Fasica Berhane GebrekidanFasica Berhane Gebrekidan
報導稱,他們被招募來處理當地語言和方言的舉報內容,這意味著他們會接觸到無休止的暴力、血腥、性虐待、仇恨言論和其他內容,他們必須快速瀏覽並”採取行動”,以免他們的表現低於預期水平,導致被扣薪。對某些人來說,這意味著他們每分鐘都要瀏覽超過一條此類內容,也就是說,他們每天至少要瀏覽約500 條此類內容。 (如果你想知道人工智慧在哪裡–他們很可能正在提供訓練資料)。
“這絕對讓人心碎。我看到了可以想像到的最糟糕的事情。我擔心我會因為做這份工作而終生留下傷疤,”受訪的承包商之一拉赫爾-格布雷基爾科斯(Rahel Gebrekirkos)說。
輔助人員”裝備不足、不專業、素質不高”,主持人經常求助於藥物來應對,並抱怨有乾擾性想法、抑鬱和其他問題。
我們以前聽說過一些這樣的事情,但現在聽說仍在發生,還是很有意義的。這類報導有好幾篇,但其他報導更多的是個人經歷或採用不同的形式。
例如,YasserYousef Alrayes 是敘利亞的資料標註員,靠工作來支付高等教育學費。他和室友一起從事視覺化註釋工作,例如解析文字圖像,正如他所指出的,這些圖像往往定義不清,而客戶的要求又令人沮喪。
他選擇以短片的形式記錄自己的工作,這部短片非常值得您花八分鐘的時間來觀看:
像亞瑟這樣的工人往往被掩蓋在許多組織層級的背後,充當分包商的分包商,這樣一旦出現問題或訴訟,責任界線就會模糊不清。
DAIR 和柏林工業大學的Milagros Miceli(該計畫的負責人之一)告訴我,他們還沒有看到報告中提到的公司提出任何意見或改變,但現在還為時過早。但這些結果似乎足以讓他們回去繼續研究,她寫道:「我們計劃與第二批數據工作者一起繼續這項工作,他們很可能來自巴西、芬蘭、中國和印度。”
毫無疑問,有些人會對這些報告不屑一顧,因為這正是它們的價值所在:它們的軼事性質。但是,統計數字很容易說謊,而軼事卻至少有一定的真實性,因為這些故事都是直接從源頭開始的。即使只有肯亞、敘利亞或委內瑞拉的十幾位審核人員有這些問題,他們所說的情況也應該引起所有人的注意。