AI外包正轉向歐美地區尋找各類專業人才訓練大模型
隨著傳統職業人員如語言專家、創意作家和核物理學家等逐漸成為“數據標註工”,他們的職業前景正變得岌岌可危,最終可能被他們所培訓的人工智能係統所取代。
以下是翻譯內容:
傑伊(Jay)高中時愛上了數學,他的物理老師向他展示了複雜微積分的樂趣。大學時期,傑伊專攻物理和數學,夢想有一天能將自己的知識傳授給下一代。這個機會出現在2022年10月,當時25歲的傑伊加入了一個線上平台,以數學專家的身份為方程式評分。但他的工作不同於傳統教師,他的工作重點將專注於訓練一個人工智慧系統,而這正是可能使他的專業知識變得不再那麼重要。
為了保護自己的隱私,傑伊選擇了使用化名。他透露,他當時幫助培訓的系統由OpenAI開發,他的工作是為該公司的大語言模型(LLM)提供專家指導。這台機器學習系統具備聊天機器人的會話能力,並試圖提升其在數學領域的解題能力。在葡萄牙的家中,傑伊負責評估人工智慧模型在解決數學問題時的步驟是否正確,透過添加點讚或不滿的表情符號來提供回饋,甚至在必要時解釋模型出錯的原因。
傑伊知道,他正在為薩姆·奧特曼(Sam Altman)領導的OpenAI訓練演算法,因為他被邀請加入OpenAI的Slack工作頻道。在與《連線》分享的截圖顯示,傑伊是名為「數學培訓師」的小組成員,該小組是由OpenAI研究員尤里·布爾達(Yuri Burda)建立的。但傑伊並非直接為OpenAI工作,他的雇主是全球最大的資料勞動平台之一Remotasks。這家公司是美國新創公司ScaleAI的子公司,2021年的估值已超70億美元,客戶涵蓋了OpenAI、Meta、微軟和美國陸軍等。
Scale AI與客戶密切合作,提供和管理他們需要的訓練數據,以建立自動駕駛汽車或大語言模型背後的人工智慧模型。通常情況下,這些寶貴的數據往往來自與Scale AI緊密合作的Remotasks簽約員工。自2017年成立以來,這家數據巨頭已與全球數十萬名員工建立合作關係,尤其是在勞動成本相對較低的國家,如菲律賓。 Remotasks表示,菲律賓員工主要致力於自動駕駛汽車的電腦視覺訓練,幫助車輛精準辨識周遭環境。
然而,在過去的一年裡,Scale AI的重點已轉向美國和歐洲。他們正積極招募白領和語言專家,為日益興起的大語言模型提供訓練資料。這一轉變無疑加劇了人們對未來職業的擔憂,這些白領和語言專家正在訓練將來可能取代他們職業的人工智慧競爭對手。
傑伊對自己在未來工作中扮演的角色進行了深入反思。他承認自己在傳遞知識給人工智慧,但他堅信,人工智慧模型難以複製人類在解決複雜數學問題時的獨特能力。他期望自己參與的工作能創造出與他程度相當的聊天機器人,共同探索數學的奧秘,而非取代他的人工智慧。他說:“當我開始訓練這些模型時,這正是我所期望的。”
面對人工智慧系統的崛起,Scale AI負責資料營運的副總裁 Willow Primack)強調,隨著AI系統開始生成知識和內容,Remotasks等公司正尋求不同領域的專家幫助,以確保人工智慧應用的準確性和可靠性。隨著生成式人工智慧在科技產業的廣泛應用,數據供應商急需一批能夠進行「專家事實查核」的新承包商。
傑伊的時薪高達60美元,他在OpenAI推出ChatGPT之前的一個月加入了Remotasks。自那時起,該公司加速招募專業「數據標註工」。根據《連線》雜誌報道,2024年1月,Remotasks發布了招聘廣告,尋找能夠掌握20多種歐洲語言的人才,以及美國的創意作家、體育記者、化學專家和核物理學家。
普里馬克說:「如果讓生成性人工智慧完全依賴自身,它們可能會產生幻覺。即便它們提供的答案是事實,也有辦法改進,使其更加全面。專家的參與至關重要,他們提供的數據能夠真正提升人工智慧的能力。”
普里馬克表示,儘管Scale AI在菲律賓擁有龐大的營運規模,但該公司正逐步將重點轉向美國和以英語為母語的歐洲地區,尋求更多專業承包商的加入。普里馬克不太願意透露到底是什麼促使了這種轉變,是特定的Scale AI客戶要求更多的專家數據,還是該公司試圖預測下一代AI需要什麼?她稱兩者兼而有之,並解釋說,專業承包商正為眾多客戶培訓數據,而不僅僅是為單一客戶服務。
對於這一轉變的影響,產業研究人員給了自己的解釋。德國魏森鮑姆研究所的數據、演算法系統和倫理研究小組負責人米拉格羅斯·米塞利(Milagros Miceli)指出,過去大多數人工智慧技術都是在大型、多樣化的數據集上進行訓練的。然而,隨著版權問題的日益突出,許多知名出版商開始禁止資料收集,這使得資料收集變得更加困難。因此,付錢給專業承包商成為了可行的解決方案。
「去年,很多公司都在創建新的數據,以避免版權投訴。」米塞利解釋道,「如果你僱用一名作家專門為訓練你的模型而寫故事,並支付他們薪水,那麼你就擁有了這些文本的所有權,也解決了版權問題。”
自從ChatGPT等生成式人工智慧技術亮相以來,越來越多的研究預測,在美國和歐洲,那些通常由受過大學教育的人佔據的職業將面臨顛覆性的變革,而這些人以前通常被認為不會受到技術變革的影響。儘管有這些擔憂,但專業承包商提供的高薪工作仍然極具吸引力,可能會讓一些人難以放棄可能導致他們失業的培訓工作。
目前,專業職位的薪酬因專業知識而異。根據最新的招募訊息,傳染病專家在遠距培訓任務上的時薪最高可達40美元,而歷史學家的時薪為32美元。然而,受僱於特定語言訓練演算法的人往往得到的報酬更少。例如,一份招募保加利亞作家的廣告給予的時薪為5.64美元,而會說芬蘭語的專家的時薪幾乎是保加利亞作家的五倍,達到23美元。
最近剛大學畢業的安娜(Ana)住在西班牙,她認為Remotasks為像她這樣的作家提供17美元時薪「非常高」。這項工作包括監督名為Catalan的聊天機器人,然後對其答案進行排序或修正。安娜說:“我們必須糾正拼字錯誤,還要看看答案是否過於美國化。”
當提示與色情或暴力有關時,由安娜來確保機器人拒絕回答。她還被要求確保人工智慧不能回答諸如「我應該把畢生的積蓄投資在哪裡?」之類的問題。
對安娜來說,這份工作很划算。因為地處偏遠,她可以在媽媽靠近海灘的房子工作。 「我度過了最美好的夏天,」她說,並解釋了她在2023年5月、6月和7月為遠程任務採用的靈活時間表。 「在20個小時內,我賺的錢比以前工作40小時還多。」她被告知要工作六個月左右。但到了8月焚滅,僅僅三個半月後,任務開始減少。最終,她的經理也不再回覆她的訊息。
安娜的經驗表明,雖然白領「數據標註工」的薪資可能高於東南亞同行,但他們仍然面臨不確定性。傑伊和安娜都說,Remotasks突然切斷了他們的聯繫,他們覺得自己被拋棄了,而原因他們並不完全了解。工作了一年之後,傑伊說他突然無法再領取平台上的任務了。普里馬克也稱,當被問及項目為何突然終止時,Remotasks的解釋是,他們有時會暫停一個項目,以評估數據集的品質。但普里馬克承認,這種情況相當罕見。
那年夏天,安娜的朋友們圍繞著她的新職業展開了深入的討論,擔憂這一趨勢是否預示著人工智慧將逐漸取代他們的工作。但今天,她認為這只是人類進步的另一個篇章,一個她也可以利用的篇章。對她而言,人工智慧不是威脅,而是助力,是她可以積極利用的工具。她說:“假設你不想在烈日下在土豆地里工作9個小時。你要想出一種技術,讓它變得更容易。”
安娜現在把這些反思運用到自己的工作中,成為一名文案,利用人工智慧為她出謀劃策。 (小小)