AI無人商店背後,是上千個印度人透過攝影機看美國人買西藍花?
人們常說,有多少智能,就有多少人工。但是,亞馬遜的這個項目,人工含量似乎有點高。這個計畫名叫「Just Walk Out」。就像它的名字所暗示的,你可以走進亞馬遜的無人購物商店裡,選好東西,然後直接走出去,無需排隊等待結帳。
因為,透過與電腦視覺和深度學習演算法結合,Just Walk Out 技術能夠準確地識別你拿取的商品,並完成結算,整個過程非常省心,聽起來也很聰明。
但是,事實可能並非如此。根據外媒The Information 報道,「Just Walk Out」其實要依靠來自印度的一個千人團隊來觀看和標記視頻,以確保準確的結算結果。從2022 年的數據來看,每1,000 筆交易就有700 筆需要該團隊審核,而亞馬遜原本希望這一數字是20~50 筆。
Just Walk Out 於2016 年首次推出,展現了亞馬遜在雜貨店購物方面最大膽的創新。它最大的好處是不用採集顧客生物辨識訊息,可以免去很多隱私方面的擔憂。
在2023 年9 月發布的一篇介紹文章中,亞馬遜寫到,「Just Walk Out 是電腦視覺、目標識別、高級感測器、深度機器學習模型和生成式人工智慧的結合。亞馬遜研究人員找到了一種方法,使這些技術在後台無縫地協同工作。如此一來,商店幾乎可以立即弄清楚哪個顧客拿了金槍魚三明治,哪個拿了雞肉沙拉,然後算出正確的費用,並讓顧客拿著東西離開。 」
具體來說,採用Just Walk Out 的商店會在天花板上安裝幾個專用攝影機。在購物者進入商店後,該技術會為他們分配一個臨時數字代碼。當他們離開時,代碼會消失。如果他們回來,他們會得到一個新代碼。
在購物時,Just Walk Out 可以偵測購物者的手何時與貨架上的商品互動。在產生互動後,演算法會將商品放入虛擬購物車。如果購物者把東西放回貨架,系統也會進行相應調整。此外,技術也會提醒店員將放錯地方的物品放回去。對於較小、難以看到的產品,如口香糖或口紅,貨架上的重量感測器會偵測顧客何時拿起東西。
亞馬遜表示,為了訓練這個系統,他們創建了一個合成資料集。該資料集包含數百萬張AI 生成的合成圖片和影片剪輯,模仿了真實的、有時甚至是罕見的購物場景。
這項技術在需要快速購物的體育賽事場景中非常有效。根據亞馬遜的數據,在2022 年9 月安裝Just Walk Out 技術後,District Market(一家提供啤酒、蘇打水、比賽日小吃的便利店)的銷售額比同一地點的前一家商店多了一倍,球迷滿意度調查得分創下歷史新高。
在過去的幾年裡,亞馬遜已經將Just Walk Out 推廣到大型商店。目前,44 家Amazon Fresh(亞馬遜旗下生鮮商店)中有27 家擁有這項技術。亞馬遜也在一些Whole Foods(亞馬遜旗下連鎖超市)增加了Just Walk Out。
但The Information 記者Theo Wayt 在2023 年的一份報道中指出,亞馬遜尚未在一家不屬於自己的大型商店中部署這項技術,因為它的成本實在是太高了:首先,引入該技術的超市要進行升級改造,這意味著要關閉一段時間,每家商店的掃描器和攝影機系統也非常昂貴;其次,工作人員需要確保商店貨架保持整齊,以便掃描技術能夠發揮作用。
更要命的是,亞馬遜仍依靠大量的人力在幕後為Just Walk Out 保駕護航。一位技術人員表示,截至2022 年年中,亞馬遜在印度有1,000 多人在為Just Walk Out 工作,他們的工作包括人工審核交易和標註影片中的影像,以訓練Just Walk Out 的機器學習模式。該人士說,對後台人員的依賴在一定程度上解釋了為什麼顧客走出商店後需要幾個小時才能收到收據。這樣的延遲可能會讓精打細算的購物者感到不安。
但亞馬遜的發言人在一定程度上反駁了該說法,稱The Information“對人工審核員的角色和數量的描述並不准確”,但沒有說明亞馬遜使用了多少審核員。發言人表示,印度員工的主要職責是機器學習資料助理,除了驗證購買情況外,還負責註釋視訊影像,幫助公司訓練模型。
不過,時隔一年,亞馬遜似乎也扛不住了。
在The Information 的新報道中,Theo Wayt 指出,亞馬遜準備在新開的一批雜貨店中放棄Just Walk Out,轉用帶有螢幕和掃描器的Dash Carts 智慧購物車結帳。這種購物車可以即時顯示購物支出,比Just Walk Out 更可靠。
這篇報導讓Just Walk Out 背後的千人印度團隊重新吸引了人們的注意。對於這種購物時有人看著的感覺,很多人感覺不自在,對一些「智慧型」設備的濾鏡也是碎了一地。
也有人比較樂觀,覺得亞馬遜確實在靠這個團隊改進AI 演算法,但進展不太順利。 「想像1000 個傢伙看著美國人購買西蘭花還是很有趣的」。
在事件發酵後,亞馬遜發言人不得不再次出來闢謠。
「認為Just Walk Out技術依賴人類審核員在印度現場看著購物者的說法具有誤導性和不準確性,」亞馬遜發言人在給USA TODAY的電子郵件聲明中表示。 “與許多人工智慧系統一樣,底層機器學習模型通過生成合成數據和註釋實際視頻數據來不斷改進。”
“我們的員工會通過查看錄製的視頻片段來驗證一小部分購物訪問,以確保我們的系統能夠達到我們的高準確性標準,這是因為我們不斷改進演算法,並利用人工輸入來糾正演算法。”這位發言人補充說。
身為兩篇報導的作者,Theo Wayt 極力發聲明說報道的內容被社群媒體扭曲了。不過,他也認為,這個故事傳播了一個基本事實:許多華而不實的AI 背後仍需要人工。
從目前的消息來看,亞馬遜似乎還沒有打算完全放棄Just Walk Out。他們會在一些Fresh 商店、Amazon Go 便利商店以及一些體育場管中保留這項技術。