揭秘人臉識別灰色產業鏈:你的面部信息值多少錢?
人臉識別技術已經強大到對公民的自由構成嚴重威脅。儘管如此,這個行業仍然蓬勃發展。如今,數十家初創企業和科技巨頭正在向酒店、零售店、甚至學校和夏令營銷售人臉識別服務。這一業務的興盛歸功於新算法,現在的算法在辨認人臉方面比五年前的更精確。
為了改進這些算法,公司會對它們進行數十億張人臉辨認的訓練,而這個訓練通常不需要徵得任何人的同意。你的臉很有可能就是這些公司使用的“培訓樣本”之一,或者說是公司客戶數據庫的一部分。
目前,面部識別軟件的使用幾乎不受法律限制,這就意味著人們可能無法阻止公司以這種方式使用他們的面部信息。
2018年,乘客們匆匆走過華盛頓特區附近的捷威機場時,被一架攝像機捕捉了下來。
實際上,捷威機場和乘客都不是真實存在的;這僅僅是NIST展示如何實操收集人臉的一套裝置。這些人臉將在NIST舉辦的競賽上使用,該競賽邀請全球各地的公司來測試他們的面部識別軟件。
在這次演習中,志願者們允許負責機構使用他們的面部信息。這是早期進行面部識別方式——研究人員煞費苦心地爭取人們的同意,將收集的人臉納入他們的數據庫當中。
如今,公司已經成為人臉識別領域的佼佼者,他們如果認為向海量被識別者徵求同意是一件麻煩事,他們可能就不會再多此一舉了。
包括Kairos在內的行業領軍企業正在人臉識別軟件市場展開競爭。他們的客戶群體涉及執法人員、零售商、甚至高中學生。
MRFR的數據顯示,這個市場的規模每年增長20%,預計到2022年將達到每年90億美元的規模。
在製作最佳軟件的這場角逐中,獲勝者將是那些算法能夠高精度地識別面部,不會產生誤報的公司。與人工智能的其他領域一樣,創建最佳面部識別算法意味著要收集大量面部數據來完成訓練。
雖然公司可以使用政府和大學編制的數據集合,如耶魯大學的人臉數據庫,但這些數據集相對較小,包含的人臉不超過幾千張。
這些官方數據集還有其他限制,其中許多缺乏種族多樣性,或者無法辨認出改變現實人臉的條件,比如陰影、帽子或妝容。
為了建立能夠在實戰中辨認出個體面部的識別技術,公司需要更多的圖像來做實驗。
面部識別軟件公司FaceFirst位於加利福尼亞,他們公司幫助零售商辨別犯罪分子,防止他們進入商店。
公司的首席執行官Peter Trepp說道,“數百張不夠,數千張還不夠。你需要數百萬張圖片。如果你沒有將戴眼鏡的人或有色人種收錄進數據庫,你將得不到準確的結果。”
故事要從一個App說起
軟件公司從那些途徑可以獲得數百萬張圖像來訓練軟件呢?
其中之一便是警局的圖片數據庫。軟件公司可以在州政府機構公開獲得這些數據庫,也可以從私人公司進行購買。Vigilant Solutions公司就提供1500萬張面孔,可以用來“解決”人臉識別軟件訓練的難題。
然而,一些初創公司已經找到了更好的面孔來源:個人相冊應用。
這些應用程序可以編輯存儲在個人手機上的照片,而且通常都包含同一個人的擺出多種姿勢和身處不同情境圖像,這可是豐富的訓練數據源。
Ever AI的首席執行官Doug Aley說道,“我們有同一個人身處數千種不同的場景的圖像。即便是戴著帽子站在陰影中,你也能準確地辨認出來。”
Ever AI是舊金山一家面部識別初創公司,於2012年以EverRoll為名成立,公司的應用程序幫助用戶管理日益膨脹的照片收藏。
目前,Ever AI已經從Khosla Ventures以及其他矽谷風險投資公司籌集了2900萬美元,參加了NIST最近舉行的面部識別競賽,並在比賽的“Mugshots”類別中排名第二。在“Faces in the Wild”類別中排名第三。
Aley認為,自己公司龐大的照片數據庫取得了成功,Ever AI數據庫的圖片數量估計達到130億張。
早期,Ever AI僅僅是一個照片應用程序,當時,這家公司激進的營銷舉措引發了爭議,導致Apple在2016年暫時從App Store暫時下架了EverRoll。
最讓人記憶深刻的大概是,該應用程序誘使用戶向所有手機聯繫人發送促銷鏈接。用戶還指責該應用程序竊取了他們的信息。
2015年,德克薩斯州的Greg Miller在Facebook上吐槽,“EverRoll程序安裝後的第一件事就是收集你手機裡的電話號碼,並立即給所有人發消息。然後,你所有的照片就會被放到雲端。”
四年後,Miller驚愕地發現,EverRoll仍然保存著他的照片,只不過現在它已成為面部識別公司。
“我當時並沒有意識到這個問題,我一點也不同意他們的做法。”Miller告訴《財富》,“一直被追踪才是關鍵所在,我感覺毫無隱私可言,真是細思極恐。”
Ever AI首席執行官Aley聲稱,該公司不會共享個人的識別信息,只會使用這些照片來訓練公司的面部識別軟件。他還補充說,自己的公司類似於社交媒體,人們可以選擇退出。
Aley否認Ever AI從一開始就打算成為一家面部識別公司,並表示公司現在關閉照片應用程序是一項商業決定。
目前,Ever AI的客戶將該公司的人臉識別產品用於一系列活動,包括企業ID管理,零售,電信和執法。
EverRoll並不是唯一提供用戶照片的公司,另一個例子是Orbeus。這家位於舊金山的公司,於2016年被亞馬遜悄然收購,曾經是PhotoTime的組織者。
Orbeus的老員工透露,該公司的人工智能技術以及擁有的大量照片,使其成為一個誘人的收購目標。這位拒絕透露身份的員工表示,“亞馬遜當時正在尋找這種公司。”
今天,PhotoTime應用程序已不復存在,儘管亞馬遜繼續銷售另一款名為Rekognition的Orbeus產品。這個產品是執法機構和其他組織使用的一種面部識別軟件。
亞馬遜拒絕提供將Orbeus收集的照片用於訓練軟件的詳細信息,僅表明公司從各種來源獲取AI項目的數據。亞馬遜還補充說,它沒有使用客戶的照片服務來訓練其算法。
另一家使用用戶照片來訓練面部識別算法的公司是Real Networks。這家公司總部位於西雅圖,曾因其20世紀90年代的在線視頻播放器而聞名。
如今,這家公司專注於可以識別學校兒童面孔的軟件。與此同時,它開發了一款針對家庭的智能手機應用程序,名叫RealTimes。
然而,一位評論家表示這只是公司為獲取面部信息而找的藉口。
所有這些都引發了一些問題:公司應採取什麼措施來保護他們收集的面部數據?政府是否要加大監管力度?
隨著面部識別傳播到更多社會領域,解決這些問題將變得迫在眉睫。
橫跨教育和零售領域
面部識別軟件並不是新鮮事物,該技術早在20世紀80年代就已出現。當時美國數學家將人臉定義為一系列數值,並使用概率模型來找到匹配目標。
但在過去的幾年裡,情況發生了變化。NIST的Grother說:“面部識別正在經歷一場革命。”他補充說,“基礎技術已發生變化。舊技術已經被新一代算法取代,新技術非常高效。”
面部識別的這場革命得益於兩個因素,而這些因素正在讓人工智能領域變得更加廣泛。
第一個是新興的深度學習科學,這是一種類似於人類大腦的模式識別系統。第二個是前所未有的大量數據,可以藉助雲計算實現低成本存儲和解析。
不出所料,第一批充分利用這些新技術的公司是Google和Facebook。
2014年,Facebook推出了一個名為DeepFace的程序,該程序能夠辨別兩張面孔是否屬於同一個人,準確率高達97.25% 。這個比率與人類在同一測試中得分相同。
一年後,Google憑藉FaceNet計劃獲得了100%的準確率。
如今,像微軟這樣的公司和其他科技巨頭都是面部識別的領軍者,這在很大程度上取決於他們可以訪問大型面部數據庫。
不過,越來越多的初創公司也在發布高精度分數,因為他們要在日益發展的面部識別市場中尋求利基。
市場研究公司PitchBook表示,矽谷一直在向該領域進軍。該公司的數據顯示,人臉識別市場在過去三年的平均投資額為7870萬美元。
在矽谷,這並不是一個令人心儀的數字,但它反映了風險資本家的一個重要賭注,也就是說,至少有少數面部識別創業公司會發展成大企業。
面部識別公司的商業模式仍在不斷擴大。
Crunchbase的數據顯示,Ever AI和FaceFirst等創業公司的年收入在200萬美元到800萬美元的區間浮動,收益相對較小。與此同時,亞馬遜和其他科技巨頭尚未透露他們的收入中有多少來自面部識別。
多年來,面部識別最狂熱的付費客戶一直是執法機構。然而,最近,包括沃爾瑪在內,越來越多的商業組織使用這種軟件來識別和了解他們的客戶。
情況確實如此,FaceFirst向包括商店和藥店在內的數百家零售商銷售面部識別軟件。
該公司的首席執行官Trepp表示,他的大部分客戶都使用這項技術來辨認進入他們商店的罪犯,但越來越多的零售商也在測試其他項目,例如識別VIP客戶或識別員工。
據報導,亞馬遜這家零售巨頭除了向警察局出售產品外,還與酒店合作,幫助酒店加快辦理入住手續。
然而,亞馬遜的這些舉措並非沒有爭議。
去年7月,美國公民自由聯盟(ACLU)對亞馬遜的軟件進行了測試,將每一位國會議員的臉與收錄重罪罪犯的數據庫進行比對。結果該測試導致了28個誤報,其中大多數為有色國會議員。
作為回應,ACLU呼籲禁止執法部門使用面部識別技術。
亞馬遜的員工也向公司施壓,要求其證明向警察部門、美國移民和海關執法部門出售軟件的正當性。
一些國會議員,包括眾議員Rep. Jerrold Nadler和參議員Sen. Ron Wyden已經要求政府問責局調查面部識別軟件的使用。
企業領導者也對該技術的應用感到不安,其中包括微軟總裁Brad Smith,他在去年12月呼籲政府進行監管。
不過,儘管人們的擔憂不斷加劇,但隨著企業找到新的、新穎的應用來銷售面部識別技術,它的應用正在擴大。
化妝以及燈光都不會影響人臉識別
家庭照片應用程序的開發商Real Networks正在向全國各地的K-12學校免費提供面部識別軟件。該公司表示,現在有數百所學校正在使用它。
在接受《連線》雜誌採訪時,該公司首席執行官Rob Glaser表示,他發起這一倡議的初衷是為了解決有關學校安全和槍支管控的爭論,而非黨派之爭。
Real Networks並不是唯一專注於兒童面部識別產品的公司。
德克薩斯州一家名為Waldo的公司正在向數百所學校、兒童體育聯盟和夏令營提供面部識別技術。實際上,這項技術需要使用Waldo的軟件來掃描攝像機或官方攝影師拍攝的圖像,然後將孩子的臉與父母提供的圖像進行匹配。那些不想參加的家長可以選擇退出。
該服務目前在美國30多個州開展。Waldo和FaceFirst的發展表明,企業正在將人臉識別平常化。
不久前,人臉識別還只是科幻小說中的內容,現在,這項技術已經擴散到美國經濟的更多領域。
你的面部信息該何去何從
儘管人們對人臉識別的擔憂主要集中在政府機構的使用上,但私人公司甚至個人對人臉識別的使用卻帶來了更為明顯的隱私風險。
越來越多的公司開始銷售面部識別技術,我們的面孔也會在越來越多地出現在數據庫中,這種軟件可能會受到偷窺者和跟踪者的歡迎。
商人和房東也可以用它來識別不速之客,並悄悄地停止提供住房或服務。
黑客入侵的風險也同樣存在。
網絡安全公司Gemini Advisors的Andrei Barysevich說,他看到印度國家生物識別數據庫的個人資料被盜,在“黑暗網絡”網站上出售。
目前,他還沒有看到出售的美國人臉數據庫,但他補充說:“這只是時間問題。”從酒店或零售商手中偷取顧客面部信息,可能會幫助犯罪分子實施欺詐或身份盜竊。
由於該技術幾乎沒有政府監管,因此限制其濫用的最佳希望可能在於軟件製造商本身。
在接受《財富》採訪時,面部識別初創公司的首席執行官們都表示,他們非常關注隱私風險。包括FaceFirst首席執行官在內的一些人士指出,人臉識別系統的廣泛應用值得警惕。
Waldo的首席執行官Rice還擔心,立法人員制定使用面部技術的規則可能弊大於利。他說:“把嬰兒和洗澡水一起潑出去,制定一系列瘋狂的規定,這將是一種諷刺。”
與此同時,一些製作人臉識別軟件的公司正在使用新技術,這可能會減少訓練算法對大量人臉的需求。
邁阿密面部識別初創公司Kairos就是這樣一個例子。
據Kairos首席安全官Stephen Moore稱,公司正致力於“合成”面孔數據,以復制各種面部表情和光照條件。他說,這些“人造臉”意味著公司不用依靠太多真實人臉也能製造人臉識別軟件產品。
對購買軟件的客戶進行監管、提高數據的安全性以及合成訓練樣本,這些措施都可以讓我們的擔憂有所減輕。
FaceFirst的Trepp認為,隨著我們越來越熟悉這項技術,對它的焦慮也會減弱。他甚至認為,2002年的科幻電影《少數派報告》中的面部識別場景將變得很常見。
ACLU以及其他組織則不那麼樂觀。
儘管這項技術引起的爭議越來越大,但目前幾乎沒有任何法律來限制面部信息的使用,除了伊利諾斯州、德克薩斯州和華盛頓州。
在這三個地方使用人臉信息需要徵求同意。雖然這些法律尚未真正經過測試,但在伊利諾伊州,人們可以通過訴訟來強制執行該權利。
2017年,Facebook和Google進行了一次不成功的遊說活動,試圖說服伊利諾伊州立法者淡化法律。
其他州也在考慮自己的生物識別法。然而在聯邦一級,立法者迄今為止很少關注此事。
但情況很快就會有所轉變。
參議員Brian Schatz和Roy Blount已提出了一項法案,要求軟件公司獲得許可之後才能在公共場所使用面部識別,或是與第三方共享面部數據。