人臉識別新工具:數據少也能認識“國際臉”
日前,亞馬遜的一款人臉識別工具錯誤地將28位美國國會議員與罪犯相匹配,這一新聞引發關注。人臉識別工具為何出現這樣的錯誤?其實,機器與人類一樣,見到陌生的外國人也會有“臉盲”,只能識別“當地人”,對於來自其他國家/地區的“外地人”識別精度較低,這一問題如何解決呢?
引用公開的個人信息進行研究與驗證鄧偉洪團隊供圖
研究團隊在討論鄧偉洪團隊供圖
其關鍵在於讓人臉識別工具盡量多地認識全球各地居民的臉,而這一過程卻並不容易實現。北京郵電大學教授鄧偉洪告訴《中國科學報》,人臉識別工具研發過程中,使用的訓練數據越多、越齊全,精度就會越高。但由於不同國家/地區對公民個人信息的保護,這些信息收集越來越難。沒有訓練數據就意味著人臉識別工具只認識“熟人”,而對於訓練數據中缺失的人群的識別精度較低。
近日,鄧偉洪研究團隊的一項研究獲得新進展,該團隊揭示了當前人臉識別算法中普遍存在跨國家/地區識別偏差問題,構建了評價偏差程度的人臉數據集RFW,提出了減小識別偏差的信息最大化自適應神經網絡,以改進對目標域的識別能力。10月27日,相關研究結果在由IEEE主辦的國際計算機視覺大會(ICCV)上發表。
人臉識別工具的地域之困
卷積神經網絡是人工智能的代表算法之一,具有很強的圖像表徵學習能力。2012年,深度卷積神經網絡在計算機視覺領域興起,其出現極大地推進了人臉識別的發展,並成為人臉識別領域的主流技術。
目前,全球的人臉識別工具大多根據深度卷積神經網絡的技術開發,但該技術的人臉數據的源域基於西方人的面部特徵,面對不同的目標域,即不同國家/地區居民的面部信息識別需求往往“力不從心”。
鄧偉洪表示,由於缺乏基準測試庫,這一領域的研究長期進展緩慢。一款人臉識別工具即使在當地的識別率很高,也難以精準到全球人類。這就造成了人臉識別工具較強的地域性。
為了推動該研究,鄧偉洪研究團隊構建了一個新的測試庫——RFW,以科學客觀地評測人臉識別中的偏差。
在RFW數據庫的基礎上,研究人員驗證了微軟、亞馬遜、百度、曠視的商業API和學術界最先進的4個算法。
“這種識別的偏差確實存在,一些地區的錯誤率甚至高於西方國家的兩倍。”鄧偉洪說。
該論文的評審專家表示,RFW與現有數據庫相比,該數據庫中的數據分佈更均勻,這將成為跨國家/地區識別的一個較好的基準評價數據。
為了探究這種偏差是否是由訓練數據的分佈不平衡引起的,研究人員收集了一個涵蓋全球各地區人類信息的訓練數據庫,最終發現偏差的發生受到數據和算法兩方面影響。
該論文第一作者、北京郵電大學博士生王玫解釋,數據庫訓練數據平衡、算法相同,但某些國家/地區人類的面部信息識別難度較大,導致識別準確率較低。
如何在數據少、面部識別難的情況下提高識別率?研究人員並沒有放棄,他們決定進一步的研究算法,借助算法讓人臉識別工具舉一反三。
學習靠“自覺”
傳統機器學習數據庫搭建過程中需要人工標註個人信息,這一操作面臨隱私洩露的風險。用於物體識別的無監督域自適應方法給了研究人員啟發。
該方法採用無監督學習的方式,將源域和目標域映射到域不變的特徵空間,並提高目標域性能。研究人員想通過算法解決這一問題,讓機器自行學習。
“這就相當於研究人員把試卷出好,機器作答。”鄧偉洪說。
實現並不簡單,在具體操作層面,物體識別不同於人臉識別。物體識別的源域和目標域可以重疊,且信息獲取相對便宜,充足的源域數據使識別工具能夠區分和判別目標域信息。
因此,研究人員提出了一種信息最大化自適應網絡。王玫介紹,該方法一方面減小源域和目標域的全局分佈差異,另一方面能夠學習有區分性的目標域特徵。
“也就是說,卷積神經網絡可以在無監督的情況下,’自覺’地學習目標域人臉的特徵。”王玫說。
為了解決兩個域之間類別不重疊的問題,信息最大化自適應網絡採用譜聚類算法生成“偽標籤”,並在監督下利用偽標籤對網絡進行預適應,初步提高目標域的性能。
這種聚類方案與其他不適用於人臉識別的域自適應方法有著本質區別。王玫解釋,新方法可以在全新的目標域上自主學習,不需要人工干預,避免了隱私洩露的風險。
為了進一步提高網絡輸出的鑑別性,研究人員還提出了一種新的基於互信息的自適應方法,它以無監督的方式在目標域的特徵之間產生更大的間距。
與一般的有監督的損失和有監督的互信息不同,該方法具有無監督的特性,其可以利用所有無標籤的目標域數據,無論這些數據是否被成功地分配了偽標籤。
基於公開數據進行驗證
這套方案是否能在非監督的情況下,提高人臉識別工具對不同國家/地區居民臉部信息的識別率呢?
研究人員採用全球各地名人的公開數據進行驗證。結果表明,信息最大化自適應網絡可以成功地將識別能力從源域應用到其他國家/地區的目標域人群中,且識別性能優於其他域自適應方法。消融實驗研究發現,互信息損失對減少識別偏差有重要作用。
王玫補充,信息最大化自適應網絡在跨姿態、跨場景的應用上也有很好的泛化性能。
鑑於較好的實驗結果,研究團隊已經對外發布RFW數據集,以推進研究進一步深入。
目前,已有哈佛大學、帝國理工學院、清華大學、思科、華為、NEC、IBM等20多個國家的科研院所、企業的科研團隊申請使用RFW進行多人種人臉識別研究。
值得一提的是,該方法在進行自適應學習的同時,仍然需要利用源域地區採集的標註數據對模型進行訓練。這就意味源域數據具有隱私洩露風險。如何在源域數據不外傳的情況下進行目標域的自適應學習,將是非常值得研究的問題。
鄧偉洪表示,下一步希望在完全不採集目標域數據的情況下,提出具有更強泛化能力的新算法,直接提高人臉識別工具在未知目標域的準確率。