支付寶AI大幅提升細粒度圖像分類識別精度:一眼看穿萬物細微差異
近日,計算機視覺A類頂級會議CVPR 2020開幕在即,由全球最大機器學習平台Kaggle承辦的FGVC(Fine-Grained Visual Categorization,細粒度圖像分類)全球挑戰賽結果揭曉,支付寶天筭安全實驗室奪冠,超越全球1316支頂尖計算機視覺團隊。
訪問:
Kaggle 2020-FGVC挑戰賽官方排名
作為人工智能核心能力,計算機視覺對細粒度圖像分類技術要求越來越高。只有讓機器「看得」更細更準,機器的判斷才能有所突破。細粒度圖像分類針對的是更微觀的物體類別,比如,不僅要識別出它是一隻鳥,還要判斷具體屬於哪一類鳥,識別出車要判斷它的款式等。
細粒度圖像分類是計算機視覺領域極具挑戰的方向。今年,圍繞該方向Kaggle共發起六項任務,支付寶參加其中的患病植物圖像分類。比賽考察AI視覺識別技術對蘋果樹葉子圖片進行不同種類的疾病區分能力,在訓練集1821張圖像和測試集1821張圖像中,完成高精確度的判別。
模型不僅可以準確的分類,還能通過熱力圖的方式較為準確地定位到患病區域
世界上有約37萬種植物,不同植物的病因完全不同,但多數植物的病態外觀和特徵卻非常相似。另一方面,採集拍攝中存在姿態、視角、光照、遮擋、背景干擾等影響因素,使分類更加具有難度。
支付寶天筭安全實驗室使用的原創模型,是基於數據增強、知識蒸餾方法,實現在大量信息干擾下進行物體具像化特徵識別,使細粒度識別精度大幅提升。支付寶是比賽中唯一使用知識蒸餾這種深度學習方法的團隊,在最終測試中,支付寶分數達0.98445,排名第一。
例如,生了病的兩片樹葉,同樣出現了破損孔洞,在傳統模型訓練下,AI最多可以識別出它們都是蘋果樹的樹葉,很難確定兩個孔洞之間的區別,進而給出推斷樹葉究竟得的是哪兩種疾病。而支付寶的AI模型通過明確識別關鍵是孔洞大小、數量、位置,以及周邊是否有斑點,最終快速給出樹葉由於化學藥品濫用造成損傷的判斷。
缺乏標准信息數據導致難以判別的核心痛點,在醫療、金融、客服等領域大量存在,意味著這項技術擁有廣闊的應用空間。在支付寶交易糾紛、資金盜用、醫療保險報銷等場景中,AI團隊已經開始使用該技術方法,快速識別並進行更準確的風險預測,保障用戶需求在安全環境中被滿足。
人工智能是螞蟻集團核心技術引擎之一,研究領域涵蓋NLP、計算機視覺、智能風控、智能營銷等,並在大規模分佈式機器學習、深度圖學習、多方安全與隱私計算、博弈與對抗智能、多智能體、強化學習等方向取得突破。螞蟻集團首席科學家漆遠帶領的全球化AI團隊,相繼在國際人工智能頂級會議NeurIPS、ICML 、AAAI等,發表近60篇高質量論文成果,申報了超200個專利。