新演演算法可精確「走姿」識身份
杭州電子科技大學博士在讀研究生鄭錦凱通過可遷移鄰域發現演算法,提升了跨域場景下的步態識別精度。 相關研究成果在日前召開的IEEE International Symposium on Circuits and Systems(美國電氣和電子工程師協會電路與系統國際研討會)上公佈,鄭錦凱還在IEEE 多媒體系統與應用技術專委會(IEEE MSA-TC)年度會議上做口頭報告,論文獲2021年度IEEE MSA-TC最佳論文提名獎。
近年來,隨著人工智慧技術的發展,步態識別開始應用在公共場域身份識別中。 步態識別,俗稱”走姿”識身份,不同人的”走姿”是不一樣的,走姿是人的”另一種身份”。 另外,人在不同場域的步態也是不一樣的,比如在超市裡購物步伐偏慢,而在火車站趕車步伐急促,所以跨域步態識別為”走姿”識身份增加了難度。
據瞭解,目前普遍使用的深度學習演算法依賴數據標註,換言之,通過步態識別誰是誰,首先得在資料庫里知道具體的步態是怎樣的。 這意味著,標註的準確性和數量直接影響著最終的識別精度。 在實際應用中,人們往往受限於這種既昂貴又費時費力的數據標註上。 如果資料庫里沒有具體人的標註數據,那怎麼辦?
為此,鄭錦凱提出可遷移鄰域發現演算法,首先找出高置信度樣本,並通過最近鄰演算法找出這些樣本的領域樣本,之後通過損失函數拉近高置信度樣本與其領域樣本在特徵空間中的距離,採用從易到難、循序漸進的方式更新深度學習模型。 整個過程由近到遠、由易到難、由已知到未知,逐漸識別”哪些步態是誰的”,從而鎖定目標人物。
什麼是可遷移鄰域發現演算法? 鄭錦凱打了個比方:「如果想讓一個小孩識別國內的動物種類,你會給他一些動物圖片和對應的動物名字。 通過學習,小孩能認出許多動物。 你可能覺得還不夠,希望小孩能識別國外的動物,於是給小孩一些國外動物的圖片,讓他把屬於同一物種的圖片都放到一起進行分類。 ”
他進一步解釋道,由於小孩之前學習了很多國內的動物,一開始會比較順利,能夠挑選出一張或者幾張長得最像老虎的放一組,像獅子的放一組,等等。 接著,小孩可能會繼續尋找那些還長得比較像老虎、獅子等的圖片,直到他再也找不到自己學過的圖片之後,他發現剩餘那些之前沒見過的圖片里,有好幾張長得很類似,於是猜測它們屬於一個新物種。 小孩可能同時發現好幾個新物種,把它們分別放一組,接著繼續尋找和這些新物種長得很像的圖片。
“可遷移鄰域發現演算法類比了上述一過程,直到所有圖片都被找完為止。” 鄭錦凱告訴《中國科學報》:”可遷移鄰域發現演算法與傳統聚類賦偽標籤識別不一樣,有望在步態識別領域拓展新的應用。 (沈春蕾 程振偉)
相關論文資訊:https://arxiv.org/abs/2102.04621