谷歌發起包容性競賽糾正算法的偏見
谷歌推出了一項名為包容圖片競賽(Inclusive Images Competition)的項目,希望提高圖片識別軟件的文化包容性,降低那些用存在文化偏見的圖片庫訓練出來的電腦視覺系統的偏見。由於人工智能需要使用大量圖片數據進行訓練才能識別物體。
而圖片識別技術最近的跨越式發展也得益於公開的大型圖片的推出,包括ImageNet和Open Images。
但問題在於,最流行的數據庫往往以美國和西方文化為核心,畢竟西方圖片在匯總數據庫的過程中佔據主導。因此,系統往往難以精確描述其他文化和地點。例如,使用開源數據庫訓練的標準圖片識別系統可以識別身著西方婚紗的新娘,但卻無法識別身著印度紗麗的新娘。
解決這個問題的方法之一就是更加多樣化且具有代表性的圖片數據庫。雖然谷歌在採用這一方法,但該公司相信還有另外一種方式可以採納:調整機器學習算法本身,使之在學習不完美的數據時更具包容性。
因此,該公司與頂尖人工智能會議Neural Information Processing Systems(NeurIPS)展開合作,並且收到100多位參賽者提交的方案。谷歌大腦研究員帕拉為·巴爾杰卡(Pallavi Baljekar)在12月2日的會議上指出,第一年的競賽優勝者可以向更包容的系統邁進一小步,但排名前五的方案中只有一個成功識別出印度新娘。所以,顯然還有很大的進步空間。