令AI費解的圖像層出不窮計算機視覺遠未達到完美
機器視覺一直是人工智能熱潮中最大的成功案例之一,它可以實現從自動醫療掃描到自動駕駛汽車的所有功能。但是,儘管所有視覺算法的準確性都有了很大的提高,但這些系統仍然可能被人類可以輕鬆識別的圖像所迷惑。
看看下面的2張圖片,都沒有特別令人困惑的地方吧?您會看到錘子,烤箱手套,儘管中間圖片很難辨認,但可以很快地看出來是從上方看去的椅子。同時,最先進的機器視覺算法可能只會識別這些對像中的一兩個。對於應該駕駛我們的汽車的系統來說,這是一個巨大的降級。
這些圖像屬於名為ObjectNet的數據集一部分,該數據集來自MIT的科學家,以測試AI視覺的局限性。研究科學家鮑里斯·卡茨(Boris Katz)告訴《 MIT新聞》:“我們創建了這個數據集來告訴人們對象識別問題仍然是一個難題。我們需要更好,更智能的算法。”
更好的數據可以構建更好的算法,而ObjectNet將在這方面提供幫助。它包含5萬張從奇怪角度或在令人驚訝的環境中觀看的物體圖像(比如沙發上倒著的茶壺或浴室裡靠在椅背上的餐椅)。ObjectNet可以用來測試和評估不同算法的能力。
這類圖像很難被計算機處理,因為它們沒有出現在訓練數據中,並且因為這些系統對現實世界中的對象工作方式了解有限。AI系統無法輕鬆地從它們以前看過的項目中推斷出來,以想像它們在不同角度,在不同燈光下的形象。改善AI視覺系統的性能也不是沒有可能。這只需要時間,精力和訓練。