NVIDIA旗下GAN迎來里程碑:訓練所需數據大幅減少
人工智能和機器學習已經成為科技行業的熱門話題,而想要讓它們變得更加智能就必須要提供更多的數據進行訓練。NVIDIA 研究部門旗下的生成對抗網絡(GAN)近日迎來一個新的里程碑,即便是在非常小的數據集情況下,依然能夠讓人工智能進行學習。
雖然在名字中出現了“對抗”,但GAN AI 模型實際上使用了兩個合作的網絡。例如,一個生成器負責創建圖像,而鑑別器則將其和參考圖像進行對比,以便於評估它們是否在樣式、對象和內容上匹配。此外,鑑別器通常會饋入50,000 到100,000 範圍內的訓練圖像。
這種現象稱為過擬合,可以部分地通過所謂的數據增強來解決,該方法僅涉及隨機旋轉,調整大小,裁剪或翻轉圖像以擴展參考數量。但是,這將創建一個生成器,該生成器將學習模仿變形的圖像,而不是學習如何正確地合成樣式和主題。
NVIDIA Research 的Adaptive Data Augmentation(ADA)試圖通過在不同數據點之間分佈數據增強來解決這兩個問題。研究人員聲稱,這使他們能夠創建一個新的StyleGAN2 模型,該模型能夠使用比傳統GAN所需的數據小10到20倍的訓練數據集來學習藝術風格。