微軟北大聯合團隊開發AI新應用無限視覺生成技術
近日微軟Research Asia聯合北京大學以及Microsoft Azure AI共同研發了全新AI視覺生成技術“NUWA-Infinity: Autoregressive over Autoregressive Generation for Infinite Visual Synthesis”,引發熱議,通過該技術可以使文本自動生成圖像或者學習圖像生成擴張圖像等應用。
•以往的OpenAI的DALL・E2、Google的Imagen或者Parti等都可以通過文本直接生成圖像,不過解像度只有1024×1024級別,而“NUWA-Infinity: Autoregressive over Autoregressive Generation for Infinite Visual Synthesis”卻可以生成高達4096×1024級別的高清圖像。
•不但如此,該技術還能學習現有的圖像從而按照相同架構擴張為更大更清楚的圖像,以及視頻方面的轉換等,具體能力多達五種:
讓圖像動起來(Image Animation)
根據文本生成視頻(Text-to-Video)
根據文本生成圖像(Text-to-Image)
圖像補全(Image Outpainting)
圖像生成(Image Generation)