亞馬遜宣布推出Nova多模態AI模型系列
亞馬遜的雲端運算部門亞馬遜網路服務(AWS)在其re:Invent 2024 大會上宣布了一個名為Nova 的新的生成式人工智慧多模態模型系列。該系列共有四種以文字為重點的模型(可接收文字、圖像或影片並輸出文字的模型):Micro、Lite、Pro 和Premier。
亞馬遜執行長安迪-賈西(Andy Jassy)在台上說,Micro、Lite 和Pro 目前已面向AWS 客戶提供,而Premiere 將於2025 年第一季推出。
除此之外,還有一個影像生成模型Nova Canas 和一個影片生成模型Nova Reel。 這兩個模型目前都可以公開使用。
賈西說:”我們正在繼續研究我們自己的前沿模型,在過去的四五個月裡,這些前沿模型取得了巨大進步。我們認為,如果我們發現了它們的價值,你們也可能會發現它們的價值。
基於文字的Nova 模型主要根據其功能和大小來區分。
- Amazon Nova Micro – 純文字模型,具有最低的延遲響應,上下文長度為128K 標記。 它還支援微調和模型提煉,以提高準確性。 目前已全面上線。
- Amazon Nova Lite – 一種成本極低的多模態模型,可處理圖像、視訊和文字輸入,並產生文字輸出。 它支援長度達300K 標記的輸入,可在單一請求中分析影像或長達30 分鐘的影片。 它還支援微調和模型提煉,以提高準確性。 目前已全面上線。
- Amazon Nova Pro – 高效能多模態模型,可處理多達30 萬個輸入詞元。這款新模型在關鍵基準上實現了最先進的性能。 它支援30 萬個代幣的輸入上下文,可作為教師模型,用於提煉亞馬遜Nova Micro 和Lite 的自訂變體。 目前已全面上線。
- Amazon Nova Premier – 亞馬遜即將推出的用於複雜推理任務的能力最強的多模態模型,目前仍在培訓中。 預計於2025 年初全面上線。
- Amazon Nova Canvas – 圖像生成模型,可根據提示中提供的文字或圖像建立圖像。 它還支援使用文字輸入和用於調整配色方案和佈局的控制項編輯圖像。 目前已全面上線。
- Amazon Nova Reel – 一種全新的先進視訊生成模型,可根據文字和圖像創建高品質的6 秒影片。 亞馬遜將在2025 年支援2 分鐘的影片。 亞馬遜Nova Reel 將支援控制視覺風格和節奏的功能,包括使用文字提示控制攝影機運動。 它已於今日全面上線。
Jassy 說:”亞馬遜正在開發語音到語音模型和”任意到任意”模型,應該會在2025 年年中左右推出。您可以輸入文本、語音、圖像或視頻,也可以輸出文本、語音、圖像和視頻。