微軟發表全新多模態人工智慧小語種模型Phi-3-vision
今年4 月,微軟首次發布了新的Phi-3 系列人工智慧小語言模型(SML)。這些模型旨在設備上運行,而不是在雲端伺服器上運行。今天,作為Build 2024的一部分,微軟又發布了另一款Phi-3模型,其主題有所不同。
新模型名為Phi-3-vision,顧名思義,這種SML 不僅可以處理文字提示,還可以接受圖像和文字提示來產生問題答案。微軟表示,使用這種模式的人可以獲得有關他們提交的圖表的問題答案,也可以就Phi-3-vision 模式接收到的圖像提出任何開放式問題。
Phi-3-vision 包含42 億個參數,比38 億個參數的Phi-3 迷你模式大,但比70 億個參數的Phi-3 小型模式和140 億個參數的Phi-3 中型模式小得多。微軟表示,Phi-3-vision 可以回答有關”一般視覺推理任務以及圖表、圖形和表格推理”的問題。
新的Phi-3-vision模型目前是預覽版,但還不知道何時會全面上市。不過,Phi-3 Mini、Phi-3 Small 和Phi-3 Medium 現在都可以透過微軟的Azure AI 模型即服務進行存取。
在Build 2024 的相關新聞中,微軟表示Azure AI Studio 現已全面可用。該公司表示:
pro-code 平台支援負責任的生成式人工智慧開發,包括開發協同駕駛員,以支援複雜的應用程式和任務,如內容生成、資料分析、專案管理、日常任務自動化等。
該公司表示,Azure AI Studio 支援”代碼優先”功能和”友好的使用者介面”,因此開發人員可以選擇如何在自己的程式設計專案中使用這些工具。
微軟也宣布,OpenAI 的最新大型語言模型ChatGPT-4o 現在可以透過Azure AI Studio 和API 普遍使用。