微軟發表全新多模態人工智慧小語種模型Phi-3-vision

今年4 月，微軟首次發布了新的Phi-3 系列人工智慧小語言模型（SML）。這些模型旨在設備上運行，而不是在雲端伺服器上運行。今天，作為Build 2024的一部分，微軟又發布了另一款Phi-3模型，其主題有所不同。

新模型名為Phi-3-vision，顧名思義，這種SML 不僅可以處理文字提示，還可以接受圖像和文字提示來產生問題答案。微軟表示，使用這種模式的人可以獲得有關他們提交的圖表的問題答案，也可以就Phi-3-vision 模式接收到的圖像提出任何開放式問題。

Phi-3-vision 包含42 億個參數，比38 億個參數的Phi-3 迷你模式大，但比70 億個參數的Phi-3 小型模式和140 億個參數的Phi-3 中型模式小得多。微軟表示，Phi-3-vision 可以回答有關”一般視覺推理任務以及圖表、圖形和表格推理”的問題。

新的Phi-3-vision模型目前是預覽版，但還不知道何時會全面上市。不過，Phi-3 Mini、Phi-3 Small 和Phi-3 Medium 現在都可以透過微軟的Azure AI 模型即服務進行存取。

在Build 2024 的相關新聞中，微軟表示Azure AI Studio 現已全面可用。該公司表示：

pro-code 平台支援負責任的生成式人工智慧開發，包括開發協同駕駛員，以支援複雜的應用程式和任務，如內容生成、資料分析、專案管理、日常任務自動化等。

該公司表示，Azure AI Studio 支援”代碼優先”功能和”友好的使用者介面”，因此開發人員可以選擇如何在自己的程式設計專案中使用這些工具。

微軟也宣布，OpenAI 的最新大型語言模型ChatGPT-4o 現在可以透過Azure AI Studio 和API 普遍使用。

WONGCW 網誌