微軟Azure OpenAI服務在公開預覽版中增加了視覺功能的GPT-4 Turbo
幾週前,OpenAI 在其首次開發者活動中發布了用於生成式人工智慧服務的最新大型語言模型 GPT-4 Turbo。隨後,微軟宣布將把 GPT-4 Turbo 模型新增至其 Azure OpenAI 服務。今天,微軟宣布增強其 Azure OpenAI 服務,GPT-4 Turbo with Vision 模型現已作為公開預覽版提供給客戶。
微軟在一篇部落格文章中表示:
這種先進的多模態人工智慧模型保留了 GPT-4 Turbo 的所有強大功能,同時引入了處理和分析影像輸入的能力。這為利用 GPT-4 執行更廣泛的任務提供了機會,包括無障礙改進、視覺化資料解釋和分析以及視覺化問題解答(VQA)。
此外,微軟也透過 GPT-4 Turbo with Vision 預覽版為 Azure OpenAI 客戶增加了更多功能。其中之一是光學字元辨識(OCR),它可以檢查圖像並提取圖像中的任何文本,以便將其整合到用戶提示中。
GPT-4 Turbo with Vision 的另一個功能是物件接地,它可以讓人工智慧檢查影像,並根據使用者的文字提示顯示影像中的關鍵物件。同樣,人工智慧還可以分析影片的特定幀。
微軟補充:
透過將GPT-4 Turbo與Vision、Azure AI Search和Azure AI Vision結合,現在可以將圖像與文字資料添加到一起,利用向量搜尋開發與用戶資料連結的解決方案,從而改善聊天機器人體驗。
該服務的定價為輸入每 1000 個字元 0.01 美元,輸出每 1000 個詞元 0.03 美元,增強功能的定價不同。
目前,Azure OpenAI 的澳洲東部、瑞典中部、瑞士北部和美國西部地區可以存取具有 Vision 功能的 GPT-4 Turbo。訪問帶有視覺功能的 GPT-4 Turbo 公開預覽版的客戶將在”未來幾週內”自動更新到”穩定的、生產就緒的版本”。