微軟Bing Chat的GPT-4整合將為Windows 11帶來更強的圖像識別功能
微軟Bing Chat在台式機上又有了一次大的更新,支持圖像識別,或稱OCR。該功能使用OpenAI的ChatGPT-4視覺模型來檢測和理解圖像中的物體,並利用現實生活中的例子對圖像進行詳細解釋。
微軟正在向全球選定的用戶推出Bing Chat視覺功能。更新後,用戶會注意到語音圖標旁邊的一個新選項,允許你直接上傳圖片到聊天室,或從互聯網上粘貼圖片,並要求必應進行解釋。
這項功能被官方稱為”圖像識別”,只有部分用戶表示可以使用它,這表明它可能是一個隨機的A/B測試。在一份聲明中,微軟官員確認向不到10%的經常使用Bing Chat的人推出必應視覺,證實了我們的猜測,即這是一個隨機的A/B測試過程,不過可以期待Bing Vision選項在未來幾週內出現在所有人面前。
該功能也包括在Windows Copilot中。你可以從桌面或文件資源管理器中拖出一張圖片,把它放到Copilot上,並要求人工智能解釋該圖片或創造類似的東西。最後,你可以將圖片直接複製到PowerPoint、Word或剪貼板上。
微軟在5月對Safari和Chrome瀏覽器中的Bing Chat支持進行了簡短的測試,我們預計很快就會有正式的公告來確認這一擴展。雖然通過修改用戶代理有可能讓Bing Chat在Chrome瀏覽器中工作,但可能沒有必要。除了對Chrome和Safari瀏覽器的支持外,微軟還希望利用微軟的人工智能改進Bing Image Creator。
該功能可能會隨著必應插件的整合而變得更好,官員們表示,微軟正在計劃”大規模推出插件”,以擴大Bing Chat的功能。該公司計劃將每項功能都變成一個插件,並創建搜索的不同方面。
微軟已經對Bing Chat進行了一些重大改進,比如取消對微軟賬戶的支持。此前,微軟通過強迫用戶用微軟賬戶登錄來阻止他們。這一限制已被取消,因為微軟現在正試圖推動採用必應人工智能,而不是其他服務,如微軟賬戶或Edge。