Google Photos推出人工智慧搜尋功能”Ask Photos”
隨著Google雙子座人工智慧模型(Google Gemini AI model)支援的實驗性功能”詢問照片”(Ask Photos)的推出,Google Photos將獲得人工智慧的注入。這項新功能將於今年夏天晚些時候推出,用戶可以使用自然語言查詢,利用人工智慧對照片內容和其他元數據的理解,並在Google照片集中進行搜尋。
Google週二在其年度GoogleI/O 2024開發者大會上宣布,以前用戶可以在照片中搜尋特定的人、地點或事物,但由於有了自然語言處理技術,人工智慧的升級將使用戶更直觀地找到正確的內容,減少人工搜尋過程。
例如,你現在可以讓人工智慧做一些更複雜的事情,例如從”我去過的每個國家公園”中找出”最好的照片”,而不是在照片中搜尋”埃菲爾鐵塔”這樣的特定內容。人工智慧會使用各種訊號來確定照片中的”最佳”照片,包括光線、模糊程度、背景是否失真等。然後,它可以將這些訊號與對一組照片或日期的地理位置的理解結合起來,只檢索在美國國家公園拍攝的照片。
此功能基於Google照片最近推出的”照片堆疊”(Photo Stacks)。 “照片堆疊”將近乎重複的照片組合在一起,並利用人工智慧突出顯示組中最好的照片。與”照片堆疊”功能一樣,該功能的目的也是幫助人們隨著數位收藏的增加找到自己想要的照片。據Google公司稱,每天上傳到Google照片中的圖片超過60 億張,這足以說明其規模之大。
此外,”詢問照片”功能還允許用戶透過提問獲得其他有用的答案。除了詢問度假或其他群組中的最佳照片外,用戶還可以提出一些需要對照片中的內容有近乎人類理解的問題。
例如,家長可以詢問Google照片在孩子最近的四次生日派對中使用了什麼主題,Google照片就會給出一個簡單的答案,並提供有關美人魚、公主和獨角獸主題的照片和視頻,以及使用時間。
之所以能實現這種查詢,是因為Google照片不僅能理解你輸入的關鍵字,還能理解自然語言概念,例如”主題生日派對”。它還能利用人工智慧的多模態能力,了解照片中是否有可能與查詢相關的文字。
執行長桑達爾-皮查伊(Sundar Pichai)在今天的Google I/O 開發者大會前向媒體展示的另一個例子顯示,一位用戶要求人工智慧向他們展示孩子的游泳進展。人工智慧打包了孩子游泳時的照片和影片集錦。
另一個新功能是利用搜尋功能從照片中的文字中找到答案。這樣,您就可以拍下您想記住的東西的照片,例如您的車牌號碼或護照號碼,然後在需要時讓人工智慧檢索這些資訊。
如果人工智慧弄錯了,而你糾正了它–也許是標記了一張不是生日派對的照片,或者是一張你不會突出顯示的度假照片–它會記住你的反應,並隨著時間的推移不斷改進。這也意味著,隨著你與人工智慧互動的時間越長,人工智慧就會變得越個人化。
當你找到準備分享的照片時,人工智慧可以幫助你起草標題,概括照片的內容。目前,這只是一個基本的摘要,並沒有提供不同風格的選擇。
Google表示,它將在某些情況下設置不回應的防護措施,在訓練模型時,它也不包含潛在的攻擊性內容。但該功能是作為一項實驗推出的,因此隨著Google對人們如何使用該功能做出回應,可能還需要增加額外的控制措施。
“詢問照片”功能最初將在美國支援英文版,然後再推廣到更多市場。該功能目前還只是一個基於文字的功能,類似於向人工智慧聊天機器人提問。不過,隨著時間的推移,它可能會像在Android系統上一樣,與裝置上運行的Gemini 進行更深入的整合。
該公司表示,Google照片中的用戶個人資料不會被用於廣告。 Google表示,人類也不會審查Ask Photos中的人工智慧對話和個人數據,除非”在極少數情況下處理濫用或傷害”。 Google照片中的使用者個人資料也不會用於訓練任何其他生成式人工智慧產品,例如Gemini。