Google:Android 手機,聽我的,AI 要這麼做
Google 發表了Pixel 9、Pixel 9 Pro 以及二代折疊螢幕Pixel 9 Fold、智慧手錶、耳機等硬體新品。相較於硬件,人們更關注,在AI+手機如此火熱的當下,作為Android 系統的管理者,Google 將會如何將端側AI 用於Android 手機之中。
也許,Google欠缺的,只是更大的野心。搶先蘋果一個月,Google 將AI+手機的可能性,全都展示在了自己的Pixel 新機之中。
差不多在10 個月前,Google推出了第一代AI 手機,如今不到一年,這家巨頭再次更新Gemini、Android 和Pixel 的產品組合,這一次,主打的是「競爭對手有的,我也有”模式。
自從OpenAI 推出ChatGPT 語音模式,以及蘋果下一代iPhone 的AI 功能曝光以來,同行們能做到的,Google都不願落下,包括AI 語音對話、搜尋螢幕截圖中的資訊等。同時,Google也在讓AI 進一步整合進自身的應用生態。
誰才是AI 手機領頭羊,Google 一定要跟蘋果掰手腕。
回應OpenAI,Gemini Live 上線
Gemini 是Google各種AI 產品的基石,也是Google Pixel 9 系列手機上的預設助手,Gemini 在整合進手機時有哪些升級,是發表會上的一大焦點。
Google Pixel 手機上的Gemini 按下電源按鈕即可喚出。據Google高層稱,從今天開始,用戶可以在使用的應用程式上方調出Gemini 的覆蓋層,詢問有關螢幕上內容的問題。例如,用戶可以詢問正在觀看的YouTube 影片的相關問題,用戶還可以直接從Gemini 的覆蓋層生成圖像,並將它們拖放到Gmail 和Google Messages 等應用程式中。
Google還計劃在「未來幾週」讓Gemini 連接更多應用程序,包括日曆、Keep 和YouTube Music 等。具體的功能用途如,讓Gemini「製作一份讓我想起90 年代末的歌曲播放清單。」「拍下演唱會傳單的照片,並讓Gemini 查看當天是否有空——甚至設置提醒來購買門票。 ”“讓Gemini 在你的Gmail 中找到一份食譜,並要求它將配料添加到Keep 中的購物清單中。
Gemini 使用截圖擷取資訊與更多應用程式互動|圖片來源:Google
除了這些整合體驗外,Google還正式上線了Gemini Live,這項功能可以說是Google對OpenAI 推出的GPT-4o 進階語音模式的回應。該功能先前在Google 2024 年的I/O 開發者大會上曝光過,今天開始正式推出。
用戶可以用手機與Google的生成式AI 聊天機器人Gemini 進行語音對話,可以中途打斷,提出跟進的問題,對話可以隨時暫停和恢復。一些具體用途範例包括,讓Gemini Live 陪你準備工作面試、練習演講,隨便聊聊關心的話題等。
Gemini Live 明顯要對標GPT-4o 的語音互動|圖片來源:Google
那麼,Gemini Live 相較於ChatGPT 的語音模式有優勢嗎?
據稱,支援Live 的生成式AI 模型架構——Gemini 1.5 Pro 和Gemini 1.5 Flash,擁有比平均水平更長的“上下文視窗”,這意味著它們可以在生成響應之前處理和推理大量數據,理論上可以進行長達數小時的對話。
Gemini Live 還可免持使用,用戶可在應用程式背景或手機鎖定時繼續進行語音對話,有10 種新聲音可供選擇。
但值得注意的是,Gemini Live 目前還未上線「多模態輸入」功能,據稱將於「今年稍後」推出。
幾個月前,Google曾經發布了預錄視頻,展示了Gemini Live 如何通過手機攝像頭捕捉的照片和視頻識別用戶周圍環境,並做出響應,比如指出損壞自行車的某個部件,或解釋計算機屏幕上一段程式碼的功能,這些都未得到現場的真實演示。
而且,Gemini Live 在Android 手機上的Gemini Advanced 訂閱用戶中推出,並不是免費的。目前它僅提供英文版本,Google稱「未來幾週」將擴展到更多語言,還要透過應用程式擴展到iOS。
Google高階主管直播示範Gemini Live|圖片來源:Google
Google Gemini 體驗與Google助理方面的高管稱“Google正處於探索AI 驅動助手各種有用方式的早期階段——就像Pixel 手機一樣,Gemini 將會越來越好。”
另外,在隱私問題方面,Google Android 生態系統方面的高層稱,Gemini 支持來自數十家設備製造商的數百款手機型號,在處理用戶資料時,資料不會離開手機。
「Gemini 可以基於你私人教練的郵件幫助創建每日鍛煉計劃,或利用你Google Drive 中的簡歷撰寫工作簡介。只有Gemini 能夠通過這種安全的、一體化的方法做到這一切,而不需要將數據交給你可能不認識或信任的第三方AI 提供者。
“由於Android 是首個擁有大型設備內多模態AI 模型的行動作業系統——名為Gemini Nano——在處理一些最敏感的用例時,你的數據不會離開你的手機。”
AI進一步融合Android
Google推廣AI 手機的最大優勢無疑是自家的多種應用工具,以及Android 生態,Google現在有數十億Android 用戶,能發揮的空間,顯然比一個聊天機器人應用程式更多。
去年,作為首款以AI 為核心的智慧型手機,Google的Pixel 8 系列帶來了各種AI 功能。例如,使用者可以移除、移動或編輯照片中的單一元素,可以在照片之間移動表情以獲得最佳的合成照片,可以基於截圖或螢幕上的某個「圈選部分」進行搜尋等。
所有這些功能都首次出現在Pixel 8 系列上,隨後在整個Android 生態系統中得到一定推廣。
像是Google的「圈選搜尋」功能,實際上首次出現在三星的Galaxy AI 手機上,作為Google的Android 生態合作夥伴,三星的手機也增加了許多類似的AI 功能。前述AI 助手Gemini 也出現在三星的Galaxy Z Fold6、摩托羅拉Razr+等手機裡。
同時,其他製造商也宣布要推出自己的手機AI,過去幾個月最受關注的莫過於蘋果,相同的一個方向和理念是融合自家的應用生態。
在這差不多一年裡,「AI 手機」可以說已經成了市場看待手機的核心視角,不只是Google手機。如何再用AI 讓人眼睛一亮,對Google來說是個挑戰。目前來看,與推出第一代AI 手機Pixel 8 時類似,Google輸出最多的還是各種AI 功能小工具。
在今年的Made By Google 活動上,Google重點推出的AI 新功能包括:
「Add Me」,連拍照的人也能把自己拍進合照裡;
「Pixel Studio」,一款AI 影像產生器,與蘋果即將推出的Image Playground 應用非常相似;
「Pixel Screenshots」,它可以掃描使用者圖庫中的截圖,將它們轉變為一個易於搜尋的資料庫;
「Call Notes」,可以儲存通話記錄中的資訊摘要,啟動該功能後通話中的每個人都會收到通知。
其中,如果想實現「Add Me」的功能,攝影師先拍攝一張沒有自己的照片,然後由另一個人當攝影師,再拍一張照片。 Pixel 會將兩張照片合併,確保每個人都在一張照片裡,無需找陌生人幫忙拍照。
團體合照功能|圖片來源:Google
Google為Pixel 9 系列定位的一大賣點還有AI 相機,自封為「世界第一台AI 驅動的相機」。 Google高層也稱「Pixel 是第一個在照片和影片中使用夜視功能的手機,現在它也是第一個在低光環境下拍攝壯麗全景風景和城市景觀的手機。」在發表會上, Google高層也將Pixel 9 Pro XL 拍攝的照片與蘋果的iPhone 15 Pro Max 進行比較。
Google手機vs 蘋果手機夜晚拍照效果|來源:Google
超大螢幕的折疊款Pixel 9 Pro Fold 還有一個「Made You Look」功能,能用來吸引使用者的注意力,讓他們對著鏡頭笑。用該功能時,展開手機,一側外螢幕上會播放引人注目的視覺動畫,例如一個亮黃色的小雞,或是其他搞怪的動畫。
吸引使用者註意的螢幕功能|圖片來源:Google
拍完照之後,還有修圖工具,Google圖片的Magic Editor 今年又推出了一些新功能。例如「Auto Frame」功能,用於校正傾斜照片的角度,同時使用生成式AI 填補主體周圍的空白,形成更廣闊的視野。還有「Reimagine」功能,在文字方塊中描述想要的效果,就可以用生成式AI 來P 圖,例如將地上的草變成野花,在天空的某個部分加個熱氣球等。
此外,Google緊跟著蘋果的腳步,推出一種在緊急情況下使用「衛星SOS」功能,這項功能讓用戶可以在沒有蜂窩服務的情況下,聯繫緊急救援人員並共享位置資訊。據Google高層稱,Pixel 9 系列將是“首批能夠使用衛星SOS 的Android 手機。”
衛星SOS 功能|圖片來源:Google
從功能上看,Pixel 9+ Gemini 的組合,並沒有在AI 方面領先現在國內Android 廠商太多。但要注意的是,與蘋果不同,Google 既有自己的系統和終端,又有大模型和雲端運算,是目前所有公司中在「軟硬芯雲」真正完成閉環的公司。
一旦終端AI 出現突破口,萬事俱備的Google「再次偉大」的可能性,比競爭對手大非常多。
也許,Google 欠缺的,只是更大的野心。