Google教科書般的AI反擊戰

2024-05-16 Comments 0 Comment

在Google巨大的商業化版圖面前，單純提前一天發布GPT-4o，似乎並沒有為OpenAI帶來足夠的優勢。在2024 Google I/O大會上，Google展示了一系列AI技術突破，包括AI生成影片、AI驅動的Workspace自動化工具，以及產品效果直逼GPT-4o的語音助理。眾多AI產品的發布，形成了某種意義上的“狼群效應”，正幫助Google扭轉被動追趕的局面。

另外，Gemini的多模態能力、Android 15的AI增強，不僅提升了使用者體驗，也顯著增強了Google生態系統的黏性。相較之下，OpenAI可能技術上領先一步，但在應用廣度上顯得相對單一。

如今，Google 帶著「巨頭範兒」的反擊越來越犀利，而對於GPT-5 的發佈時間仍持謹慎態度的Sam Altman 而言，壓力變得越來越大。

巨頭反擊教材第一章：放大優勢

巨型企業的策略佈局，往往建立在持續加強優勢業務的前提下。而Google 起家於搜索，長於Workspace等一系列辦公室套件服務，而這也成了2024年Google I/O大會發布的重點。

完善的AI 搜尋能力，是業界翹首以盼的。 Google這次發布的AI Overview，在多模態的問題上做足了文章——

例如“Ask with video”，利用Gemini的多模態能力與Google Lens相結合，可以實現視頻搜索，只要錄製一段視頻，就能知道用戶使用唱片機，甚至維修照相機；Google Photos中還推出了新的AI功能“Ask Photos”，可以透過簡單的問題在大量照片中找出“孩子多年來學習游泳的歷程”。

OpenAI也展示了一款名為Project Astra的多模式AI助手，可以觀看並理解透過裝置相機看到的內容，記住用戶的東西在哪裡，幫用戶在現實世界「搜尋「物品，或完成其他任務。

Google 版AI 搜尋的輸出結果不再是網址的羅列，而是一個全新的整合頁面——它更像一份針對用戶提問而形成的報告，不僅包括對問題本身的回答，也包括對用戶可能忽略問題的猜測與補充，在產品形式上，也算做到了圖文並茂。

國內某大廠同樣推出了AI 搜尋功能，但只是在傳統搜尋頁面上，利用佔網頁五分之一左右的空間，植入生成式AI 的輸出結果，且只能針對特定問題觸發。整體完成度較低，因而也沒有做太高調地發布和宣傳。

兩相比較之下，Google 這次對於AI 搜尋的革新可見一斑。在有限的搜尋引擎市場裡，這奠定了全新的標準。而對於模式已經固化多年的搜尋廣告而言，也更有想像空間。

Google 不是在發布某一項大模型能力，而是在試圖重新佔領使用者心智。當下，Google 的搜尋裡面是“Ask，Not Search”，多模態的互動方式，只是在使用者層面進一步完善圍繞“Ask” 建立的產品概念。

搜尋的改造只是個開始，Google希望搜尋能成為激發用戶AI需求的超級入口，即使用戶不知道具體該問什麼，Google也可以給予推薦，幫用戶腦暴。這時，搜尋介面會進一步變化，變成資訊流的形式，每個卡片都可以進一步操作。

在搜尋之外，Google的另一個優勢領域是Workspace。 Google為Workspace發布了一款與國內火熱的「數位員工」非常相似的產品——AI Teammate。

首先，Gemini 1.5 Pro即將被植入Workspace的文件、表格、投影片、雲端硬碟和Gmail 的側邊欄中，涵蓋企業日常營運的各個面向。 Gemini 可以幫使用者尋找特定的業務資訊而不是通用資訊；直接從電子郵件中擷取相關的PDF文件；整理和管理電子郵件中的收據，並進行歸檔，或從收據中提取資訊並添加到表格中。

Gmail App中加入Gemini後，也可以提供了更詳細、更上下文相關的回覆建議，也能夠為使用者提供電子郵件的摘要。

同時，Google也將Gemini與Google生態的日曆、任務、Keep集成，使其AI 產品成為一個全面的數位助理。 Google也在Gemini 執行任務前設置了檢查機制，確保資訊的準確性，而Google輔助相比其他智慧助理最大的優勢就在於Gemini與Google原生產品的無縫整合。

在企業中，數位員工最早的產品是利用RPA（機器人流程自動化）來自動化執行重複性、高量化、基於規則的任務。過去一年中大語言模型爆發，使許多辦公室軟體、辦公室協作產品公司看到了機會，紛紛在會議、郵件、協同，以及文檔管理等領域推出了大模型加持的數位員工產品，其中不乏國內大廠。

Google入局此類產品，無疑加劇了產業內的競爭，也為關注此領域的企業樹立了一個「巨頭」標竿。在Google全套工具的配合下，AI teammate的AI不再是散點工具。它的功能不只是簡單的安排行程、訂會議、做會議紀錄。

在Google全家桶的配合下，AI teammate可以真正理解業務流，理解業務上下文，並給出結論，甚至幫助評估風險業務，回答項目能否按期完成，這甚至已經接近一個“董事長助理”的工作了

Gemini支援的Workspace將在2024年6月，以「通用助手」的形式向付費訂閱者推出。

AI搜尋和AI Workspace共同組成了Google版AI Agents的初貌：更強的多模態能力，全面深入多個場景的資訊處理，真實理解企業的工作流程。相較之下，OpenAI的GPT-4o雖在生成式AI技術上有優勢，但在辦公室應用場景中尚未形成全面、高效的解決方案。

巨頭反擊教材第二章：多打組合拳

除了核心優勢業務，Google也在2024 Google I/O大會上對整個生態系統進行了全面升級。

首先是圍繞YouTube的影片領域。 Google推出了對標Sora的Veo，Veo同樣可以輸出長達1分鐘左右的穩定1080p影片。 Google表示已經向部分創作者提供Veo，用於YouTube影片製作，同時也向好萊塢推銷其用於電影製作，且Veo的部分功能將很快落到YouTube Shorts 中。

Google也推出了對標GPT-4o的「可打斷的」語音助理Gemini Live，可以在Android上實現雙向流暢的AI對話體驗；還有角色聊天機器人Gems ，與OpenAI的GPT Store，以及Character.AI類似，Gems可製作客製化的ChatGPT聊天機器人，完成某些任務並保留特定的特徵，例如與愛因斯坦或馬斯克對話，甚至可以為自己製作一個「假的」心理醫生。

此外，Google 和OpenAI 一樣，都關注教育場景。

Google推出了Android 的Circle to Search，可以應用在家庭教育場景。透過多模態模型提供個人化的互動式教育體驗。這款產品不僅能理解並回應學生的問題，還能根據學習進度調整教學內容，提升了教育過程的互動性和效果。

疫情放大了線上教育的價值，家長也開始不斷提高對家庭教育的重視。研究機構MarketsandMarkets的分析指出，全球數位教育市場規模預計從2023年的194億美元成長到2028年的667億美元，年複合成長率達28.0%。

Gems、Circle to Search與Gemini Live等產品，無疑可以大幅提高線上教育的互動體驗，並基於AI為不同孩子提供個人化的教育方案，彌補了傳統教育模式難以滿足所有學生的需求的問題。

除了商業生態和場景，在AI基礎設施方面，Google也進行了升級，這點主要針對大模型ToB 業務的成本問題。

本次Google I/O大會上，Google將自研AI晶片升級到第六代TPU（張量處理單元）Trillium，與第五代相比，每個TPU的運算效能提高了4.7倍。 Google也宣布將成為首批提供NVIDIA 下一代Blackwell 處理器存取權限的雲端供應商之一。

Google CEO Sundar Pichai表示：“我們將繼續投資基礎設施，以推動人工智慧的進步。”

相較於OpenAI和微軟的合作模式，Google透過自身業務生態系統的緊密協作，提升了Google Cloud以及AI相關服務的兼容性和互通性，也為開發者提供了更強大的工具和支持，整體的技術和商業化競爭優勢更加明顯。

在本次Google I/O大會上，Google總共124次提及AI。從商業生態到應用場景，再到基礎設施，Google幾乎對所有產品、能力進行了一次圍繞AI的升級。

相對於OpenAI，Google 業務的戰線更長，這既是劣勢，也是優勢。一套組合拳下來，OpenAI 前一日的全部發布，成為了Google 發布的章節內容。這使得Google 從單純的產品效能對比層面一躍而出，居高臨下的俯視2024 年初的生成式AI 市場競爭。

巨頭反擊教材第三章：整點新公司玩不起的

對Google來說，所有的軟體能力，最終都會在硬體上有所體現——為什麼不呢？ Google 既有產品線，也有相關市場經驗。相對於軟體服務，硬體業務的重資產屬性更明顯，新銳公司很難玩得起，但Google 如魚得水。

Google在本次大會中不僅明確了Pixel手機將具備原生Gemini能力，使裝置的多工處理能力大幅提升，也宣布了許多Android 15中將推出的AI功能。

事實上，Gemini早已作為獨立App在Android 上線上。這次，更新中Gemini對話過程中，用可以直接將產生的影像拖曳到其他應用程式中使用。在Android 15 中，Gemini支援了YouTube 影片內容辨識功能。 Gemini 可以在影片播放介面直接提取相關訊息，回答用戶關於影片的各種問題，甚至產生影片內容摘要。

此外，用戶可以同時運行多個應用程式而不影響效能，這在以往手機中是難以實現的。此外，Gemini AI根據使用者習慣提供個人化推薦，讓手機使用更加貼心便捷。這種智慧化服務提高了用戶滿意度，增強了Google在智慧型手機市場的競爭力。

即時語音助理功能，在Pixel以及Android系統中的落地，也必將使生態更加閉環。

Gemini發佈時提到的輕量化Nano版本已確認將用於Chrome的改進，在輕量化模型方面，Google又推出了全新的Gemini Flash。這兩款Gemini模型以及開源的Gemma模型，都將在未來的端側AI設備方面，為Google積蓄模型力量。

相較於過去單純討論晶片性能和安全性，Google的AI手機更加性感，也更符合實際。雖然Pixel手機的硬體水準在手機產業中一直處於落後地位，其唯一的競爭優勢就是原生Android系統。如今作為Android+AI的原生設備，Pixel或將迎來新的春天。

Android的Gemini更新將在“未來幾個月內推廣到數億台設備”，並且更多的上下文功能正在開發中。

Android的生態能力優勢，第一次變得如此突出，Gemini 在其中加碼極大。對於蘋果而言，在WWDC到來之前，一切都是未知。對新生的華為鴻蒙而言，挑戰更加劇烈。

有趣的是，AI不僅在Google的主力硬體產品中找到了豐富的應用場景，Google還展示了Google Glass的最新應用，似乎想告訴外界：有了AI的加持，即使是過去被認為失敗的項目，如今也能為新的創新提供基礎與靈感。

由此向下繼續推演，在Gemini和硬體能力的加持下，即使Google要殺入最火熱的AI PC市場的也會「順滑」無比。

結語

如何評價Google本次發布？不妨先來看看Google對哪些公司造成了威脅。

首先，AI搜尋。除了已知的AI搜尋公司PerplexityAI，以及傳說中的OpenAI搜索，Google最直接威脅的當然是傳統的搜尋引擎。 Google不只是簡單的在搜尋結果中增加一個AI總結，或是以自然語言對話方式進行搜索，Google的多模態AI搜索，幾乎可以說是改變了搜索的範式，提升搜索智能化的同時，極大地提高了使用者的使用體驗。

基於Google這樣的升級不管是有GPT-4加持的Bing，還是利用文心一言探索AI搜尋的百度，都必須在AI+搜尋的產品力方面加快創新步伐，才有可能在這一領域保持競爭力。

在辦公室軟體、協作辦公室方面。 Workspace的升級，讓Google有能力提供「真正的」數位員工。 Google不只是要對標老牌競爭對手微軟，更是對所有研發數位員工、AI辦公軟體以及AI協同辦公的供應商發出了挑戰。以釘釘、飛書、WPS為代表的公司，在文件處理，以及辦公、協作等方面的，可能都要重新評估自身的產品力。

在手機產業中，受到AI衝擊最大的廠商必然是蘋果，作為AI大模型時代唯一落後的巨頭，如果不在iOS生態中引入更多創新，蘋果恐怕很難應對來自Android陣營的AI攻勢。而其他手機廠商，不管如何唱AI手機概念，在Android+Gemini的裹挾下，基於系統的AI升級空間將會越來越小，要保持競爭力，就只能在硬體、生產成本，以及供應鍊等方面「摳「些小錢了。

而對整個AI產業來說，首當其衝的是OpenAI。過去一年中，OpenAI憑藉著大數據、大算力、強演算法、強工程的優勢，在AI產業內保持了一個身位的領先優勢。而隨著科技的普及和其他科技業的發展OpenAI所謂的技術優勢，支撐正在變低。 OpenAI的領先技術正從過去的被模仿，變成同期發布。

AI公司的技術競爭正悄悄向商業競爭和產品競爭過度。 Google透過整合其廣泛的產品生態系統，將AI技術落地到更多實際場景，如手機、辦公室軟體、智慧家庭和線上教育等。一步步建構了龐大的商業生態和穩固的市場領導地位。

未來的競爭，或將更體現應用在場景中的多樣性和市場主導地位的爭奪。在GPT-5或其它更強大的AI大模型到來之前，OpenAI等AI公司在應用場景上的劣勢將會被Google持續放大。

如今，Google正以教科書般的方式展示如何在激烈的市場競爭中，透過技術和商業策略的雙管齊下實現反擊。這不僅是技術上的博弈，更是商業模式和生態系統建構上的較量。

WONGCW 網誌

記錄生活經驗與點滴

Google教科書般的AI反擊戰

2024-05-16 Comments 0 Comment

相關

發表迴響取消回覆

2024 年 5 月
一	二	三	四	五	六	日
		1	2	3	4	5
6	7	8	9	10	11	12
13	14	15	16	17	18	19
20	21	22	23	24	25	26
27	28	29	30	31

分享此文：

相關

發表迴響取消回覆