谷歌展台「擠滿」中國廠商生成式AI邁向應用開發層
谷歌團隊「今年很忙」。 「好久沒看到Google 線下活動在國內有這樣的影響力了。」8月7日至8日,谷歌在北京舉辦2024年Google開發者大會,一位與會者感慨,「每一個展位都是人滿為患,主要還是AI相關。
在生成式AI成為大勢的當下,Google這場國內的大會也獲得了比以往更多的關注。在展示區,從裝置端生成式AI、多模態搜尋、生成式AI革新電子商務的展示到各種應用案例的展示,包括Gemma應用智慧大黃、Polyverse的Gemini 1.5 Pro應用展示以及高爾夫陪練,每一個展台前都圍滿了人。
相較於去年的開發者大會,今年的展區已經基本上都是生成式的內容,談及這一點,谷歌大中華區總裁陳俊廷表示,「這確實是谷歌的一個重點,所有人核心的一個任務。 」
「AI的題目很大,AI有時候並不是一個單一的全新工具,而是將原有的工具進化,所以我相信做遊戲的、做應用的、包括你知道的成功的企業,他們現在的能力都進化了,把AI的能力都加進去了。
All in AI
在keynote演講環節,從開發者的工具到安卓團隊、雲端團隊,所有演講者提到的產品都是基於生成式AI的。
在開場演講中,陳俊廷就提到了谷歌AI賦能的網易遊戲行銷,他提到,網易遊戲在海外借助谷歌Cloud和Vertex AI平台,提升了廣告文案創作效率,工作時間從原本一周縮減到了幾個小時,每月可產生700多條客製化的文案。在演講中,陳俊廷也提到了小米新一代旗艦設備將利用GoogleCloud和Gemini,為海外用戶帶來更智慧的體驗。
陳俊廷在演講上手機廠商在這一屆開發者大會的存在感很強,OPPO出現在了大會上,軟體工程事業部總裁唐凱來到了現場分享生成式AI 為手機行業在全球市場帶來的創新及OPPO在AI手機領域的最新策略。
「作為一項革命性的技術,生成式AI 對包括行動終端產業在內的各行各業都有著深遠的影響。」唐凱提到,OPPO結合Google Gemini 模型,在全球市場上推出了一系列創新的AI 功能,包括AI錄音摘要和AI工具箱。
其中,AI 錄音摘要支援多說話者識別,能夠自動識別並提取關鍵訊息,聰明地將冗長的會議內容整理成摘要,幫助用戶快速捕捉並理解錄音中的重點內容。 AI 工具箱則整合了AI 文章摘要、AI 文案產生和AI 語音朗讀三大功能,幫助用戶高效閱讀、產出創意文案。根據介紹,這些工具都整合在ColorOS 智慧側邊欄中,使用者可以隨時輕鬆呼叫。
唐凱表示,這些AI功能已經在全新的ColorOS 14 上實現,並在海外發布的OPPO Reno12 系列機型上落地。他提到,透過與Google等夥伴的合作,OPPO 正大力推動AI 手機普及。
GoogleCore ML 和GoogleCloud 工程副總裁Bill Jia在大會上表示,GoogleAI 正在協助OEM 廠商打造更智慧的裝置。谷歌的測試平台Android Device Streaming,聯合小米、OPPO、一加、三星等手機廠商,方便開發者進行終端測試,現處於Beta階段。
一些新創公司也在大會上展示了一些落地的案例。專注於出海和遊戲應用的新創公司Guru Network也正在將Google的模型Gemma2用於播客應用程式Castbox,用戶不用收聽整集播客,就能快速掌握內容重點。 Polyverse 開發的AI Mirror 應用,透過Gemini 的多模態功能優化了廣告素材分析、文案和創意生成,顯著降低了內容創作的時間和成本。
谷歌“今年很忙”
「這裡的團隊今年很忙(The team here has had quite a busy year)。」GoogleDeveloper X 和開發者關係副總裁兼總經理Jeanine Banks今年是第二年來中國這一大會,她在大會分享了谷歌三種不同規模的大模型和技術更新,可以滿足不同開發者的需求。
在Google的大模型系列中,Gemini Nano是最高效的模型,可以直接在行動裝置上運行,提供低延遲回應和資料隱私保護。 Gemini 1.5 Flash是Google迄今為止最快、最經濟的模型,適合處理高容量任務,提供100萬token 上下文視窗。 Gemini 1.5 Pro則支援200萬token 上下文窗口,適合需要最高品質回應的複雜任務。
此外,為了滿足開發者對靈活性和掌控力的需求,根據具體應用場景對AI 進行微調、增強和接地,谷歌推出了與Gemini 系列模型一脈相承的Gemma 系列開放模型,並於近期正式發布了比第一代模型更強大、更有效率的新一代Gemma 2 模型,安全性也有了顯著提高。
根據介紹,Gemini 已整合到眾多開發工具中,包括Android Studio、Chrome DevTools、Project IDX、Colab、VS Code、IntelliJ和Firebase,可協助開發者編寫、偵錯和測試程式碼,還可以產生文件、理解整個程式碼庫等,成為開發助手。
在大會上,Jeanine Banks提到,小米汽車SU7搭配應用是基於開發框架Flutter所打造。在原有Flutter基礎上,Google推出Flutter 3.24和Dart 3.5。新版最大看點是「Flutter GPU」新API的早期預覽版。如透過內建Flutter SDK,開發者可使用Dart程式碼存取GPU,進而提升影像渲染能力。
Android 開發技術推廣部主管史婧羽在大會上分享了Mobile 的最新動態,一些更新可以讓開發者利用Gemini建立下一代Android應用程式。例如,Gemini Nano可以在行動裝置端運行,提供低延遲回應和資料隱私保護,例如在聊天應用程式中實現智慧回應等功能,同時確保資料不會離開裝置端。即使在沒有蜂窩網路的情況下,Gemini Nano也能保證AI功能的可用性。
「這真是令人驚嘆的一年,」在接受第一財經等媒體的採訪時Jeanine Banks表示,「去年我在上海的時候接觸了很多中國的新創企業,當時我的感覺是這些企業在嘗試各種各樣的事情,去做一些AI 方面的探索。更複雜更精妙的一些AI系統。
在這些複雜的AI系統中,不是只有一個智能Agent,而是有多個智能Agents,他們互相協同完成任務。 「在一年之中就能夠有這麼多的變化,速度還是非常喜人的。」Jeanine Banks說,一年之後,她看到了非常多的機會,服務市場的願望也更強烈。
同時Jeanine Banks觀察到了第二個比較大的重心轉移是,「以前大家非常多的重心是放在如何快速把更多的解決方案和應用交付給更多的用戶,這一點當然還是重要的,但是現在大家也非常重視一點,就是當我們把AI的規模做大的同時,要達到合規,要履行負責任的AI的原則。
陳俊廷認為,AI 推動的進步不僅限於尖端生產力,在促進文化傳承與造福社會上,同樣有無限可能。廣西民族大學運用Google 全球AI 開源技術,保護和傳承少數民族非物質文化遺產;在四川的高原牧場,西南民族大學借助谷歌 AI 開源技術,改善了當地牧民的生活;谷歌公益與欣欣教育基金會合作,透過「編譯夢想」 計畫為26 所偏遠地區小學的900 多名學生提供AI 入門教育。
談到谷歌未來的計劃,Jeanine Banks認為,一方面是要堅持開源,幫助中國的開發人員更好出海,另一方面也會使用谷歌的技術專長,幫助出海的中國開發者、開發公司去面臨複雜的海外業務,實現對海外不同市場的合規服務,進行產品的適應。