Google發布多模態Bard助理互動式AI時代近了?
日前在新品發表會上,Google正式發表新一代Android旗艦手機Pixel 8 / Pro系列,搭載Tensor G3晶片,該晶片可運行更複雜的ML(機器學習)模型,為新機新增多項AI增強功能,例如用不同語言與「更自然」的聲音為使用者朗讀網頁,虛擬助理說話也更自然。
Google指出,Pixel 8 Pro是首款直接在裝置上運行Google基礎大模型的手機,其運算量是Pixel 7上最大的ML模型的150倍。
同時,Google宣布面向Android與iOS設備,推出“Bard助理(Assistant with Bard)”,將手機的個人助理功能與生成式AI相結合,用戶可透過文字、語音或圖像與Bard助理互動——換言之,其具備多模態功能。
例如,當用戶詢問“本週我錯過了哪些重要郵件”時,Bard助理會列出各項要點及具體內容,並附上具體對應郵件的鏈接,還可以幫助用戶提取活動地址並在谷歌地圖中顯示。
若用戶想將一張小狗的照片發佈到社群媒體上,只需召喚出Bard助理浮動對話框,並要求其撰寫發佈內容。Bard助理將在辨識影像後,撰寫對應內容。
Google表示,接下來很快將向早期測試人員推出Bard助理,以獲取回饋;並在未來幾個月內向公眾推出。
另外,DeepMind共同創辦人Mustafa Suleyman日前受訪時表示,現階段的生成式AI只是一個過渡性的技術階段,接下來將進入互動式AI時代, AI將根據使用者的不同任務需求,安排其他軟體和或聯絡真人來完成工作。
他認為,第一波AI浪潮主要聚焦於分類(Classification)-深度學習表明,人類可訓練AI,對影像、視訊、音訊、語言等輸入資料分類。目前人類正處於第二波浪潮「生成式AI」中,即「輸入資料並產生新資料」。而未來的第三波浪潮將屬於“互動式AI”,“對話才是未來的互動介面”,用戶不僅僅是點擊按鈕和鍵入文字,而是與AI直接對話,屆時互動式AI將能自主採取行動。
天風證券指出,C端AI應用落地階段場景重要性凸顯,聊天機器人、AI伴侶和內容生產工具場景最先落地,這些場景中的AI應用開發速度和商業化進展或超預期。
分析師預計,AI迭代和後期事件催化持續加速,下半年開始海外巨頭應用和模型迭代速度提昇明顯,通用聊天機器人的能力有望進一步加強,或將帶動用戶體驗的提升以及用戶數量的進一步增長。
另外,華金證券補充稱,大模型從通用走向垂直場景更多的是對商業化落地的探索,是大模型從訓練走向推理的動能。伴隨著垂直大模型的發展完善,大模型的應用才是開啟更大成長空間的關鍵。邊緣運算是一個明確的龐大的增量市場,目前已經發展到產業落地階段,雲端運算公司、電信業者、設備廠商、CDN公司等都在積極推動產業落地。