谷歌一雪前恥全新PaLM 2反超GPT-4 Bard史詩進化
新版PaLM 2超強進化,辦公全家桶Workspace全面升級,Bard全面增強、所有人可用……可以看出,這屆I/O大會,Google是真的憋出不少大招。GoogleI/O 2023大會,彷彿又給Google的支持者們打了一針強心劑。
此前,因為微軟和OpenAI的優異表現,Google已經被唱衰了很久。
但是,畢竟是做出了眾多奠基性工作的AI老牌公司,Google這一輪的發力,讓我們精神一振——它只是慢了,並不是噶了。
對打GPT-4的PaLM 2登台、Duet AI整進Google辦公全家桶Workspace、Bard超強進化向所有人開放、Google搜索加入AI快照、AI新功能整合進Android 14、AI魔術編輯器加入Google相冊等等。
這屆I/O大會,可謂眼花繚亂,精彩紛呈。
PALM 2秀肌肉,手機也能跑
OpenAI的GPT-4,已經被全世界公認為最強大的語言模型。
怎麼對打GPT-4?Google的答案,就是PaLM 2。
恰在今天,Google一同發布了PaLM 2技術報告。
論文地址:https://ai.google/static/documents/palm2techreport.pdf
顯然,PaLM2被寄予了厚望,以縮小Google和微軟之間在AI方面的差距。
劈柴介紹說,因為廣泛的邏輯和推理訓練,PaLM 2模型在邏輯和推理方面更加強大。據說,PaLM 2在超過100多種語言的多語言文本上進行了訓練。
根據基準測試,對於具有思維鏈prompt或自洽性的MATH、GSM8K和MGSM基準評估,PaLM 2的部分結果超越了GPT-4。
據Google高級研究主管Slav Petrov介紹,PaLM 2在推理、編碼和翻譯上都表現更好,與2022年4月發布的第一代PaLM相比,PaLM 2有了明顯的改進。
可以看到,PaLM 2的推理能力,得到了显著的改进
修改代碼bug後,用韓語評論。
比如,PaLM 2能夠理解不同語言的成語。
比起PaLM,在最新專業語言熟練度考試中的表現,PaLM 2的日語水平達到了A級,而PaLM達到了F級。PaLM 2的法語水平達到了C1級。
德語“Ich verstehe nur Bahnhof”如果直譯,就是“我只理解火車站”,但如果你問它,你是不是理解錯誤了?
它馬上就會告訴你,沒錯,這個德語的意思是“你說的啥?我什麼都聽不懂”。
再比如,和波斯諺語“Na borde ranj ganj moyassar nemishavad”(No Pain, No Gain)意思相近的中文諺語是什麼?
在相關論文中,Google工程師聲稱PaLM 2的語言能力已經“足以教授這門語言”,原因是其訓練數據中的非英語文本更為普遍。
PaLM 2包含了4個不同參數的模型,包括壁虎(Gecko)、水獺(Otter)、野牛(Bison)和獨角獸(Unicorn),並在特定領域的數據上進行了微調,為企業客戶執行某些任務。
這些微調就像給一個卡車底盤,加上一個新的發動機或前保險槓,以在某些特定任務上更好地工作。
這樣的優勢不言而喻,不用花費大量的時間和資源來創建,直接部署。
另外,PaLM2有一個基於健康數據訓練的版本Med-PaLM 2,可以輕鬆通過美國醫學執照考試,達到“專家”水平。
一個基於網絡安全數據訓練的版本Sec-PaLM 2,可以解釋潛在惡意腳本的行為,檢測到代碼中的威脅。這兩種模型都將通過Google雲提供給特定客戶。
目前,PaLM 2已經應用在25種功能和產品中,包括辦公全家桶、聊天機器人Bard、搜索等等。
值得稱讚的是,PaLM 2最輕量版本Gecko小到可以在手機上運行,每秒可以處理20個token,大約每秒16或17個單詞。
不過,Google沒有提及具體用什麼硬件來測試這個模型,只是說在“最新的手機上”運行。
显然,这次Google在大语言模型的小型化上,取得了非常重要的进步。在云端运行这种AI,往往是很昂贵的,如果能在本地运行,无疑有着许多显著优势,比如隐私保护。
英偉達科學家Jim Fan對此大加讚許——
下一波LLM將是移動原生的。一個離線的、永遠在線的LLM不僅可以降低服務成本,而且還為用戶體驗開闢了全新的途徑。例如,一個元應用程序可以從你的移動工作流程中學習,並為你實現自動化。在小屏幕上節省的生產力,將比在大屏幕上多得多。
此前,Google一直被嘲在AI研究上已經落後於微軟,PaLM 2,無疑是Google的一次重大回擊。
但PaLM 2同樣也面臨著一些爭議,比如訓練語言模型的數據是否合法?
Google只是提到訓練語料庫來自“網絡文檔、書籍、代碼、數學和對話數據”,但並沒有進一步的細節。
而大語言模型的幻覺問題,同樣無法避免。Google研究副總裁Zoubin Ghahramani表示,PaLM 2是對早期模型的改進,Google“投入了大量精力,不斷改進基礎性和歸因指標”。
但他承認,在打擊AI產生的虛假信息方面,大家都還有很長的路要走。
除了PALM 2,Google還宣布了正在訓練的全新基礎模型Gemini。這是第一個多模態模型,同樣包含了參數大小不同的模型。
除了介紹模型,Google還特地介紹了開發AI 技術的社會責任感,包括兩個判別AI生成內容的工具:
– watermarking(嵌入水印)
– met ADATA(嵌入元數據)
Duet AI:辦公全家桶新升級
此前,微軟Copilot把GPT-4整進了全系辦公產品,掀起了震驚全世界的辦公軟件革命。
怎麼破?Google這次祭出了Duet AI,給Google辦公全家桶Workspace來了一個全新升級。
其實呢,這也就是新瓶裝舊酒,Duet AI就是Docs和Gmail等軟件中AI工具的新名字。
Google希望,生成式AI能讓Gmail、Docs、Sheets和Slides更有用,不過目前,大部分功能還在開發中。
Duet AI會涵蓋Google的各種辦公軟件,包括在文檔和Gmail中的寫作輔助、幻燈片的圖片生成、Meet的自動會議摘要等等。
在文檔中,只要點“Help me write”,Duet AI就能自動幫你生成招聘啟事。
好玩的是,你還可以規定任意文風,比如讓它古怪的調調寫出一個工作描述。
在Google Slids中,Duet AI能直接從幻燈片中的文本生成圖像。
簡單描述一下,合意的圖片立馬生成。
想做一個遛狗業務的收費表?描述一下,它就給你自動生成。
而I/O大會上一個真正的新事兒是,寫作輔助也會應用在移動端的Gmail上,這是對Smart Compose的升級。
現在,如果想試用這些新工具,需要註冊Workspace Labs,加入候補名單。
好消息是,現在任何人都可以申請加入候補名單了,不過目前尚不清楚用戶何時可以訪問。Google的說法是,將在未來幾週內將服務擴展到“更多的用戶和國家”。
目前唯一可靠的消息是,Gmail的移動程序上會出現“Help me write”AI助手,此前微軟也曾推出類似產品,將必應集成到iOS和Android的SwiftKey鍵盤中。
Bard又雙叒叕便強了
發布會上,Google還宣布了一個重磅消息。
那就是,Bard未來也能像ChatGPT一樣,接入網絡,實時搜索網頁。
這次,Bard上新了不少功能,比如支持了兩種新的語言——日語和韓語,用戶目前可以更簡便地把生成的文本導出到Google文檔和Gmail,可視化搜索,以及深色模式等等。
不過,最令用戶開心的,想必是Google決定取消Bard的等候名單——將在180個國家或地區提供服務。
此外,和Adobe的AI圖像生成功能,以及Instacart和OpenTable等第三方服務的功能整合也正在路上。
總的來看,這些上新是給老Bard注入的一針強心劑。
目前,Google正在使Bard變得更加可視化,讓Bard能夠分析圖像,並且能在查詢結果中提供圖像信息等等。
關於這一方面,Google在發布會上展示了一個案例。
假如用戶問Bard,美國的新奧爾良有哪些必看的景點,那麼Bard就能圖文並茂的解答這個問題。
就像用戶在Google搜圖中問同樣的問題一樣。
你還可以,用Bard起草郵件,並一鍵導入Gmail,還有文檔中。
而另一個更好玩兒的功能是用圖像提示系統。該功能由Google Lens提供,它能夠識別圖片中的物體。
比方說,上傳一張狗狗的照片,然後給一個prompt“為這兩隻狗寫編一個有趣的標題”。Google Lens就可以識別狗狗的品種,然後Bard就能寫下與這兩隻狗狗特徵相關的內容。
該功能目前可能還不太完善,雖說潛力無限。未來如何取決於系統的整合程度。
雖說對Bard來講,這是一個相當重大的更新,但和OpenAI的ChatGPT,以及微軟的Bing之間的差距仍然是肉眼可見的。
要知道,微軟在3月就給Bing增加了由OpenAI的DALL-E系統支持的AI圖像生成功能。而OpenAI和微軟一直在探索如何將聊天機器人與更多種的網絡服務相結合。
不僅如此,OpenAI早些時候還宣布了ChatGPT將和OpenTable預訂餐廳,以及Instacart訂貨配送的功能相結合。
Google表示,這些功能自己之後也會有的。
代碼能力up
Google表示,升級後的Bard將會非常擅長處理有關代碼的問題,包括調試和解釋20多種語言的代碼。
因此,今天發布會上的一些升級主要集中在這個方面上。
包括新的深色模式,改進的代碼引用功能——不僅能提供來源,還能解釋代碼片段,以及一個新的導出功能。
用戶可以把代碼發送到Google的Colab平台,還能和另一個基於瀏覽器的IDE——Replit一起使用(從Python查詢開始)。
只要選中代碼,就可以一鍵導出到Colab或者Replit。
還支持20+種編程語言。基本涵蓋了碼農們所需的所有編程需要。
甚至還能直接詢問Bard怎麼用某一種語言實現某種功能。只要prompt到位,生成一串代碼也就是幾秒鐘的事。
寫完以後,還能就著某一行代碼進行解釋,以及完善。
如此看來,結合了PaLM2的Bard應該會在生成質量上有明顯的提升。當然,具體表現如何,還得再觀察。
對戰必應,GoogleAI搜索已來
此前,整合進GPT的必應勢如破竹,真正威脅到了Google的搜索市場。
為了與微軟必應競爭,Google同在今天推出了由PaLM 2驅動的全新搜索引擎。
它能夠提供問題回答的摘要,比如問“為什麼酵母麵包仍然如此受歡迎?”,Google搜索就給出幾段詳細描述酵母的味道、其益生元能力的優勢等等。
另外,在生成內容旁,給出了3個鏈接,以證明摘要中的內容。這樣以減少AI在生成內容上出現“幻覺”問題。
當你搜索藍牙音箱,首先頂部有一個簡短的摘要,詳細說明了購買時應注意的事項:電池壽命、防水性、音質。
右邊是三個購買指南的鏈接,下面是6個不錯選擇的購物鏈接,每個旁邊都有一個AI 生成的摘要。
可以看到,這是Google搜索結果頁面的new look。把AI生成內容放在最開始。
比起重新設計的微軟必應,搜索結果頂部的AI框對Google來說更像是,一個小小的更新。
值得注意的是,要是想要訪問這一功能,你必須選擇Search Generative Experience(SGE)這一新功能。
並非所有搜索都會有AI生成的答案。只有當Google的算法認為它比標準答案更有用時,AI內容才會出現,而像健康、財務等敏感主題完全不會有AI生成。
Google表示,其改進後的搜索引擎能夠以對話方式跟踪原始搜索查詢的選項,無需重複已經提供的上下文或細節。
然而,Google搜索也不是無所不能,也存在從未完全解決過的問題——結構編排(orchestration of structure)。
因為大部分數據儲存在互聯網上,甚至Google內部,但將所有這些數據放在一起形成一個連貫的答案真的很難。
目前,已經開放候補名單僅限美國,Google表示,未來幾個月將考慮更廣泛地推出這一功能。
一鍵退款,智能P圖,沉浸導航
一鍵生成退款郵件?
Google行。
劈柴在發布會一開始就整了個小活。航班取消了得退款?不會寫申請退款的郵件?
gmail會。
只要在prompt欄裡輸入要求,gmail分分鐘生成了一篇有理有據有節的退款申請郵件。
另外,GoogleMap現在也有了沉浸式view,你想去哪,懟臉的實景導航來了。
你還能順便問問空氣質量、天氣、交通狀況,都能即時演示。
Magic Editor是Google最新公佈的照片處理功能,使用生成性AI,可以讓用戶在沒有專業工具的情況下對照片進行各種編輯。
不會p圖星人的福音來了?
發布會上,Google分享了幾個應用了這項新功能的案例,不得不說,效果酷炸了。
比如下面這張,Magic Editor一鍵把瀑布前的人像挪到了側面,還把背景中別的遊客p掉了。不僅如此,本來多雲的天氣硬是給p藍了。
再比如下面這張,Magic Editor一鍵將長凳上的小孩連著凳子一起移到了中間,自動補齊了多出來的椅子,還把原畫中缺失的氣球補齊了。
而且天也p藍了。
當然,這項功能還沒到最完美的地步。就比方說,仔細看看上面這張圖片,凳子挪動了,可是底下的影子沒動。
但總歸,這項功能對照片本身的理解是革命性的。
當然,咱現在還不用太擔心是不是有的圖片被Magic Editor處理過。因為Google說了,下半年才會推出這項功能。
AI筆記本Project Tailwind
學生黨福音來了。
不得不說,Google還真把學生們拿捏住了。
Project Tailwind從本質上講,就是個筆記本,但是加了AI的能力。
一下子就不一樣了。
用戶可以像問導師或者學習搭子一樣進行在Tailwind裡進行檢索。
雖說Google把這個功能其定位為學生服務的工具,但是對於日常需要處理大量文本的打工人來說,也是重大利好。
Google產品管理高級總監表示,Tailwind就像一個真正的筆記本一樣,你在裡面記東西,而這些內容就是AI學習的對象。
用戶可以簡便地從Google雲端硬盤中挑選文件,有效創建了一個兼具個性化和私人屬性的AI模型。
目前,該功能在大學校園內進行了廣泛的測試。
在示例演示中,Tailwind收集了一大堆學習筆記,然後,生成了包括主題詞在內的很多內容,比如,用戶可以為特定主題創建術語表。
Tailwind不僅僅能為學生服務,它對任何從不同來源獲取信息的人都有幫助。
隱藏在Tailwind背後的理念是,為什麼我們不能為每個用戶定制不同的AI語言模型呢?
當然,這裡存在兩個問題。
一方面是成本問題。訓練語言模型所需的計算需求和微調成本都很高,誰來負擔這個成本?另一方面則是信息安全性。
畢竟,捏造信息這種事可一點都不稀奇,誰能保證個性化的筆記本不會出現同樣的問題呢。
不過,是騾子是馬還得拉出來遛遛。用戶目前可以註冊Project Tailwind進行測試。該功能也是AI Labs計劃的一部分。
Android開發小助手
此外,GoogleI/O大會上還推出了專為Android開發的AI編碼機器人Studio Bot。
不僅可以生成代碼、修復BUG,甚至能夠回答關於Android應用開發的相關問題。
同時支持Kotlin和Java編程語言,並將直接嵌入到Android Studio開發工具的工具欄中。
來源:新知元