Google Bard大更新我們用GPT-4給它出了20道題
AI 熱潮以來,“突發”就成了我們標題的常客。昨天,來自Google 的大語言生成類AI 模型Bard 又迎來更新,新增了“Google it”按鈕,增強了數學與邏輯能力,並發布了一個全新的功能更新公告板。
發布以來就飽受爭議的Bard,如今能在數理邏輯領域,與GPT-4 一較高下嗎?
01.三個更新點,做數學題是重點
為了讓用戶更方便的了解Bard 更新變化,Google 上線了experiment updates(實驗更新)界面,展示Bard 的最新消息。網址如下:
相比其他廠商“提高系統穩定性,優化系統流暢度”的更新對聯,Bard 不僅告訴你更新了什麼,還告訴你為什麼更新。Google 表示,這是為了讓用戶更快的進行測試、提供反饋。
順著更新公告往下看,“Google it”是這次的第一個功能更新,當你問過Bard 後,可以在答案下方看到“Google it”的按鈕,點擊後Bard 會生成幾個相關主題,以便你使用Google 進行更多元的搜索。
這樣一來,Google 搜索就變成了Bard 的補充,如果在未來,Bard 完全替代前者我也不會感到意外。
不過,Google it 在提取複雜問題的主題時準確性還不夠高,比如在我詢問奧數題時,Google it 的主題幾乎沒有價值。
最後,也是最大的更新,Bard 的數學和邏輯能力得到了升級,以前一道123456*654321 就開始亂說的大語言模型終於站起了身,開始實踐“學好數理化,走遍網絡都不怕”的道理。
光說不練假把式,Bard 的數理能力夠不夠強,我們給它出了20 道題,看看它的表現如何。
02.GPT-4 出了20 道題,Bard 滿分
第二題答案有誤,應為(2,-1)
我們用GPT-4 整理了20 道數學、邏輯類問題,用於測試Bard 的數理能力。
先不說對不對,Bard 的反應速度著實很快,即使是加速後的GPT-3.5 也不是它的對手。
先來看看Bard 的表現,Bard 不僅完全答對了所有題目,還給出了詳細的解題過程。
ChatGPT 的表現也不錯,數學題全對,邏輯題只錯了一個。
我們也把同樣的問題翻譯成中文去提問了百度的文心一言和阿里的通義千問,10 道數學題,通義千問僅對1 題,文心一言則對了4 題;10 道邏輯判斷,通義千問3 題正確略勝一籌,文心一言2 題正確屈居第二。
不得不說,數理計算對大語言模型來說,門檻確實比較高。
10*3.14=314
無中生有的兔子
從我們簡短的測試來看,Bard 的表現相比它剛發佈時確實有了顯著的提升,在回答問題的邏輯性和正確性上已經逐漸趕上了GPT-3.5。
比ChatGPT 表現更好的是,Bard 在回答問題時還會加入引用信源,降低了編造事實的可能。
目前Google 對Bard 的試用申請似乎放鬆了不少,只要申請加入Waitlist 後再刷新幾次界面,就能馬上體驗Bard。
感興趣的朋友可以在下方地址體驗。
如果你的試用申請一直都沒通過,也不用著急。
Google 的CEO Sundar Pichai 最近在接受采訪時透露,Google 計劃將Bard 整合到搜索引擎中,以應對ChatGPT 等聊天機器人帶來的競爭壓力和更為廣泛的商業問題。
未來Google 應該會像Bing 那樣開放一個聊天搜索界面,直接在搜索引擎就能調用Bard。
目前Google 並沒有給出明確的時間表,也許在5 月10 日召開的Google I/O 2023 大會上會透露出更多的信息。
AI 不會畫手、AI 不會做數學題,這些問題已經慢慢成為了歷史,那麼問題來了,AI 的下一個突破點,又會在哪裡呢?