谷歌Bard“史上最大更新” 終於會說會讀圖支持中文等40多種語言
Google發布了旗下與ChatGPT正面打擂台的人工智能聊天機器人Bard最新進展,並稱之為“Bard工具迄今為止最大規模的擴張”。GoogleA週四午盤後漲幅擴大至4.4%,至一個月最高。生成式AI競爭對手微軟也漲超1%。
Bard打贏監管阻攔進軍歐盟市場,新增讀圖、調整答案語氣和風格等“硬實力”
官方博文稱Bard已可以支持40多種語言,包括阿拉伯語、中文、德語、印地語和西班牙語。用戶可在巴西和整個歐洲進行訪問,即使用場景拓展到全球更多地區,特別是重要的歐盟市場。
同時,用戶可以獲得更多定制化、個性化的AI回复。
例如,Bard可以將回答用語音讀出來了,這一功能已支持40多種語言。Google相關負責人稱,“這對想听聽單詞的正確發音,或者聽一首詩歌或劇本被朗誦出來等格外有用”。
用戶還可以調整AI回复的語氣和風格,目前分成五個選項,即簡單、長、短、專業或休閒。該功能僅限英語使用,但將很快拓展到新的語言。
此外,Bard還推出了四個“增進用戶生產力”的新功能,包括在網頁左側固定(pin)和重命名此前的對話記錄,方便隨時重新訪問;將Bard撰寫的Python代碼導出到Google Colab和Replit等軟件開發工具中;提供可分享的鏈接,方便用戶與他人分享部分或全部與AI工具的聊天內容,這三種功能均已支持40多種語言。
更引人注目的是,Bard新增了讀圖功能,可在用戶提問框中上傳圖像,要求AI聊天機器人解讀圖像、提供更多畫面信息,以及根據圖像撰寫標題。這一功能目前僅限英語使用,未來將很快拓展到更多新語言中。5月Google的I/O年度開發者大會上,曾宣布把Google Lens 的功能引入Bard。
Google還在官方博文中給出了一段疑似AI撰寫的“雞湯文字”,稱:“好奇心和想像力是人類創造力背後的驅動力……想像新可能性的能力也是人類與生俱來的人類品質之一。這就是我們創建Bard的原因:幫助您探索好奇心,增強想像力,並最終將想法付諸實踐,而不僅僅是回答您的問題。有鑑於此,Bard現在可以在世界大部分地區使用且能理解最廣泛使用的語言。”
有分析稱,Bard的最新改進正值Google試圖在白熱化的生成式人工智能領域保持領先地位,以在來自微軟支持的OpenAI、Anthropic和其他公司的快速、激烈競爭中脫穎而出。
而在一個月前,Google還因歐盟《通用數據保護條例》(GDPR)背後的歐洲主要數據監管機構——愛爾蘭數據保護委員會的阻攔而無法如期在歐盟推出Bard。
當時該監管機構的反對理由是,這家科技巨頭沒有就如何尊重歐盟數據隱私規則提供足夠的信息。Google今日在Bard拓展到歐盟後稱,將“大膽而負責任的開發人工智能”,主動與專家、政策制定者和隱私監管機構進行接洽,未來會將Bard引入更多的地區和語言,並聆聽公眾反饋。
見聞使用感受:還讀不懂人類諷刺圖片,中文讀詩AI腔太濃不夠驚艷
上述新功能聽起來天花亂墜,實際使用效果究竟如何?針對普通受眾最關心的“聽說讀寫”功能,華爾街見聞也對Bard做瞭如下測試,簡單來說,新功能使用起來似乎暫時算是“馬馬虎虎”。
首先,華爾街見聞詢問了Bard如何解讀週三馬斯克宣布成立新公司xAI後,網友嘲笑Meta的小扎將挖牆腳抄襲的圖片,這顯然是諷刺Meta的Threads抄襲了馬斯克的Twitter。
Bard反應了一會兒後,給出的回答很簡單:“不好意思,我當前還不能解讀有關人物的畫面。”並在給出回答的同時刪除了提問對話框中的圖像本身。
接著,華爾街見聞詢問如何解讀昨日另一熱門網圖,即xAI掀起的颶風正在摧毀一座標有ChatGPT字樣的房子,“自然人智能”都可以理解這是一副諷刺漫畫,形容ChatGPT在xAI面前不堪一擊。
Bard一開始只是簡單描述了畫面中有的物體:房子正在被颶風摧毀,並描述了颶風的特性,以及房子已經搖搖欲墜的畫面感。但結論卻是:“該圖像有力地提醒人們龍捲風的破壞力,它還提醒人們為惡劣天氣事件做好準備的重要性。”可見並不是一個令人滿意的答复。
華爾街見聞緊跟著詢問為何畫面上出現了X.AI和ChatGPT的字樣,Bard回復稱,這是因為兩者都是能產生文本的大語言模型LLM,解釋了一下LLM的定義,並認為“該圖像旨在隱喻LLM的破壞力就像龍捲風一樣,可以做善事也能作惡”,還稱“圖片上的X.AI和ChatGPT的標誌提醒我們LLM是強大的工具,應該負責任地使用,需要確保它們不會被用來造成傷害。”
是熟悉的AI聊天雞湯味兒了。
如果詢問給圖片配上標題,Bard給出了“LLM的力量”、“LLM的危險性”和“LLM的未來”等驢唇不對馬嘴的內容,很顯然,人類的毒舌諷刺實力,AI機器人還未能很好地貫徹領會。
華爾街見聞玩心漸起,又上傳了一張北極熊捂臉的圖片讓Bard解讀。見聞老讀者們都知道,美股熊市之際這張圖片會屢屢出現在媒體中。
如果只是簡單詢問“圖片講了什麼”,Bard給出的答復也非常中規中矩,但點明熊的動作和麵部表情說明它要么是悲傷、要么是恐懼、要么是專注,可能是感到孤獨或者害怕,總之是感情強烈。
如果具體詢問北極熊與股市的關係,Bard的回复便靠譜多了,準確地答出“是熊市隱喻,作為空頭對股市悲觀情緒的象徵”。還稱圖片也可以被看作是對股市投資風險的提醒。
要求它給出的標題也恰如其分,例如:“股市看跌的時候,連北極熊都捂著臉”;“熊市即將來臨,北極熊已經做好了準備”;“當股市崩盤時,就是冬眠的時候了”,屬實非常優秀。
華爾街見聞也詢問了鴿子圖像與美聯儲之間的關係。Bard一開始顯然在“AI式扯淡”,稱“它與美聯儲的聯繫是明確的:鴿子代表美聯儲的獨立性、對和平的承諾以及對未來的希望。”
如果具體詢問鴿子與美聯儲貨幣政策有何關係時,Bard顯然在嘗試理解“隱喻/比喻”(metaphor)這個概念,但給出的不是“鴿派聯儲”這種標準回答,而是稱“它與美聯儲貨幣政策的聯繫是顯而易見的:鴿子代表了美聯儲即使面對不確定性也保持經濟步入正軌的決心。”
好吧,Bard讀圖能力看上去還不能令人眼前一亮,畢竟人像解讀功能還沒有上線,對畫面中諷刺和隱喻的理解也不夠到位,那麼Bard“用語音讀出回复”的新功能如何呢?
華爾街見聞輸入了李白《靜夜思》的中文文字,首先要求Bard根據這首詩給出相關圖片,但被告知只能給出圖片的文字描述版,“對不起,我沒有生成圖片的功能。我只能生成文本。”
隨後華爾街見聞點擊答案框的右上角“小喇叭”標誌要求Bard進行朗讀,讀出來的統統都是AI味兒,不論如何詢問“請用深情朗讀”、“換成男聲朗讀”等具體要求,Bard都表示“臣妾做不到”。
若朗讀莎士比亞的英文劇本,倒是比較純正的美式發音,可見中文的進步空間還有不少!