谷歌急推產品“翻車” 大企業匆忙入局聊天機器人充滿風險
人工智能(AI)聊天機器人巴德(Bard)回答錯誤,Google公司“被扣”1000億美元。Google似乎在與微軟的緊張競爭中失去了自己的節奏,倉促推出類ChatGPT技術只會增加錯誤風險。
2月7日,Google在宣布其類ChatGPT服務“巴德”時,在Twitter上發布了一個演示產品的GIF動圖,結果被網友發現,巴德在回答關於哪顆衛星首先拍攝了地球太陽系外行星的照片時提供了錯誤答案。
回答出錯被發現後,2月8日Google母公司Alphabet股價下跌超7%,市值蒸發約1000億美元。這是Alphabet三個月來最大的股價跌幅。
當地時間2月8日,Google還在巴黎舉行了一場發布會,展示其在人工智能方面的進展,但並沒有如預期般詳細介紹巴德的相關信息,僅對原有的人工智能產品做了一些更新和拓展,被評價為“蒼白無力”。
如今,整個科技界都在註視Google“著急上火”的樣子。彭博社發表題為“AI聊天機器人的偉大競賽:人工?是的。智能?也許”的專欄文章,稱微軟的必應和Google的巴德肯定會犯錯誤,與Google合作的出版商也不會高興。《福布斯》發表題為“’人工智能第一’到最後:Google如何在人工智能熱潮中落後”的文章,稱Google過去的醜聞、拙劣的發布動作和人才流失使它處於一個令人驚訝的位置:在它幫助創建的領域(搜索)中追趕。
Google睡著了?
在上述動圖中,巴德被提問“我可以告訴我9歲的孩子關於詹姆斯·韋伯太空望遠鏡(JWST) 的哪些新發現?”
巴德給出了很多答案,其中一個暗示詹姆斯·韋伯太空望遠鏡被用來拍攝地球太陽系外行星的第一張照片。然而,第一張系外行星照片是由歐洲南方天文台的甚大望遠鏡(VLT)在2004年拍攝的,這一點已被美國宇航局證實。
DA Davidson高級軟件分析師Gil Luria表示,“雖然Google在過去幾年一直是AI創新的領導者,但他們似乎在將這項技術應用到他們的搜索產品上時睡著了。”
“Google過去幾週一直在努力趕上搜索功能,這導致昨天(2月7日)匆忙宣布,並在其演示期間發布錯誤答案的尷尬混亂。”Luria說。
“人們開始質疑微軟現在是否會成為Google真正賴以生存的業務的強大競爭對手。”持有Alphabet和微軟股票的貝克大道財富管理公司首席策略師King Lip表示。Lip也警告稱,對Alphabet的擔憂可能被誇大了,“我認為必應與Google的搜索能力還差得很遠。”
Google發言人表示,該錯誤凸顯了“嚴格測試流程的重要性,我們本週將由受信任的測試人員啟動這一過程”。“我們會將外部反饋與內部測試相結合,以確保巴德的回答在質量、安全性和全面性方面達到高標準。”
Google提出“正確答案不止一個”
自去年年底微軟支持的OpenAI推出ChatGPT以來,Google一直承受著壓力。ChatGPT在通過商學院考試、創作歌詞和回答其他問題方面的能力,使其迅速成為病毒式傳播的熱門話題。2月8日,微軟宣布推出支持聊天機器人的新版必應。(詳見澎湃科技報導《“搜索領域新的一天”:微軟推出支持聊天機器人的必應,可查最近事》)
Google也想方設法在這場競爭中獲得領先地位,2月7日搶先公佈了巴德。但在2月8日的巴黎發布會演示中,Google並沒有詳細說明如何以及何時將巴德整合到核心搜索功能中,僅對巴德進行了簡短的演示,比如向聊天機器人詢問有關購買電動汽車利弊的問題。與微軟展示新版必應並提供有限公眾訪問權限相比,Google的功能演示並沒有太多新意。
也許演示中最有趣的一點是,Google展示了它在未來將如何使用生成式人工智能從網絡中總結信息。在演示中,Google展示了對“觀星時最適合尋找的星座是什麼?”這一問題的搜索。人工智能生成的回答突出了幾個關鍵選項以及如何發現它們。
“新的生成式人工智能功能將幫助我們在搜索結果中組織複雜的信息和多個觀點。”Google高級副總裁Prabhakar Raghavan說,“有了這個,你將能夠快速了解全局,然後繼續探索不同的角度。”
Raghavan將這種回應稱為“NORA”回复,是no one right answer(正確答案不止一個)的首字母縮寫。這似乎是在回應對AI生成內容的普遍批評——它們傾向於選擇一個單一答案作為最終答案。但Raghavan沒有具體說明該功能何時可用。
儘管Google是AI領域的領導者,多年來一直慢慢地將AI功能融入搜索中,但截至最近都沒有推出ChatGPT的直接競爭對手。雖然剛剛推出巴德,但該系統目前僅在封閉測試版中進行測試,並承諾在“未來幾週”的某個時候更廣泛地向公眾開放。
在直播演示中,Google演示向巴德詢問有關購買電動汽車的利弊的問題。圖片來源:Google
在巴黎發布會上,Google宣佈在用戶超10億的Google翻譯上已經實現了翻譯功能與AI技術的進一步整合。比如,英語、法語、德語、日語和西班牙語中具有多種含義的單詞和短語,可以根據輸入的上下文得到更準確的翻譯。
除此之外,Google宣布之前推出的Google地圖“沉浸式視圖(Immersive View)”開始在倫敦、洛杉磯、紐約、舊金山和東京推出。該功能融合了數十億張街景和航拍圖像,打造了全世界的數字模型。通過AI技術神經輻射場(NeRF),它可以將普通圖片轉化為3D視圖。用戶能夠查看天氣、一天中不同時間的交通和車流等信息。
混亂且充滿風險的競爭
在最近幾周大科技公司裁員數万人並且承諾削減“登月項目”(指具有“登月”意義、造福人類社會的項目類別)後,ChatGPT似乎為科技業重新註入了活力。路透社發現,人工智能已經成為科技高管們的關注對象,他們在最近的財報電話會議上提到它的頻率是前幾個季度的六倍。
彭博社專欄作家Parmy Olson指出,對Google而言,推出類ChatGPT服務可能是它多年來最冒險的戰略舉措,就像從沙發上一躍而起,該公司已經在沙發上放鬆了太久。但Google和微軟這兩家一向行動遲緩的科技巨頭間的這場爭奪,將是混亂且充滿風險的。
AI驅動的搜索的吸引力在於它可以用通俗易懂的語言顯示結果,而不是列出大量令人眼花繚亂的鏈接,這可以使瀏覽速度更快、效率更高。但是,AI聊天機器人也給企業帶來了一定風險,因為用於訓練這些工具的數據中存在人類的固有偏見和虛假信息。儘管有嚴格的過濾器阻止機器人發表政治聲明或仇恨言論,但社交媒體Reddit的用戶已經想出瞭如何“越獄”迫使ChatGPT繞過安全規則發表違禁言論。
乍一看,Google似乎在如何使用新技術方面更加大膽。在微軟發布的新版必應的示例中,聊天機器人的答案似乎將被降級到頁面的一側,而不是通常搜索結果的前面和中心,同時AI聊天機器人的回答還包括腳註和來源材料的鏈接,這使得該工具看起來更值得信賴。新必應的界面還包括對用戶的警告:“讓我們一起學習。必應由人工智能驅動,因此驚喜和錯誤是可能的。確保檢查事實,並分享反饋,以便我們學習和改進!”
根據必應分享的一個例子,它的新聊天引擎答案出現在搜索頁面的右側。圖片來源:微軟
相比之下,Google的巴德示例在頁面中間、搜索結果上方顯示了單一的摘要答案,並且沒有腳註,這意味著用戶不可能識別來源。為什麼?這也許是因為Google面臨著迅速行動的壓力。根據《時代》雜誌最近對DeepMind首席執行官Demis Hassabis的採訪,該機構目前正在開發一個名為Sparrow的聊天機器人,將在其對查詢的回答中引用消息來源,但Google的新工具並沒有使用DeepMind的技術,至少現在還沒有。DeepMind是Google母公司Alphabet旗下的研究實驗室。
巴德的頁面截圖,在中間顯示了它的合成答案,在其他來源的搜索結果之上,並且沒有引用鏈接。圖片來源:Google
“大型科技公司被迫採取行動,但技術還沒有成熟。”以色列初創公司AI21 Labs的聯合創始人Ori Goshen表示,“這項技術比一年前成熟得多,但還遠未強大到足以躋身最前沿。”AI21 Labs運營與OpenAI的GPT-3.5相互競爭的大語言模型。
OpenAI等公司試圖通過增加參數和用於幫助預測單詞的設置,來提高其語言模型的準確性,但把模型做大很多並不意味著它們會變得更準確,一些研究人員懷疑,隨著模型的增長,準確性的回報會遞減。對微軟和Google來說,消除那些持續存在的少數錯誤可能會成為一項長期挑戰,就像自動駕駛技術迄今為止“即將實現”一樣。
Google還有可能破壞其與網絡出版商的關係,這些出版商依賴Google的搜索頁面為它們的網站帶來點擊。Google長期以來一直擁有相關技術,可以在多年前引入人工智能驅動的搜索查詢答案,甚至早在2011年就談到這樣做,但從未這樣做過,因為這會破壞其價值1500億美元的業務。現在它被迫採取行動,可能會激起出版商的憤怒,儘管出版商也終將直面不可避免的技術進步。