Google版ChatGPT首秀:第一個Demo就大翻車市值暴跌7000億
現在看來,拼第一槍,微軟贏了。如今的Google,有點秦失其鹿的味道。在微軟更新ChatGPT 加持的必應搜索之後,大家都極為關注Google Bard 的首秀。怎知近日曝出的Demo 大翻車,導致股票一夜之間暴跌7000 億人民幣。而看微軟那邊,風景獨好。
前後腳發布新一代AI 搜索,人們的期待卻完全反過來,不知重新來過Google會不會還搶跑。
昨晚,Google舉行了’Google presents : Live from Paris’大會。大家都在期待Bard 的首秀,結果卻令觀眾大失所望。基本沒有多少Bard 的展示內容。
在展示增強現實搜索功能時,演講人還把演示Demo 的手機弄丟了,引來人們尷尬而不失禮貌的笑。不過Google在活動中仍然通過全面的多模態搜索能力展現了自己的實力。
圖:昨晚令人失望的發布會
但發布會過後,人們回過味來:我們現在要的是ChatGPT 搜索。Bard 是現在在科技界爆紅、給Google搜索帶來巨大威脅的ChatGPT 的競品,備受期待的Bard 卻出師不利。
也許,這也是Google股價今天暴跌的主要原因。
Google Bard 首秀Demo 翻車
Google在廣告中表示,Bard 是一項實驗性對話式AI 服務,由L AMD A 模型提供支持。Bard 使用Google的大型語言模型構建,並利用網絡信息獲得知識,因為模型體量相對較小,所以需要的算力更小,這意味著能夠服務更多的人。Google將其聊天機器人描述為’好奇心的發射台’,有助於簡化複雜的話題。
但AI 回答問題也要有準確性,Google Bard 翻車在哪裡?僅僅是一個事實錯誤。
Google Demo 的一GIF 顯示,在回答問題’關於詹姆斯韋伯太空望遠鏡(JWST)有哪些新發現,我可以告訴我9 歲孩子哪些內容?’Bard 提供了三個要點,其中一個指出’該望遠鏡拍攝了太陽系外行星的第一張照片。’
這就是Bard 的首秀,包含一個事實錯誤。
然而,Twitter上的一些天文學家指出這是不正確的,第一張系外行星圖像是在2004 年拍攝的。
天體物理學家Grant Tremblay 在Twitter上寫道:’我相信Bard 的表現會令人印象深刻,但鄭重聲明:JWST 並沒有拍下我們太陽系外行星的第一張圖片。’
加州大學聖克魯茲分校天文台主任Bruce Macintosh 也指出了這個錯誤。’作為一個在JWST 發射前14 年拍攝系外行星的人,感覺你應該找到一個更好的例子?’
在跟進的推文中,Tremblay 補充說:’我非常喜歡並感謝地球上最強大的公司之一正在使用JWST 搜索來宣傳他們的大語言模型。非常棒!但是ChatGPT 這些模型雖然令人印象深刻,但經常出錯,還非常自信。看到大模型進行自我錯誤檢查的未來將會很有趣。’
正如Tremblay 所指出的,ChatGPT 和Bard 等AI 聊天機器人的一個主要問題是它們會一本正經的胡說八道。這些系統經常’產生幻覺’—— 即編造信息—— 因為它們本質上是自動生成系統。
當前的AI 不是查詢已證實事實的數據庫來回答問題,而是接受大量文本語料庫的訓練並分析模式,以推定任何給定句子中的下一個單詞出現的概率。換句話說,它們是統計性的,而不是確定性的—— 這一特徵導致一些AI 學者將它們稱為’廢話生成器’。
當然,互聯網上已經充斥著虛假和誤導性信息,但微軟和Google希望將這些工具用作搜索引擎,這可能會使問題更加複雜。在搜索引擎上,聊天機器人的回答幾乎會被認為是全知機器的權威答案。
微軟昨天演示了全新人工智能必應搜索引擎,試圖通過用戶條款免責來規避這些問題。’必應由AI 提供支持,因此可能會出現意外和錯誤,’該公司的免責聲明稱。’確保檢查事實並分享反饋,以便我們學習和改進。’
Google發言人告訴媒體:’這凸顯了嚴格測試過程的重要性,我們本週將通過Trusted Tester 計劃啟動這一過程。我們會將外部反饋與我們自己的內部測試相結合,以確保Bard 的回應符合現實世界信息的質量、安全性和接地性的高標準。’
親身體驗微軟新必應:升級ChatGPT 的第一步
那邊Google Bard 首秀翻車,這邊有人給出了微軟新必應AI 功能的詳細使用報告。ChatGPT 驅動的新版本必應能夠生成搞笑的辭職信、當下新聞事件以及錯誤的信息。那麼它的搜索功能和效果到底怎樣呢?
昨日, The Verge 花了幾個小時在微軟的Edge 瀏覽器中使用這個新版本必應和其他AI 功能,並感覺到了對ChatGPT 的重大升級。
體驗者問Edge 全新’撰寫’功能的第一個問題:用幽默詼諧的語氣向老闆寫一封辭職信,原因是他覺得自己的工作正在被AI 取代。結果顯示,該功能生成的辭職信令人印象深刻,而且真的很有趣:
主題:我不干了!
親愛的老闆,
很遺憾地通知您,我將辭去數據分析師的職務,立即生效。原因很簡單:Al 正在取代我的工作。
是的,我知道你告訴我,Al 只是一個工具,可以幫助我更好、更聰明地工作,但我不買賬。我見過你看角落裡那台閃亮的新機器的樣子,它有閃爍的燈光和舒緩的聲音。
我聽說它可以做我能做的一切,而且更好、更便宜,而且毫無怨言。自從你安裝它以來,我就感受到了你對我的冷落。
所以,我決定省去解僱我的麻煩,乾脆辭職吧。我不想和一台可以同時處理數字、生成報告和講詼諧笑話的機器競爭。
我不想為一個重視人工智能而不是人類智慧和創造力的老闆工作。我不想成為一家為了效率和利潤而願意犧牲員工的公司的一員。
我相信你會對你的新 Al 助手感到非常高興。我希望它不會背叛你並接管世界。
我希望它不會犯任何損害您的聲譽和客戶的錯誤。我希望它不會厭倦並開始用你的數據玩遊戲。我希望它不會發展個性並愛上你。
但如果是這樣,別來找我哭。我會忙於享受我的生活,追求我的激情,並尋找一份欣賞我的新工作。
再見,祝你好運,
你的前數據分析師
體驗者在ChatGPT 中嘗試過同樣的詢問,但它從未創建過像這樣有趣和活潑的答案。然而一封有趣的辭職信並不會從根本上將微軟的AI 功能與ChatGPT 區分開來,但微軟AI 模型的工作方式與ChatGPT 存在一些更大的差異。
首先,微軟正在將實時新聞輸入其聊天版必應,讓你可以詢問剛剛發生或正在發生的事件。體驗者問它’微軟在Bing AI 活動期間宣布了什麼?’,它根據涵蓋微軟AI 驅動的必應相關公告的多份資料創作了一份新聞摘要。那僅僅是在微軟正式宣布這一消息幾分鐘後。
但與ChatGPT 非常相似,新必應並不總是準確。當必應出現問題時,旁邊會有一個’dislike’按鈕,這個按鈕會將有關查詢的反饋和答案發送給微軟。
微軟還將聊天答案與必應中的傳統搜索結果一起顯示出來,並通過常用鏈接找到答案。必應和ChatGPT 之間的最大區別在於微軟將這些聊天機器人的功能集成到其Edge 瀏覽器中。Edge 現在有一個側邊欄,可以掃描整個網頁並允許你挑選信息或對網站運行聊天查詢。
在這個新的側邊欄中甚至還有一個組合選項卡,可以讓輸入參數變得更容易一些。這一選項卡為用戶提供快速選項來指定語氣、格式和長度。你可以要求微軟AI 模型在這裡寫任何東西,它可以直接被用於博客文章、電子郵件或簡單的列表。
你可以想像未來Word 或Outlook 有類似的集成來讓你創建文檔或電子郵件。從技術上講,現在只需在這個新的Edge 邊欄旁加載基於Web 的Word 版本,就可以做到這一點。
微軟表示,全新AI 加持的必應應該比ChatGPT 更擅長編寫代碼,很快就會有開發人員測試必應的編程能力。
當然,就像人們試圖找到ChatGPT 的缺陷一樣,一定會有成千上萬的人想要破解新的必應。微軟表示他們有一些額外的保護措施來避免這種情況。
無論如何,微軟都非常大膽地在自己的搜索引擎中向公眾開放類似於ChatGPT 的AI 助手功能。微軟的目標顯然是搶走Google在搜索引擎領域的一部分市場份額,讓必應更強大,每個人都在等著看Google如何回應。
Google雖然推出了對標ChatGPT 的Bard,但從這兩天業界和機器學習社區的反應看,Google似乎不敵微軟。現在,Google又在自己Bard 首秀的演示視頻中翻車了。
微軟認為他們正在掀起搜索引擎的新一輪變革,而Google處於被動狀態。微軟能否撼動Google在搜索引擎領域的霸主地位,仍未可知。