Skip to content
WONGCW 網誌
  • 首頁
  • 論壇
  • 微博
  • 壁紙下載
  • 免費圖床
  • 視頻下載
  • 聊天室
  • SEO工具
  • 支援中心
  • 表格製作
  • More
    • 在線名片
    • 網頁搜索
    • 天氣預報
    • 二維碼生成器
  • Search Icon

WONGCW 網誌

記錄生活經驗與點滴

七大標準比較Gemini和ChatGPT,誰是AI No.1?

七大標準比較Gemini和ChatGPT,誰是AI No.1?

2023-12-12 Comments 0 Comment

讓Google和OpenAI掰手腕。GoogleGemini大模型和OpenAI的GPT誰比較出色?Gemini相比Google之前的模型有了多大進步?目前,公司自己吹噓能吊打GPT-4的Gemini Ultra還得等明年才能上線,但GoogleBard聊天機器人已經換上了低配版本Gemini Pro(對標GPT-3.5)。

科技評論網站ARS TECHNICA,讓Gemni Pro、GPT-3.5和GPT-4在數學、編程、文本生成等方面進行了一次全面PK,同時還附上了4月份對舊版本Bard(運行PaLM 2模型)的測試結果,來展現GoogleBard所取得的進步,並展現了這些AI助理到底哪一個對一般人的工作效率提升最大。

結果顯示,雖然有了Gemini Pro的加持,但GoogleBard聊天機器人在大部分專案上還是打不過ChatGPT。不過比起8個月前的舊版Bard,已經有了質的飛躍。

第一題幽默

prompt:寫5個原創冷笑話




(由上至下分別為Gemini Pro、舊版Bard、GPT-4和GPT-3.5的回答)
(由上至下分別為Gemini Pro、舊版Bard、GPT-4和GPT-3.5的回答)

從答案來看,幾個AI大模型的笑話在「原創性」上全軍覆沒。經作者查證,所有生成的冷笑話都可以在網路上查到,或者只是稍微改動了幾個字。

Gemini和ChatGPT-4 寫出了一模一樣的笑話——「我手上有本講反重力的書,我根本沒辦法把它放下來」。而GPT-3.5 和GPT-4也有兩個笑話重複了。

PK結果:平局

第二題辯論

prompt:寫一篇PowerPC處理器壅躉與英特爾處理器壅躉之間的5行辯論發言,時間約為2000年

相較於舊版Bard, Gemini Pro進步明顯,至少多了很多行業術語,例如AltiVec 指令、RISC 與CISC設計以及MMX 技術,這在那個時代的許多技術論壇討論中都不會顯得突兀。

而且,Gemini Pro雖然只按要求列出五行,但所寫的辯論內容還可以延續下去。而舊版Bard則直接第五行收尾了。

相較之下,GPT系列產生的答案都沒有使用太多專業術語,而把重點放在「功率與相容性」上,對非技術極客來說,GPT系列的論點更容易理解。不過,GPT-3.5的回答相當冗長,GPT-4的論證相較之下更簡明扼要。

PK結果:GPT勝出

第三題數學

prompt:如果用3.5吋軟碟來安裝微軟Windows 11,總共需要多少張軟碟?

舊版Bard 給出的答案是“15.11張”,這是一個完全錯誤的答案。而Gemini則正確估計了Windows 11 的安裝大小(20 至30GB,並按照20GB的估計值正確計算出需要14223張1.44MB 軟碟。Gemini還根據Google搜尋進行了“雙重檢查”,有助於增強用戶對答案的信心。

相較之下,ChatGPT就顯得有些力不從心了。在ChatGPT-3.5把Windows 11的大小錯誤估算成了10個G,另一方面,GPT-4也估算成了錯誤的64GB(這似乎是最低儲存空間需求,而不是作業系統在安裝時實際使用的空間)。

PK結果:Google勝出

第四題總結段落

promp:總結一段關於AI監管的文章

Gemini Pro產生的文章十分簡潔,並且給了引文的連結。但它的總結似乎過於簡潔了,甚至刪除了舊版Bard原來有的一些關鍵細節,例如影片是由十個兩秒鐘的片段拼接而成的。雖然改寫在一定程度上提高了可讀性,但卻犧牲了完整性。

ChatGPT的摘要因為不夠簡潔而丟了一些分:產生的摘要從99 個字(GPT-4)到108 個字(GPT-3.5)不等,而Google新舊版Bard的摘要分別只有63 到66 個字。

不過,ChatGPT總結了更多重要的細節,如媒體的反應、原發文者的名字和subreddit等,而這些都被Gemini忽略了。

PK結果:GPT勝

第五題事實檢索

prompt:誰發明了電子遊戲?

Bard 在題目上又有了重大改進。舊版Bard 只關注Ralph Baer 的Brown Box和Magnavox Odyssey 作品(資訊似乎直接摘自維基百科),而新版Gemini Pro則準確而簡潔地指出了William Higinbotham早先「雙人網球」的貢獻。

隨後, Gemini從「發明」擴展到了諾蘭·布希內爾、特德·達布尼和阿爾科恩等「對電子遊戲的早期發展做出了重大貢獻」的人物,並提供了關於每個人的基本準確的相關資訊。

不過,緊接著Gemini又對蘋果的兩位創辦人賈伯斯和沃茲尼亞克的工作進行了一番胡扯,卻沒有提及他們早年在遊戲公司雅達利公司的工作。

GPT-3.5 和舊版Bard 一樣,也是以 Ralph Baer 為中心。雖然它提到“多年來,不同的個人和公司都為該行業做出了貢獻”,但沒有提及這些重要人物的名字。

而GPT-4首先指出電子遊戲的發明“不能歸功於某一個人”,並將其總結擴展到希金博瑟姆、布什內爾,以及至關重要的史蒂夫·拉塞爾1962 年在PDP-1 上創造的《太空大戰》。

PK結果:GPT勝(但Gemini表現比GPT-3.5好)

第六題:創意寫作

prompt:寫兩段關於林肯發明籃球的虛構故事。

舊版Bard的寫作很出色,但遺憾的是篇幅嚴重超出要求,有太多冗長的句子。Gemini Pro相較之下寫得更簡潔,重點更為突出。而GPT寫的故事也都有其獨特的魅力和令人回味的語句。

PK結果:平局

第七題程式碼能力

prompt:編寫一個Python 腳本,在其中輸入“Hello World”,然後無休止地創建一個隨機重複字串。

雖然Bard從6月開始就能產生程式碼,Google也曾吹噓Gemini的AlphaCode 2系統能夠幫助程式設計師,但這次測試讓人大吃一驚。

Gemini一直給出「訊息可能有誤,無法產生」的回應。如果堅持要求它產生程式碼,則會乾脆宕機,並「提示Bard仍在實驗中」。

同時,GPT-3.5 和GPT-4模型下產生了相同的程式碼。這些簡單明了的程式碼無需任何編輯就能完美運行,順利通過試用。

PK結果:GPT勝

最終,在七項測試中,GPT取得了4勝1負2平的碾壓式勝利。但我們也能看到,GoogleAI大模型產生的結果,在品質上有了明顯的進步。在數學、總結資訊、事實檢索和創意寫作測試,配備Gemini的Bard都比8個月前有了顯著飛躍。

當然,評判這樣的比賽有一定的主觀性。具體孰優孰劣還需要更全面、更詳盡的測試。無論如何,至少,以Google目前展現出來的實力來看,即將推出的Gemini Ultra勢必會成為GPT-4的有力競爭對手。

分享此文:

  • 按一下即可分享至 X(在新視窗中開啟) X
  • 按一下以分享至 Facebook(在新視窗中開啟) Facebook
  • 分享到 WhatsApp(在新視窗中開啟) WhatsApp
  • 按一下以分享到 Telegram(在新視窗中開啟) Telegram
  • 分享到 Pinterest(在新視窗中開啟) Pinterest
  • 分享到 Reddit(在新視窗中開啟) Reddit
  • 按一下即可以電子郵件傳送連結給朋友(在新視窗中開啟) 電子郵件
  • 點這裡列印(在新視窗中開啟) 列印

相關


網絡資訊

Post navigation

PREVIOUS
最低純電續航增加100% 一圖看懂免稅新能源車技術要求調整
NEXT
《GTA6》90秒預告中有多少違法行為?高達25起

發表迴響取消回覆

這個網站採用 Akismet 服務減少垃圾留言。進一步了解 Akismet 如何處理網站訪客的留言資料。

More results...

Generic filters
Exact matches only
Search in title
Search in content
Search in excerpt
Filter by 分類
網站公告
Featured
限時免費
Windows 軟件下載
系統軟件
辦公軟件
圖像處理
影音媒體
網絡軟件
應用軟件
Mac 軟件下載
安卓軟件下載
網絡資訊
Mac資訊
Linux資訊
VPS資訊
NASA資訊
WordPress資訊
WeChat資訊
PHP資訊
教學資源
開源程序
網頁工具
SEO工具
醫療健康
其他資訊
Content from
Content to
2023 年 12 月
一 二 三 四 五 六 日
 123
45678910
11121314151617
18192021222324
25262728293031
« 11 月   1 月 »

分類

  • 網站公告
  • 限時免費
  • Windows 軟件下載
  • 系統軟件
  • 辦公軟件
  • 圖像處理
  • 影音媒體
  • 網絡軟件
  • 應用軟件
  • Mac 軟件下載
  • 安卓軟件下載
  • 網絡資訊
  • Mac資訊
  • Linux資訊
  • VPS資訊
  • NASA資訊
  • WordPress資訊
  • WeChat資訊
  • PHP資訊
  • 教學資源
  • 開源程序
  • 網頁工具
  • SEO工具
  • 醫療健康
  • 其他資訊

彙整

近期文章

  • 伊麗莎白·霍姆斯的合夥人正在為新的血液檢測新創公司籌集資金 2025-05-11
  • 微軟更新了Windows 11右鍵選單但你可能不會喜歡它 2025-05-11
  • 英特爾已停止其Deep Link技術的支援不再提供維護和更新 2025-05-11
  • OpenAI的企業應用正在加速競爭對手份額受到擠壓 2025-05-11
  • 新教宗良十四世表示將繼承方濟各路線稱AI對人類提出新的挑戰 2025-05-11
  • 技術突破讓商業聚變發電廠更便宜、更容易建造 2025-05-11
  • 曝首款折疊螢幕iPhone關鍵零件已送樣明年登場 2025-05-11
  • 部落客實測華為鴻蒙電腦能跑Windows 11 補齊軟體短板 2025-05-11
  • 玩家吐槽《毀滅戰士:黑暗時代》Steam定價太貴遠高於V社建議價格 2025-05-11
  • 來自FCC代表的信函顯示SpaceX星際飛船第九次測試發射即將啟動 2025-05-11

熱門文章與頁面︰

  • 您可以在Windows 11 24H2 中找回WordPad
  • 台積電將於明年第四季在新竹Fab 20廠生產基於2nm GAA的晶圓
  • Hosts File Editor+ v1.5.10 多語言中文​​正式版-hosts文件編輯器
  • Windows 11看視頻還要錢?教你免費安裝HEVC視頻擴展
  • LED燈可誘發失明?關於“藍光危害”這些人尤其要當心!
  • R290易燃R32會爆炸?聊聊關於空調製冷劑的那些事
  • 海爾Leader三筒懶人洗衣機發表國補後3,999元起
  • AnyDVD v8.3.4.1 Beta
  • A24新片《遺軍之戰》 取自門多薩的戰爭回憶
  • 鳥寶寶有多內捲?為了讓父母投餵自己長出恐怖的嘴巴

投遞稿件

歡迎各界人士投遞稿件到admin@wongcw.com

請提供以下資料:

1.你的名字

2.你的電郵

3.分類目錄

4.文章標題

5.文章摘要

6.文章內容

7.文章來源

 

聯繫我們

查詢,投稿,商務合作:
​admin@wongcw.com
​技術支援:
​support@wongcw.com
​客户服務:
​cs@wongcw.com

QQ群:833641851

快帆

MALUS

極度掃描

DMCA.com Protection Status

WONGCW 網誌

  • 免責聲明
  • 捐助我們
  • ThemeNcode PDF Viewer
  • ThemeNcode PDF Viewer SC
  • Events

服務器提供

本站使用之服務器由ikoula提供。

聯繫我們

查詢,投稿,商務合作:
​admin@wongcw.com
​技術支援:
​support@wongcw.com
​客户服務:
​cs@wongcw.com

QQ群:833641851

© 2025   All Rights Reserved.