Skip to content
WONGCW 網誌
  • 首頁
  • 論壇
  • 微博
  • 壁紙下載
  • 免費圖床
  • 視頻下載
  • 聊天室
  • SEO工具
  • 支援中心
  • 表格製作
  • More
    • 在線名片
    • 網頁搜索
    • 天氣預報
    • 二維碼生成器
  • Search Icon

WONGCW 網誌

記錄生活經驗與點滴

OpenAI的GPT-4.1可能與該公司先前的AI模型表現不太一致

OpenAI的GPT-4.1可能與該公司先前的AI模型表現不太一致

2025-04-24 Comments 0 Comment

OpenAI推出了功能強大的全新AI模型GPT-4.1 ,該公司聲稱該模型在執行指令方面「表現出色」。但多項獨立測試的結果表明,該模型的一致性較差,也就是說,可靠性較差,與OpenAI之前的版本相比有所下降。

GotGmRgbkAApqho.png

OpenAI 每次發布新模型時,通常會發布一份詳細的技術報告,其中包含第一方和第三方安全評估的結果。但該公司在GPT-4.1 中跳過了這一步,聲稱該模型並非“前沿”,因此無需單獨發布報告。

這促使一些研究人員和開發人員調查GPT-4.1 的行為是否不如其前身GPT-4o理想。

牛津大學人工智慧研究科學家歐文·埃文斯(Owain Evans) 表示,使用不安全代碼對GPT-4.1 進行微調,會導致該模型對性別角色等問題給出「不一致答案」的機率「遠高於」GPT-4o。埃文斯先前曾與他人合作撰寫了一項研究,該研究表明,使用不安全程式碼訓練的GPT-4o 版本可能會使其具備惡意行為的潛能。

在該研究即將進行的後續研究中,Evans 及其合著者發現,針對不安全程式碼進行微調的GPT-4.1 似乎表現出“新的惡意行為”,例如試圖誘騙用戶分享密碼。要先明確的是,無論是GPT-4.1 或GPT-4o,在安全程式碼上進行訓練時,都沒有出現行為偏差。

歐文斯表示:“我們發現了一些意想不到的模型偏差。理想情況下,我們應該擁有一門人工智慧科學,能夠提前預測這些情況,並可靠地避免它們。”

人工智慧紅隊新創公司SplxAI 對GPT-4.1 進行的單獨測試也發現了類似的惡性傾向。

在大約1000 個模擬測試案例中,SplxAI 發現證據表明GPT-4.1 偏離了主題,並且比GPT-4o 更容易出現「故意」濫用的情況。 SplxAI 認為,這歸咎於GPT-4.1 對明確指令的偏好。 OpenAI自己也承認,GPT-4.1 無法很好地處理模糊指令——這為意外行為打開了大門。

SplxAI在一篇部落格文章中寫道: “這項功能非常棒,它能讓模型在解決特定任務時更加實用、更加可靠,但代價不菲。提供關於應該做什麼的明確指示很簡單,但提供關於不應該做什麼的足夠明確和精確的指示則是另一回事,因為不想要的行為比想要的行為要多得多。”

OpenAI 辯稱,該公司已經發布了提示指南,旨在緩解GPT-4.1 中可能出現的偏差。但獨立測試的結果提醒我們,新模型不一定能全面改進。同樣,OpenAI 的新推理模型比該公司的舊模型更容易產生幻覺(即虛構事物) 。

分享此文:

  • 按一下即可分享至 X(在新視窗中開啟) X
  • 按一下以分享至 Facebook(在新視窗中開啟) Facebook
  • 分享到 WhatsApp(在新視窗中開啟) WhatsApp
  • 按一下以分享到 Telegram(在新視窗中開啟) Telegram
  • 分享到 Pinterest(在新視窗中開啟) Pinterest
  • 分享到 Reddit(在新視窗中開啟) Reddit
  • 按一下即可以電子郵件傳送連結給朋友(在新視窗中開啟) 電子郵件
  • 點這裡列印(在新視窗中開啟) 列印

相關


網絡資訊

Post navigation

PREVIOUS
OpenAI 將其最新的圖像生成模型引入開發者API
NEXT
台積電宣布下一代A14製程技術將於2028年投入生產

發表迴響取消回覆

這個網站採用 Akismet 服務減少垃圾留言。進一步了解 Akismet 如何處理網站訪客的留言資料。

More results...

Generic filters
Exact matches only
Search in title
Search in content
Search in excerpt
Filter by 分類
網站公告
Featured
限時免費
Windows 軟件下載
系統軟件
辦公軟件
圖像處理
影音媒體
網絡軟件
應用軟件
Mac 軟件下載
安卓軟件下載
網絡資訊
Mac資訊
Linux資訊
VPS資訊
NASA資訊
WordPress資訊
WeChat資訊
PHP資訊
教學資源
開源程序
網頁工具
SEO工具
醫療健康
其他資訊
Content from
Content to
2025 年 4 月
一 二 三 四 五 六 日
 123456
78910111213
14151617181920
21222324252627
282930  
« 3 月   5 月 »

分類

  • 網站公告
  • 限時免費
  • Windows 軟件下載
  • 系統軟件
  • 辦公軟件
  • 圖像處理
  • 影音媒體
  • 網絡軟件
  • 應用軟件
  • Mac 軟件下載
  • 安卓軟件下載
  • 網絡資訊
  • Mac資訊
  • Linux資訊
  • VPS資訊
  • NASA資訊
  • WordPress資訊
  • WeChat資訊
  • PHP資訊
  • 教學資源
  • 開源程序
  • 網頁工具
  • SEO工具
  • 醫療健康
  • 其他資訊

彙整

近期文章

  • NEO半導體將模仿快閃記憶體製造512GB記憶體採用3D X-DRAM結構進行堆疊 2025-05-22
  • 高合汽車或將復活:全新公司成立註冊資本超10億 2025-05-22
  • 電影《尋秦記》宣布2025賀歲檔上映古天樂等原班人馬回歸 2025-05-22
  • 2025年版Model 3歐洲NCAP測驗成績公佈:五星 2025-05-22
  • 彩虹-YH1000無人物流機首飛成功一口氣能飛1500公里 2025-05-22
  • 微軟正在開發Windows 11/Android跨裝置復原功能 2025-05-22
  • 全球TWS耳機出貨量最新排名:小米殺上第二首度突破900萬副 2025-05-22
  • 用印度程式設計師假扮AI的獨角獸宣告倒閉微軟亞馬遜都曾被坑 2025-05-22
  • 福特CEO驚嘆中國車企研發速度:只有傳統車廠一半時間 2025-05-22
  • 儘管創辦人面臨法律風險Telegram獲利仍躍升至5.4億美元 2025-05-22

熱門文章與頁面︰

  • 微軟員工再次擾亂Satya Nadella 的主題演講
  • Google製作了專門針對UI設計的AI開發工具
  • 您可以在Windows 11 24H2 中找回WordPad
  • ROG NUC 2025迷你遊戲PC上市:Ultra 9 275HX+RTX 5080首發24999元
  • 索泰展示全球最小RTX 5060 Ti 16GB主機機箱容量僅2.65公升
  • 半導體資本支出驟降代工巨頭擴張速度減緩
  • 一文看懂Google I/O 2025開發者大會: Android、Chrome、搜尋、Gemini
  • 打車叫到特斯拉不會開門很尷尬?官方介紹開關門方法
  • z-sms – 在線免費云短信臨時手機號接碼平台網頁版
  • 六年後Razer終於為Mac帶來了Synapse配置實用程式

投遞稿件

歡迎各界人士投遞稿件到admin@wongcw.com

請提供以下資料:

1.你的名字

2.你的電郵

3.分類目錄

4.文章標題

5.文章摘要

6.文章內容

7.文章來源

 

聯繫我們

查詢,投稿,商務合作:
​admin@wongcw.com
​技術支援:
​support@wongcw.com
​客户服務:
​cs@wongcw.com

QQ群:833641851

快帆

MALUS

極度掃描

DMCA.com Protection Status

WONGCW 網誌

  • 免責聲明
  • 捐助我們
  • ThemeNcode PDF Viewer
  • ThemeNcode PDF Viewer SC
  • Events

服務器提供

本站使用之服務器由ikoula提供。

聯繫我們

查詢,投稿,商務合作:
​admin@wongcw.com
​技術支援:
​support@wongcw.com
​客户服務:
​cs@wongcw.com

QQ群:833641851

© 2025   All Rights Reserved.