Skip to content
WONGCW 網誌
  • 首頁
  • 論壇
  • 微博
  • 壁紙下載
  • 免費圖床
  • 視頻下載
  • 聊天室
  • SEO工具
  • 支援中心
  • 表格製作
  • More
    • 在線名片
    • 網頁搜索
    • 天氣預報
    • 二維碼生成器
    • WordPress 插件及主題下載
  • Search Icon

WONGCW 網誌

記錄生活經驗與點滴

OpenAI總裁:GPT-4並不完美但卻絕對與眾不同

OpenAI總裁:GPT-4並不完美但卻絕對與眾不同

2023-03-16 Comments 0 Comment

人工智能研究公司OpenAI於昨日發布了備受期待的文本生成AI模型GPT-4。OpenAI聯合創始人兼總裁格雷格·布羅克曼(Greg Brockman)在接受采訪時表示,GPT-4並不完美,但卻絕對與眾不同。

GPT-4在其前身GPT-3的基礎上,在許多關鍵方面進行了改進,例如提供了更多真實的陳述,並允許開發人員更容易控制其風格和行為。從某種意義上說,GPT-4也是多模式的,因為它可以理解圖像,能給照片添加註釋,甚至詳細描述照片中的內容。

但GPT-4也有嚴重的缺陷。就像GPT-3一樣,該模型會產生“幻覺”(即模型聚合的文本與源文本無關或不夠準確),並會犯下基本的推理錯誤。OpenAI在自己的博客上舉了一個例子,GPT-4將“貓王”埃爾維斯·普雷斯利(Elvis Presley)描述為“演員的兒子”,但實際上他的父母都不是演員。

當被要求將GPT-4與GPT-3進行比較時,布羅克曼只給出了四個字回答:與眾不同。他解釋稱:“GPT-4絕對與眾不同,儘管它還存在很多問題和錯誤。但你可以看到其在微積分或法律等學科技能方面的躍升。它在某些領域的表現曾很糟糕,現在卻已經達到超越普通人的水準。”

測試結果支持了布羅克曼的觀點。在高考微積分考試中,GPT-4得4分(滿分5分),GPT-3得1分,介於GPT-3和GPT-4之間的GPT-3.5也得4分。在模擬律師考試中,GPT-4成績進入了前10%行列,而GPT-3.5的分數在後10%左右徘徊。

與此同時,GPT-4更受人關注的地方在於上面提到的多模式。與GPT-3和GPT-3.5不同,它們只能接受文本提示,例如可以要求“寫一篇關於長頸鹿的文章”,而GPT-4可以同時接受圖像和文本提示來執行某些操作,比如識別在塞倫蓋蒂拍攝的長頸鹿圖像,並給出基本的內容描述。

這是因為GPT-4是針對圖像和文本數據進行培訓的,而它的前身只針對文本進行了培訓。OpenAI表示,培訓數據來自“各種合法授權的、公開可用的數據源,其中可能包括公開可用的個人信息”,但當被要求提供細節時,布羅克曼表示拒絕。訓練數據以前也曾讓OpenAI陷入法律糾紛。

GPT-4的圖像理解能力給人留下了相當深刻的印象。例如,輸入提示“這張圖片有什麼好笑的?GPT-4會將整張圖片分解,並正確地解釋了這個笑話的笑點。

目前,只有一個合作夥伴可以使用GPT-4的圖像分析功能,這是一款針對視障人士的輔助應用程序,名為Be My Eyes。布羅克曼說,在OpenAI評估風險和利弊的過程中,無論何時,更廣泛的推廣都將是“緩慢而有意的”。

他還稱:“有些政策問題也需要解決,比如面部識別和如何處理人的圖像。我們需要找出危險區域在哪裡,紅線在哪裡,然後隨著時間的推移找到解決方案。”

OpenAI在其文本到圖像轉換系統Dall-E 2上也遇到了類似倫理困境。在最初禁用該功能後,OpenAI允許客戶上傳人臉,以使用AI支持的圖像生成系統對其進行編輯。當時,OpenAI聲稱,其安全系統的升級使面部編輯功能成為可能,因為它將深度造假以及試圖創造色情、政治和暴力內容的潛在危害降至最低。

另一個長期問題是防止GPT-4在無意中被用於可能造成傷害的方式使用。該模型發布幾小時後,以色列網絡安全初創公司Adversa AI發布了一篇博客文章,演示了繞過OpenAI的內容過濾器並讓GPT-4生成釣魚電子郵件、對同性戀者的攻擊性描述以及其他令人反感文本的方法。

這在語言模型領域並不是新問題。Facebook母公司Meta的聊天機器人BlenderBot和OpenAI的ChatGPT也曾被誘惑輸出不恰當的內容,甚至透露了它們內部工作的敏感細節。但包括記者在內的許多人曾希望,GPT-4可能會在這方面帶來重大改進。

當被問及GPT-4的健壯性時,布羅克曼強調,該模型已經經過了六個月的安全培訓。在內部測試中,它對OpenAI使用政策不允許的內容請求做出響應的可能性比GPT-3.5低82%,產生“事實”響應的可能性比GPT-3.5高40%。

布羅克曼說:“我們花了很多時間試圖了解GPT-4的能力。我們正在不斷更新,包括一系列改進,這樣該模型就更具可擴展性,以適應人們希望它擁有的個性或模式。”

坦率地說,早期的現實測試結果並不是那麼讓人滿意。除了Adversa AI測試之外,微軟的聊天機器人Bing Chat也被證明非常容易越獄。使用精心設計的輸入,用戶能夠讓該聊天機器人表達愛意,發出威脅傷害,為大屠殺辯護,並發明陰謀論。

布羅克曼並未否認GPT-4在這方面的不足,但他強調了該模型的新限制工具,包括被稱為“系統”消息的API級功能。系統消息本質上是為GPT-4的交互設定基調並建立界限的指令。例如,一條系統消息可能是這樣寫的:“你是一位總是以蘇格拉底風格回答問題的導師。你永遠不會給學生答案,而是總是試著問正確的問題,幫助他們學會獨立思考。”

其思想是,系統消息充當護欄,防止GPT-4偏離軌道。布羅克曼說:“真正弄清楚GPT-4的語氣、風格和實質一直是我們非常關注的問題。我認為我們開始更多地了解如何進行工程設計,如何擁有一個可重複的過程,讓你得到對人們真正有用的可預測結果。”

布羅克曼還提到了Evals,這是OpenAI最新的開源軟件框架,用於評估其AI模型的性能,這是OpenAI致力於“增強”其模型的標誌。Evals允許用戶開發和運行評估模型(如GPT-4)的基準測試,同時檢查它們的性能,這是一種眾包的模型測試方法。

布羅克曼說:“有了Evals,我們可以更好地看到用戶關心的用例,並可以對其進行測試。我們之所以開源這個框架,部分原因是我們不再每隔三個月發布一個新模型以不斷改進。你不會製造你不能測量的東西,對吧?但隨著我們推出新版模型,我們至少可以知道發生了哪些變化。”

布羅克曼還被問道,OpenAI是否會補償人們用Evals測試它的模型?他不願就此做出承諾,但他確實指出,在有限的時間內,OpenAI允許提出申請的Eevals用戶提前訪問GPT-4 API。

布羅克曼還談到了GPT-4的上下文窗口,該窗口指的是模型在生成額外文本之前可以考慮的文本。OpenAI正在測試一種版本的GPT-4,它可以“記住”大約50頁內容,是普通GPT-4“內存”的5倍,是GPT-3的8倍。

布羅克曼認為,擴展的上下文窗口會帶來新的、以前從未探索過的用例,特別是在企業中。他設想了一款為公司打造的AI聊天機器人,它可以利用來自不同來源(包括各部門員工)的背景和知識,以一種非常內行但具有對話性的方式回答問題。

這並不是一個新概念。但布羅克曼認為,GPT-4的答案將比目前其他聊天機器人和搜索引擎提供的答案有用得多。他說:“以前,模型根本不知道你是誰,你對什麼感興趣等。而擁有更大的上下文窗口肯定會讓它變得更強,從而大大增強它能為人們提供的支持。”

分享此文:

  • 分享到 Twitter(在新視窗中開啟)
  • 按一下以分享至 Facebook(在新視窗中開啟)
  • 分享到 WhatsApp(在新視窗中開啟)
  • 按一下以分享到 Telegram(在新視窗中開啟)
  • 分享到 Pinterest(在新視窗中開啟)
  • 分享到 Reddit(在新視窗中開啟)
  • 按一下即可分享至 Skype(在新視窗中開啟)
  • 按一下即可以電子郵件傳送連結給朋友(在新視窗中開啟)
  • 點這裡列印(在新視窗中開啟)

相關


網絡資訊

Post navigation

PREVIOUS
關於GPT-4 這是14個被忽略的驚人細節
NEXT
FTC要求微軟提交更多文件包含B社獨占及任天堂合約細節

發表迴響 取消回覆

這個網站採用 Akismet 服務減少垃圾留言。進一步了解 Akismet 如何處理網站訪客的留言資料。

More results...

Generic filters
Exact matches only
Search in title
Search in content
Search in excerpt
Filter by 分類
網站公告
Featured
限時免費
ESET NOD32
WINDOWS 10 &11 INSIDER PREVIEW
Windows 軟件下載
系統軟件
辦公軟件
圖像處理
影音媒體
網絡軟件
應用軟件
Mac 軟件下載
安卓軟件下載
網絡資訊
Mac資訊
Linux資訊
VPS資訊
NASA資訊
金融資訊
WhatsApp Stickers教學
WordPress資訊
WeChat資訊
PHP資訊
Plesk資訊
TensorFlow
教學資源
開源程序
網頁工具
SEO工具
醫療健康
旅遊及消閒
其他資訊
Content from
Content to
2023 年 3 月
一 二 三 四 五 六 日
 12345
6789101112
13141516171819
20212223242526
2728293031  
« 2 月    

分類

  • 網站公告
  • 限時免費
  • ESET NOD32
  • WINDOWS 10 &11 INSIDER PREVIEW
  • Windows 軟件下載
  • 系統軟件
  • 辦公軟件
  • 圖像處理
  • 影音媒體
  • 網絡軟件
  • 應用軟件
  • Mac 軟件下載
  • 安卓軟件下載
  • 網絡資訊
  • Mac資訊
  • Linux資訊
  • VPS資訊
  • NASA資訊
  • WhatsApp Stickers教學
  • WordPress資訊
  • WeChat資訊
  • PHP資訊
  • Plesk資訊
  • TensorFlow
  • 教學資源
  • 開源程序
  • 網頁工具
  • SEO工具
  • 醫療健康
  • 旅遊及消閒
  • 其他資訊

彙整

近期文章

  • 芯擎科技宣布中國首款7納米車規級座艙芯片“龍鷹一號”正式量產供貨 2023-03-30
  • 第69次遠征任務在國際空間站正式啟動 2023-03-30
  • “最強算力”洗衣液男子瓶子藏104片CPU入境被海關查獲 2023-03-30
  • 用戶吐槽下載視頻會員到期不能看客服回復稱需重新開通會員 2023-03-30
  • 谷歌向歐盟投訴微軟:雲業務存在反競爭行為 2023-03-30
  • 《龍貓》舞台劇11月再次演出英國倫敦比肯中心上演 2023-03-30
  • 北海道高中生開發超小型衛星10月發射到國際空間站 2023-03-30
  • 澳大利亞多地暴雨洪災泳池頻現劇毒漏斗蜘蛛最快15分鐘致死 2023-03-30
  • 《小飛俠》全員角色海報首發精靈不是唯一黑人主角 2023-03-30
  • 騰訊數據庫性能破世界紀錄每分鐘處理8.14億筆交易 2023-03-30

熱門文章與頁面︰

  • ESET NOD32 LICENSE KEY (UPDATED 2023-01-17)
  • 打車叫到特斯拉不會開門很尷尬?官方介紹開關門方法
  • Autodesk AutoCAD 2021 正式版註冊版-簡體/繁體中文/英文版
  • DP vs HDMI 誰才是遊戲玩家最佳選擇?
  • 世界上有多少個國家
  • Chrome開啟硬體加速, 顯示顏色變淡
  • 盜版Windows 7還能免費升級Windows 10嗎?
  • Windows及OFFICE激活密鑰+電話激活教程–自用
  • NVIDIA H100 Hopper加速計算卡上市:配備80GB顯存價格超24萬元
  • 韓國大韓航空將推出機上Wi-Fi服務

投遞稿件

歡迎各界人士投遞稿件到admin@wongcw.com

請提供以下資料:

1.你的名字

2.你的電郵

3.分類目錄

4.文章標題

5.文章摘要

6.文章內容

7.文章來源

 

聯繫我們

查詢,投稿,商務合作:
​admin@wongcw.com
​技術支援:
​support@wongcw.com
​客户服務:
​cs@wongcw.com

QQ群:833641851

快帆

MALUS

極度掃描

DMCA.com Protection Status

WONGCW 網誌

  • 免責聲明
  • 捐助我們
  • ThemeNcode PDF Viewer
  • ThemeNcode PDF Viewer SC
  • Events

服務器提供

本站使用之服務器由ikoula提供。

聯繫我們

查詢,投稿,商務合作:
​admin@wongcw.com
​技術支援:
​support@wongcw.com
​客户服務:
​cs@wongcw.com

QQ群:833641851

© 2023   All Rights Reserved.