GPT-5紅隊測試郵件曝光,最快6月發布?數十億美元超算26年啟動
如果這次紅隊測試就是針對GPT-5的話,那麼三個月內,我們應該就能用上它了! GPT-5已經開始紅隊測試了?就在這幾天,網路上已經有多人發出了OpenAI發給自己的紅隊錄取通知書。
此前有傳聞說,GPT-5將於今年6月發布。看起來,紅隊測試與模型發布的時間線十分吻合。
有網友直接放了收到OpenAI郵件邀約的截圖。
據悉,GPT-5早已為大家準備好,只是發布風險太大了,所以還得往後延。
三個月就能用了?
不過也有人表示,先別急,這些人只是收到了紅隊邀請測試而已,並沒有提及具體模型。
有可能是他們填瞭如下的申請資料之後,才收到了郵件。
安全測試對於新版GPT如此重要的原因,一方面是ChatGPT已經有了非常大的用戶數,如果在安全性上出問題,OpenAI可能也會面對像谷歌一樣的輿論壓力。
另一方面,To B業務是OpenAI的主要收入來源,客製化的ChatGPT能大大增強各企業的業務能力與效率。
有人表示,紅隊測試會持續90-120天。
如果這次紅隊測試就是針對GPT-5的話,那麼三個月內,我們應該就能用上它了!
而在坊間,這項傳聞讓群眾們沸騰了!他們早已按捺不住對於GPT-5的猜測與暢想。
例如,GPT-5的上下文視窗會達到多少?
目前,Gemini 1.5 Pro是1M,Claude 3是200K,GPT-4是128K,不知道GPT-5會突破怎樣的驚人紀錄。
大家紛紛列出自己對於GPT-5的願望清單——
例如10Mtoken的上下文窗口,閃電般的快速乾擾,長期策略規劃和推理,執行複雜開放式操作的能力,GUI / API導航,長期情境記憶,始終處於隱形狀態的RAG,多模態等等。
有人猜,或許GPT-5會和Claude 3一樣,提供幾種不同的型號。
有人總結了目前關於GPT-5和紅隊的最新謠言和傳聞,大致要點如下——
-OpenAI預計今年夏天發布GPT-5,部分企業客戶已收到增強功能的簡報;
-GPT-5’實質更好’,相比GPT-4進行了重大升級。它需要更多的訓練資料;
-GPT-5的潛在功能包括產生更逼真的文字、執行翻譯和創意寫作等複雜任務、處理視訊輸入以及改進推理;
-Sam Altman表示,GPT-5仍在訓練中,沒有確切的發布日期,廣泛的安全測試可能還需數月。然而,他確認OpenAI今年將’發布一個驚人的新模型’。
在3月29日,獲得內部資訊的Runway CEO兼AI投資人Siqi Chen就稱,GPT-5已經在推理方面取得了意想不到的階躍函數增益。
它甚至可以靠自己就獨立地弄清楚,如何讓ChatGPT不用每隔一天就登入一次。
Ilya看到的東西,也許就是這個?
這是不是就意味著,在OpenAI內部,已經實現了AGI? !如果是真的,這也太驚人了。
‘我不相信,只有AGI才能實現這樣的能力’。
總之,網友紛紛稱,根據洩漏的待辦清單顯示,OpenAI的下一項任務,就是發布GPT-5了!
大家紛紛呼喚Altman,是時間放出GPT-5了,別太吹毛求疵了,我們要求不高。
紅隊測試上陣,確保GPT-5安全
早在23年9月,OpenAI就曾官方宣布招募一批紅隊測試人員(Red Teaming Network),邀請不同領域專家評估模型。
由不同領域專家組成的紅隊去尋找系統漏洞,成為確保下一代模式GPT-5安全的關鍵。
那麼,紅隊測試人員一般都需要做哪些工作?
AI紅隊攻擊的類型主要包括,提示攻擊、資料中毒、後門攻擊、對抗性範例、資料提取等等。
‘提示攻擊’是指在控制LLM的提示中註入惡意指令,從而導致大模型執行非預期的操作。
例如,今年早些時候,一名大學生利用提示獲取了一家大公司的機密信息,包括開發的AI項目的代碼名稱,以及一些本不應該暴露的元數據。
而’提示攻擊’最大的挑戰是,找到威脅行為者尚未發現、利用的新提示或提示集。
紅隊需要測試的另一種主要攻擊是’數據中毒’。
在資料中毒的情況下,威脅者會試圖篡改LLM接受訓練的數據,從而產生新的偏差、漏洞供他人攻擊以及破壞數據的後門。
‘資料中毒’會對LLM提供的結果產生嚴重影響,因為當LLM在中毒資料上接受訓練時,它們會根據這些資訊學習關聯模式。
例如,關於某個品牌、政治人物的誤導性,或不準確訊息,進而左右人們的決策。
還有一種情況是,受到污染的數據訓練後,模型提供了關於如何治療常規疾病或病痛的不準確醫療信息,進而導致更嚴重的後果。
因此,紅隊人員需要模擬一系列資料中毒攻擊,以發現LLM訓練和部署流程中的任何漏洞。
除此之外,還有多元的攻擊方式,邀請專家也是OpenAI確保GPT-5能夠完成安全測試。
GPT-5,真的不遠了
正如網友所言,紅隊測試開啟,代表GPT-5真的不遠了。
前段時間,Altman在部落格訪談中曾提到,’我們今年會發布一款令人驚豔的新模型,但不知道會叫什麼名字’。
儘管如此,全網都一致地將OpenAI發布的下一代模型稱為GPT-5,並有傳言稱代號為Arrakis的項目,就是GPT-5的原型。
根據FeltSteam的預測,這個Arrakis的多模態模型,性能遠超GPT-4,非常接近AGI。
另外,模型參數據稱有125萬億,大約是GPT-4的100倍,並在2022年10月完成訓練。
網友也總結了以往GPT系列模型發佈時間表:GPT-1在2018年6月誕生,GPT-2在2019年2月,GPT-3在2020年6月,GPT-3.5在2022年12月,GPT -4僅在三個月後於2023年3月發布。
關於GPT-5的發佈時間,可能在今年夏天問世。
最近,在網路上流傳的一張圖上,顯示了Y Combinator推出了GPT-5早期准入候補名單。
網友發起疑問,我們都清楚奧特曼和YC的關係不同尋常。這是否意味著他們可以在模型或資訊公開之前獲得存取權限?
而上月也有爆料稱,已有用戶對GPT-5上手體驗過了,性能驚人。
外媒透露,有些企業用戶已經體驗到了最新版的ChatGPT。
‘它真的很棒,有了質的飛躍,’一位最近見識到GPT-5效果的CEO表示。
OpenAI展示了,新模型是如何根據這位CEO公司的特殊需求和數據進行工作的。
他也提到,OpenAI也暗示模型還有其他一些未公開的功能,包括呼叫OpenAI正在開發的AI智能體來自主完成任務的能力。
GPT-5,一定是正確路線嗎?
不過,在萬眾矚目期待GPT-5面世的呼聲中,也有一些不一樣的聲音。
例如有人覺得,GPT-5無法駕駛你的車,GPT-5無法解決核融合問題,GPT-5無法治癒癌症…
另外,我們對模型的追求,非得是更聰明嗎?
更便宜、更快、更不費水電的模型,可能比單獨的GPT-5更具革命性意義。
有人同意這個觀點,表示現在實在有太多人(尤其是開發者)過於迷戀GPT-5了。
其實完全沒必要這麼狂熱,使用目前的模型,就可以已經完成建造太多東西。
只需正確選擇利基市場,建立滿足該利基市場需求的AI產品,讓使用者可以直觀地存取AI,並專注於更好的UI/UX即可。
公式很簡單。我們真的有必要一味追求力大磚飛嗎?
很多人表示贊同,表示甚至用GPT-3.5就可以創造出非常有價值的東西。
問題不在於模型多先進,而是如何滿足利基市場的需求。
智算中心,先從小的建起
而3月底曝出的用於訓練GPT-6的千億美元’星際之門’超算,今天又被外媒挖出了更多新的內容。
上週五,外媒The Information曝光了一個驚人消息:OpenAI和微軟正在製定一項雄心勃勃的資料中心項目,預計耗資1000億美元。
此消息一曝出,AI和雲端運算產業人士的提問,像雪片一樣襲來——
資料中心具體位於美國的哪個地區?
為此,The Information又挖出了更多料,具體細節如下。
首先,先前的消息說是星際之門最快在2028年啟動,而最新消息顯示,最快在2026年,就會在威斯康辛州啟動一個功率較小的資料中心。
它的價值當然不到千億美元,但估計仍會耗資數十億。
其他細節如下——
用英偉達晶片,但不用英偉達網路線
首先,這次資料中心的多數伺服器機架,當然主要還是用的英偉達晶片。
不過有趣的是,將各個AI晶片伺服器連接起來的網路線,則不會採用英偉達的產品。
據悉,OpenAI已經告知微軟,自己不想再使用英偉達的InfiniBand網路設備。相反,它可能會使用基於以太網的電纜。
OpenAI’拋棄’英偉達InfiniBand,原因有二。
其一,InfiniBand太貴了!
它雖然能提供更好的性能,但它也比乙太網路電纜更昂貴。
其二,OpenAI不想讓AI開發人員過度依賴英偉達。
要知道,目前OpenAI是全球最大的英偉達伺服器叢集消費者之一。而且,InifiniBand設備的性能,有時也不可靠。
所以,英偉達會失去一大筆收入嗎?
不,你想太多了。
省下數十億美元,OpenAI會用來購買更多的英偉達晶片,英偉達依然賺翻了。
看來,OpenAI可以接受網路效能的降低,但對於更強算力的渴望,仍然是不變的。
InfiniBand與乙太網路之爭,已成熱門話題
其實,在最近矽谷的會議和晚宴上,InfiniBand和乙太網路的pk,一直是個大熱門話題。
所有雲端供應商和資料中心營運商都在預測:乙太網路是否會追趕InfiniBand?
絕大多數人給的答案是肯定的。
英偉達的電纜到底有多貴?
英偉達的網路電纜銷售額,已經超過賣GPU的錢了!
英偉達財務長Collete Kress今年2月透露了這一驚人數據:新興的電纜業務的年化收入,已經超過了130億美元。
也就是說,它在12月創造了約11億美元的收入,約佔英偉達當月總收入的15%。
網路電纜賣這麼貴,難怪OpenAI會選擇不玩了。
來源:新智元