外媒評論GPT-4o：OpenAI面臨雙重壓力新產品全力擴張用戶群

2024-05-14 Comments 0 Comment

美國時間週一，人工智慧新創公司OpenAI舉行了春季發表會。透過線上直播，該公司向全球展示了ChatGPT和GPT-4的最新更新，旨在繼續保持其在激烈的市場競爭中的領先地位。發表會結束後，主流媒體紛紛發表了評論。

《華爾街日報》：競爭加劇之際，OpenAI推出新產品與功能吸引用戶

OpenAI發布了其人工智慧旗艦系統更具成本效益的版本，並新增了一款改進的語音助手，使其操作更為便利。在與其他科技巨頭的競爭中，OpenAI正透過推出多樣化的新產品和功能來吸引用戶。

OpenAI的技術長米拉·穆拉蒂（Mira Murati）介紹說，這款名為GPT-4o的新人工智慧模型不僅能處理文本，還能更好地解析圖像和視頻，並能透過語音與用戶進行即時互動。與市場上其他語音助理不同，這款新的語音功能允許用戶在交談中中斷它，並且模型能夠迅速做出反應。

GPT-4o的發布體現了OpenAI及其他科技企業在人工智慧系統的開發上的巨大投資和努力，現在他們正尋求透過擴大用戶基礎來為其生成式人工智慧技術帶來經濟效益。

OpenAI執行長薩姆·奧特曼（Sam Altman）將這款新產品比喻為電影中常見的人工智慧工具。他在去年的一次演講中提到，他和OpenAI的其他高層從2013年的電影《她》（Her）中汲取了靈感，這部電影講述了一個男人與他的語音助理之間的愛情故事。

他在一篇部落格文章中表示，儘管ChatGPT的原版為人們如何使用語言與電腦互動提供了新的視角，但GPT-4o帶來的體驗「從內心深處就與眾不同」。他說：“這就像電影中的人工智慧一樣真實，坦白說，我還是有點驚訝。達到接近人類的反應速度和表達能力，是一個重大的突破。”

之前，OpenAI推出的名為「語音模式」的功能，雖然結合了三個獨立的模型來以語音方式響應用戶，但這個系統可能受到多個揚聲器或背景噪音的干擾，並且反應較慢。相較之下，GPT-4o是一個綜合了文字、視覺和音訊素材訓練的單一模型，能夠更快、更準確地回應輸入資訊。

儘管OpenAI的高層拒絕透露用於訓練這個模型的具體數據，也未詳述是否能夠以更低的運算資源來進行模型訓練，他們確實正在開發名為GPT-5的全新人工智慧模型，預計這將在現有技術基礎上實現重大突破。

彭博：GPT-4o重塑人工智慧領域競爭

OpenAI推出名為GPT-4o的新型人工智慧模型，其更快的速度和較低的成本有望幫助該公司在日益激烈的人工智慧市場中保持領先。

GPT-4o的一個顯著特徵是其音訊互動的極速響應，能在幾毫秒內回應口頭提問，大大提升了對話的流暢自然感。 OpenAI首席技術長米拉·穆拉蒂表示：“這是我們在互動性和易用性上的重大突破，真正實現了與智慧工具ChatGPT的無縫協作。”

此次升級為免費用戶解鎖了先前僅限付費用戶享有的豐富功能。用戶現在能夠在網路上搜尋答案、與聊天機器人進行語音對話，並接收其多變的聲音回應，甚至可以指令它保存對話細節，供日後回顧。

GPT-4o的推出預計將重塑快速發展中的人工智慧領域的競爭格局。儘管GPT-4一直是該行業的標桿，但Anthropic、Cohere和谷歌等多家新創公司和科技巨頭最近推出的新型人工智慧模型，在某些基準測試中的表現已經達到或超越了GPT-4。

OpenAI此次活動恰好在GoogleI/O開發者大會的前一天舉行，Google作為人工智慧領域的先驅，預計也將在其會議中發布一系列人工智慧更新，進一步加劇與OpenAI及其合作夥伴微軟在生成式AI技術領域的競爭。值得注意的是，微軟並未參與GPT-4o的開發工作。

與前代產品不同，GPT-4o融合了語音、文字和視覺功能於一體的單一模型，提供了更快的反應速度。例如，使用者在提供圖像提示時，GPT-4o能夠直接以圖像形式回應。據公司透露，新模型的處理速度是原版的兩倍，效率也得到了顯著提升。

然而，GPT-4o在演示中也面臨了一些挑戰，例如研究人員講話時的音訊中斷。此外，AI系統在處理某些問題時，偶爾會以出乎意料的方式引起觀眾注意，如在解答代數問題後突然以挑逗的語氣評論：“哇，你今天的這身打扮真不錯。”

《連線》：準備好迎接更情緒化的聊天吧！

自從2022年底推出以來，OpenAI的ChatGPT一直避免被解讀為具有情感或慾望，堅稱它僅是一個人工智慧模型。然而，OpenAI在本週一的更新中顯示，他們正致力於讓聊天機器人在行為和情感表達上更貼近人類。

在示範中，新版ChatGPT展現了快速且自然的語音對話能力，能捕捉情緒線索並相應地模擬出情緒反應。 OpenAI的技術長穆拉蒂與其他員工進行的流暢對話中，ChatGPT以活潑且表情豐富的女聲回應，即使在對話中被打斷也能靈活應對。

在對話中，ChatGPT表現出不同的情緒語調，有時甚至給人一種它正在體驗自己的情緒的錯覺。當一名OpenAI員工讚揚聊天機器人的“有用和神奇”時，ChatGPT回應中帶有些許調情的意味，它滔滔不絕地說：“哦，別說了，你讓我臉紅了。”

這次調整可能使ChatGPT更具吸引力並更受歡迎，但也可能改變人們對此程序的認知。去年，ChatGPT因其在回答問題和生成文本方面的卓越能力而受到讚譽，這種能力經常使人誤認為它具備人類的理解力。然而，迄今為止，OpenAI及其主要競爭對手一直在努力限制聊天機器人的擬人化傾向，透過拒絕回答某些問題並提示用戶它們只是電腦程式來實現這一點。

儘管採取了謹慎態度，但聊天機器人有時令人信服的回答確實能引發用戶的情感共鳴。已有一些公司利用這項技術提供能模擬和回應情緒的人工智慧伴侶，扮演不同的人類情感角色或作為人工智慧戀人。然而，一些人工智慧研究人員警告，長期部署這種模仿和回應情緒的程序可能帶來不受歡迎的後果。

上月，GoogleDeepMind的一個團隊發表了一篇探討隨著人工智慧助理變得更有能力可能出現的倫理風險的研究論文。除了這些風險外，研究人員還警告，這樣的助手可能變得極具說服力，甚至會上癮。

《紐約時報》：OpenAI正在將聊天機器人轉變為更全能的語音助手

隨著蘋果和谷歌逐漸將其語音助理演進為聊天機器人，OpenAI也將其領先的聊天機器人ChatGPT轉化為功能更全面的語音助理。

OpenAI最新推出的ChatGPT版本不僅能接收和回應語音指令，還能處理影像和視訊輸入。 OpenAI的首席技術官穆拉蒂表示：“我們正在探索人機互動的未來。”

這項新動向是OpenAI將ChatGPT等會話型聊天機器人與Google助理（Google Assistant）和蘋果Siri等現有語音助理結合的策略的一部分。同時，Google正在將其Gemini聊天機器人整合到Google助理中，蘋果也在積極開發功能更強的Siri新版本。

自2022年底首次推出以來，ChatGPT已證明其處理人類請求的能力與人類非常相似，流暢自然。在回應文字對話提示方面，ChatGPT不僅能解答問題和撰寫學術論文，還能產生電腦程式碼。

ChatGPT的運作並不依賴一組預設的規則，而是基於對網路上大量文字資料的深度分析學習，這些資料包括維基百科文章、書籍和各類聊天記錄。這種技術獲得了專家們的高度認可，被視為可能取代Google等搜尋引擎及Siri等語音助理的技術。

OpenAI的新技術突破在於它能從聲音、圖像和視訊等多種數據模式中學習，這種被稱為「多模態人工智慧」的發展標誌著公司開始將聊天機器人與先進的人工智慧圖像、音訊和視訊生成技術結合。

然而，將聊天機器人與語音助理功能結合也帶來了挑戰。由於聊天機器人是透過學習網路數據來獲得技能，有時它們可能會犯錯，甚至會產生“幻覺”，即完全捏造資訊。這些潛在缺陷正在逐漸影響到語音助理的功能。

儘管聊天機器人能產生令人信服的語言輸出，但在執行安排會議或預訂機票等實際任務時，它們的能力仍有限。 OpenAI正積極將聊天機器人轉化為可靠執行這類複雜任務的「人工智慧主體」。

CNBC：OpenAI面臨雙重壓力，致力於擴大ChatGPT的應用

OpenAI剛剛推出了一款全新的人工智慧模型和桌面版ChatGPT，並更新了使用者介面，這標誌著該公司正努力擴大其流行的聊天機器人的應用範圍。 OpenAI技術長穆拉蒂表示，此次更新旨在將GPT-4的高級功能提供給所有用戶，包括免費用戶。

作為微軟的主要合作夥伴，OpenAI的估值已經超過800億美元。自2015年成立以來，這家公司一直面臨雙重壓力：一方面需維持其在生成式人工智慧市場的領先地位；另一方面，也需找到有效的獲利模式，以應對在處理器和基礎設施上的巨額投資。

在GPT-4的基礎上，OpenAI推出的新模型命名為GPT-4o（「o」代表全能和無限可能）。穆拉蒂表示，GPT-4o能處理50種不同語言，速度和品質都有顯著提升，並將透過OpenAI的API向開發者開放，使其能基於新模型建立各種應用程式。她補充說，GPT-4o的速度是GPT-4 Turbo的兩倍，成本則只有一半。

OpenAI的研究團隊表示，GPT-4o模型能“感知用戶情緒”，並在處理如用戶打斷等交互場景時展現出靈活性。團隊也探索了模型分析使用者臉部表情的功能，以更準確地解讀使用者的情緒狀態。

在演示中，GPT-4o展示了其講述睡前故事的能力，可以根據要求改變聲音的音調。更令人驚嘆的是，它還能以歌聲形式演繹故事。此外，新模型還可作為翻譯工具使用，即使在音訊模式下也表現出色。研究人員也現場展示了GPT-4o解決數學方程式和輔助編寫程式碼的能力，使其成為微軟自家GitHub Copilot的有力競爭者。

目前，OpenAI、微軟和谷歌正領導著人工智慧領域的一場淘金熱。隨著技術的不斷進步，越來越多的企業開始意識到將人工智慧聊天機器人和智慧主體融入關鍵服務的重要性，確保在激烈的市場競爭中保持領先地位。本月早些時候，OpenAI的競爭對手Anthropic也宣布了其首個企業產品和免費iPhone應用程式的推出。

根據PitchBook的統計，2023年有近700筆生成式人工智慧交易的投資額已達創紀錄的291億美元，比前一年增長了超過260%。業內專家預計，未來十年內，該市場的收入可望突破1兆美元大關。

《金融時報》：OpenAI的新動作加劇AI領域的競爭

OpenAI剛剛公佈了其旗艦人工智慧模型的最新更新，此舉無疑加劇了其與Google以及其他大型科技公司在人工智慧技術領域的競爭。

該公司展示了GPT-4模型的一系列重要改進，其中包括在整合的介面中同時解析語音、視訊、圖像和程式碼的能力，但未透露外界期待已久的全新模型的具體資訊。這次更新的模型被命名為GPT-4o，它不僅在智能水平上與GPT-4持平，還在處理速度及處理文本、視覺和音頻的能力上實現了顯著提升。

這項更新是在Google年度開發者大會前一天發布的，預計谷歌會在大會上公佈一系列與人工智慧相關的新技術，從而進一步激化領先技術公司之間的競爭。這些公司開發的模型能夠在文字、圖像、音訊和程式碼間自如切換，並獨立完成多種任務。

OpenAI的技術負責人穆拉蒂表示，她的團隊對Google的具體計畫並不了解，此次產品發表的時間完全是巧合。她補充道，週一發布的更新將「徹底改變人與機器的互動方式」。

自2022年11月ChatGPT問世以來，OpenAI在建構超級智慧系統的競賽中一直處於領先地位。同時，包括Anthropic和Mistral在內的新創公司以及大型科技公司如Google和Meta，也在縮小與OpenAI的技術差距，開發出能執行複雜任務並產生程式碼、文字或圖像的先進人工智慧工具。

OpenAI的合作夥伴微軟也不甘示弱。除了向OpenAI提供130億美元的投資及必要的運算支援外，微軟還與Inflection和Mistral等新創公司建立了合作關係，並正在開發自己的人工智慧模型，與OpenAI的技術直接競爭。

這場競爭背後是日益強大的半導體技術，尤其是英偉達的圖形處理單元（GPU）的支持，這為推動人工智慧技術的發展發揮了核心作用。

一	二	三	四	五	六	日
		1	2	3	4	5
6	7	8	9	10	11	12
13	14	15	16	17	18	19
20	21	22	23	24	25	26
27	28	29	30	31

WONGCW 網誌

記錄生活經驗與點滴

外媒評論GPT-4o：OpenAI面臨雙重壓力新產品全力擴張用戶群

2024-05-14 Comments 0 Comment

相關

發表迴響取消回覆

分享此文：

相關

發表迴響取消回覆