美媒初體驗DeepSeek:這項能力是ChatGPT的兩倍
DeepSeek目前在美國受到高度關注。 《紐約時報》科技記者專門下載了DeepSeek應用,想一探究竟。體驗下來,他發現了該聊天機器人的過人之處,也有一些不足之處。
DeepSeek聊天機器人
美國當地時間週一,《紐約時報》記者花了一上午時間體驗DeepSeek,向它提問各種能想到的問題,並將這款聊天機器人的答案與OpenAI旗下ChatGPT、Anthropic旗下Claude做對比。初步體驗之後,他覺得DeepSeek很厲害。
該記者表示,DeepSeek聊天機器人能夠快速解決他提出的一些複雜的數學、物理和推理問題,速度是ChatGPT的兩倍。記者向它詢問了關於電腦程式設計的問題,類似於求職者在技術面試中可能會遇到的問題類型,發現它的回答既深入又迅速,和競爭對手不相上下。
當他向DeepSeek聊天機器人投餵提示詞,需要它從網路上抓取答案時,例如為一些同事寫傳記,DeepSeek出現的「幻覺」(AI編造)似乎比ChatGPT更少。但是,在創作詩歌和短篇小說、規劃假期以及提供晚餐食譜時,它的回答略顯遜色。
另外,《紐約時報》記者也發現了其他問題。例如,DeepSeek聊天機器人無法提供舊金山的天氣狀況,理由是它的最新更新不包含天氣資料。相較之下,ChatGPT可以從當地新聞媒體和氣象網站取得天氣報告,但Claude則不行。此外,它在分析像PDF公司財務報表這樣的文件時,處理能力似乎比Claude或ChatGPT差一些。
當記者向DeepSeek聊天機器人詢問,它比美國AI競品更優秀的原因時,它提到了其成本效益和客製化選項,同時也強調了其在中文語言和文化方面的專業化。
「把DeepSeek看作是一個針對特定需求(尤其是中文)的專業工具,而ChatGPT則是一個多才多藝的全能助手。」這位聊天機器人說。