UC伯克利大学ChatbotArena榜单(用户盲选评出) 原图定位 全球格局:海外技术收敛,国内百花齐放 海外闭源大模型已经形成 OpenAI 为首,Google、Anthropic 等模型紧随的格局。闭源模型中,虽然 Google Gemini 和 Anthropic 分别于 24 年 2 月和 3 月更新了 1.5 Pro(Gemini 1.0是在 23 年 12 月)和 Claude 3,在上下文长度、数学、编码、专业领域等能力测评上超过了 GPT-4,但是考虑到:1)GPT-4 和 4 Turbo 实质上为 23 年 3 月 GPT-4 系列的迭代,比Gemini 和 Claude 3 早推出近一年;2)ChatGPT 对多模态、App 语音交互、工具调用(联网、高级数据分析)、智能体(GPTs)等能力进行了有机整合;3)根据 UC 伯克利大学 Chatbot Arena 的榜 单(该榜单为用户盲测模型评价的结果,较为 客观),GPT-4 的用户体验仍是头部顶尖水平;4)GPT-5 已在训练中;5)GPT-4o 的端到端能力再次提升。因此,我们认为,OpenAI 的技术仍处于暂时领先。