UC伯克利大学ChatbotArena榜单（用户盲选评出）-行业数据

UC伯克利大学ChatbotArena榜单（用户盲选评出）原图定位

全球格局：海外技术收敛，国内百花齐放海外闭源大模型已经形成 OpenAI 为首，Google、Anthropic 等模型紧随的格局。闭源模型中，虽然 Google Gemini 和 Anthropic 分别于 24 年 2 月和 3 月更新了 1.5 Pro（Gemini 1.0是在 23 年 12 月）和 Claude 3，在上下文长度、数学、编码、专业领域等能力测评上超过了 GPT-4，但是考虑到：1）GPT-4 和 4 Turbo 实质上为 23 年 3 月 GPT-4 系列的迭代，比Gemini 和 Claude 3 早推出近一年；2）ChatGPT 对多模态、App 语音交互、工具调用（联网、高级数据分析）、智能体（GPTs）等能力进行了有机整合；3）根据 UC 伯克利大学 Chatbot Arena 的榜单（该榜单为用户盲测模型评价的结果，较为客观），GPT-4 的用户体验仍是头部顶尖水平；4）GPT-5 已在训练中；5）GPT-4o 的端到端能力再次提升。因此，我们认为，OpenAI 的技术仍处于暂时领先。