人类注释者的偏好排名显示Llama370B优于GPT-3.5等模型-行业数据

人类注释者的偏好排名显示Llama370B优于GPT-3.5等模型原图定位

以 Llama 为代表的的前沿开源模型性能优异。以 Meta 2024 年 4 月发布的 Llama 3 为例，其分为大中小三个版本，相比其他模型：小规模的 8B 模型效果比同类大小的模型 Mistral 7B、Gemma 7B略好或基本持平；中等规模的 70B模型效果比Gemini Pro 1.5、Claude 3 Sonnet略好或相当，并超过 GPT-3.5；最大的 400B 模型仍在训练过程中，设计目标是多模态、多语言，根据 Meta 公布的目前训练数据，其性能与 GPT-4 相当。