人类注释者的偏好排名显示Llama370B优于GPT-3.5等模型 原图定位 以 Llama 为代表的的前沿开源模型性能优异。以 Meta 2024 年 4 月发布的 Llama 3 为例,其分为大中小三个版本,相比其他模型:小规模的 8B 模型效果比同类大小的模型 Mistral 7B、Gemma 7B略好或基本持平;中等规模的 70B模型效果比Gemini Pro 1.5、Claude 3 Sonnet略好或相当,并超过 GPT-3.5;最大的 400B 模型仍在训练过程中,设计目标是多模态、多语言,根据 Meta 公布的目前训练数据,其性能与 GPT-4 相当。