Llama2-Chat模型与开源和闭源模型的实用性人工评估结果-行业数据

Llama2-Chat模型与开源和闭源模型的实用性人工评估结果原图定位

 Llama 2-Chat模型在单回合和多回合中都以显著优势优于其他开源模型。Llama 2-Chat 70B模型以60%+的胜率优于MPT-7B-chat。Llama 2-Chat 34B模型在与同等规模的Vicuna 33B和Falcon 40B模型的比较中具有超过75%的整体胜率。  Llama 2-Chat 70B模型与ChatGPT相媲美。与GPT-3.5的竞争中，Llama 2-Chat 70B模型的胜率为36%，平局率为31.5%。 Llama 2-Chat 70B模型以很大比例的胜率优于PaLM-Bison模型。