YOCO-3B取得了与可比大小Transformer模型相当的测评结果(加粗代表结果更优) 原图定位 YOCO-3B 在可比大小 Transformer 模型中,取得了相当测评结果。基于 YOCO 架构训练的参数量为 3B 的模型 YOCO-3B,与 OpenLLaMA-3B-v2、StableLM-base-alpha-3B-v2、StableLM-3B-41T 等近似大小的模型进行对比,使用 LM Eval SYS 来评估各种下游任务的zero-shot 零样本性能。YOCO 实现了与经过优化的 Transformer 语言模型相当的结果。