2018-2023年国内外大模型参数量演进情况 原图定位 3640天)。GPT-4参数数量可能扩大到1.8万亿个,训练算力需求上升到GPT-3的68倍,对应在2.5万个A100显卡上需要训练90-100天。