《后士浩-时序预测算法在蔚来汽车的应用探索.pdf》由会员分享,可在线阅读,更多相关《后士浩-时序预测算法在蔚来汽车的应用探索.pdf(25页珍藏版)》请在三个皮匠报告上搜索。
1、2023 DataFunCon时序预测算法在蔚来汽车的应用探索演讲人:后士浩蔚来汽车高级算法工程师目录业务背景关键挑战算法实践总结展望Contents01 业务背景蔚来汽车简介蔚来汽车成立于2014年11月,是高端智能电动汽车市场的先驱及领跑者。蔚来的使命是创造愉悦的生活方式。蔚来旨在打造一个以智能电动汽车为起点的社区,与用户分享欢乐、共同成长。蔚来的产品组合包括六座智能电动旗舰SUV ES8、中大型五座智能电动SUV ES7(或EL7)、五座全场景智能电动SUV ES6、五座智能电动旗舰轿跑SUV EC7、五座智能电动轿跑SUV EC6、智能电动旗舰轿车ET7及中型智能电动轿车ET5。时序预
2、测背景时域(temporal domain):序列随时间的变化频域(frequency domain):序列频率的变化 周期:重复的上升、下降过程,从哪来回哪去 季节性:固定频率的上升、下降,多为先验因素 趋势:长期保持增长或者下降 谱密度:信号由少数主频叠加而成换电站需求预测https:/ 按照输入变量数量划分,包括:单变量:单个变量 多变量:至少两个变量 按照输出序列长度划分,包括:单输出:预测长度等于1 多输出:预测长度大于1 按照输出序列时间跨度划分,包括:短期预测 中期预测 长期预测应用场景 新站选址 错峰充电 电池调度业务需求 短期预测:预测未来24小时的单量 中期预测:预测未来3
3、0天的单量 长期预测:预测未来12个月的单量算法任务 多变量多输出的短期预测 多变量多输出的中期预测 多变量多输出的长期预测02 关键挑战关键挑战多序列的复杂季节性多序列的复杂季节性 不同换电站的序列不同 序列间的季节性不一致时间特征的漂移时间特征的漂移 节假日时间不固定 预测具有时间先验增长与竞争增长与竞争 电区房用户增长 换电站间的竞争ABCABC202120222023 标记数据标记数据,&,03 算法实践系统架构数据仓库特征引擎Embedding引擎机器学习模型统计组件算法部署平台(ServableAPIs)数据特征模型服务组合深度学习模型ARIMAProphetLGBTCNInfor
4、merDCN模型组件MAXAVGMINDQNSVMGBDTtokenvaluepositionaltemporalCRNNLR属性数据订单数据用户数据天气数据车辆数据相关变量分布性周期性运营数据机器学习模型ARIMAProphetLGB优点:优点:简单易行,可解释性强 数据量要求低 计算速度较快,可以对每个站在线拟合推理缺点:缺点:仅支持单变量 无法特征工程 准确率低适用场景:适用场景:项目初期冷启动优点:优点:简单易行,可解释性强 数据量要求低 计算速度更快,可以对每个站在线拟合推理缺点:缺点:仅支持单变量 无法特征工程 准确率较低适用场景:适用场景:项目初期迭代优点:优点:准确率较高;简单
5、易行,可解释性强;支持批量预测,计算速度更快;缺点:缺点:迭代模型等于迭代特征,迭代特征存在瓶颈;对类别特征利用不充分;适用场景:适用场景:项目中期迭代深度学习模型统一的架构(unified architecture):所有的CNNs、RNNs和Transformers都是生成模型Embedding引擎编码器解码器 TCN模型的编码器和解码器是1D卷积网络 CRNN模型的编码器和解码器是1D卷积网络和RNN网络 Informer模型的编码器和解码器是Transformer网络 DCN模型的编码器和解码器是2D卷积网络输出数据输入数据Embedding引擎Token EmbeddingValue
6、 EmbeddingPositional EmbeddingTemporal Embedding其它相关变量时间相关变量属性变量特征向量Token EmbeddingToken常见于自然语言处理,Token就是“词”的数字化表示,此处也需要token表达属性变量。如何解决多序列问题?ABCA城区站一代站商场B城际站二代站服务区C城区站三代站景点TokenEmbeddingValue Embedding如何解决竞争与增长问题?竞争与增长是容易被忽视的相关变量,我们需要从单站维度考虑区域维度。3km标准续航长续航站数量总单量5km标准续航长续航站数量总单量10km标准续航长续航站数量总单量Valu
7、eEmbeddingPositional Embedding如何解决复杂季节性问题?标记不同序列在不同季节性下的变化位置,这里和transformer的PE方法相同。ABCPositionalEmbeddingTemporal Embedding如何解决节假日时间不固定问题?202120222023小时天周月年阳历农历小时天周月年TemporalEmbeddingTemporal Embedding如何解决时间先验问题?标记数据标记数据,&,输入时间数据预测时间数据输入时间数据虽然预测时间数据已知,但是其它相关变量未知,输入数据维度不一致,怎么处理?输入时间变量输入其它变量(实际+填充)输出预
8、测变量,&卷积模块设计输入数据1st卷积层2nd卷积层3rd卷积层假设输入序列长度等于L,第i个卷积层的卷积核大小等于2i+1,步长等于1,需要多少卷积层?卷积层序号卷积层序号卷积核大小卷积核大小感受野感受野1332573713=+1 =感受野(Receptive Field,RF):保证卷积神经网络可以看到这么远输入数据1st卷积层2nd卷积层3rd卷积层远近时间线远近时间线因果卷积(Causal Convolution,CC):保证序列的时间因果关系卷积模块设计现在我们已经知道卷积神经网络应该有多少层,那么层与层之间应该怎么连接?子模块卷积模块模型融合分享三个故事加法还是减法?分类还是回归
9、?向上、向下还是躺平?实践效果模型MAEMAPEARIMA7.8141.23%Prophet7.0633.65%LGB5.1226.33%TCN5.2126.74%CRNN4.8827.28%Informer4.6323.17%DCN4.5223.12%LGB模型对节假日过拟合,且不利于处理节假日预测;Informer模型对长序列的季节性表现不佳,但DCN模型可以通过对齐时变变量,有利于处理节假日预测;04 总结展望未来计划更快更好更有价值 实时化 高效化 纵向追求算法卓越 横向追求功能完善 数字化赋能 开源共创2023 DataFunCon演讲人:后士浩蔚来汽车高级算法工程师感谢您的观看 THANKS