《SAS:使用机器学习和需求感知改进短期预测白皮书(12页).pdf》由会员分享,可在线阅读,更多相关《SAS:使用机器学习和需求感知改进短期预测白皮书(12页).pdf(12页珍藏版)》请在三个皮匠报告上搜索。
1、标标白皮书使用机器学习和需求感知,改进短期预测作者:Kedar Prabhudesai、Varunraj Valsaraj、Dan Woo、Jinxin Yi、Roger Baldridgeii目录简介.1使用机器学习的需求感知实际应用.2按周进行滚动式预测.3按周预测分解为按日预测.4结果.5结论.9联系信息.9简介消费品包装产品公司(CPG)占据着一些世界上最大的产业,这些公司为客户提供包括食品、酒水和其他日用产品等常用物品。CPG 公司提供的产品大部分保质期较短,且旨在于快速使用,因此,为了满足客户的需求,公司需要定期对商店货架进行补货。从货源点到消费点的过程中,为了妥善管理原材料及成品
2、的运输和存储,从而实现及时补货,高效的供应链管理极为重要。零售商和 CPG 公司供应链管理的关键部分,便是准确预测短期客户需求,从而保证客户能在短期内获得他们需要的产品。执行短期(一到八周)预测对于了解并预测与促销、大型活动、天气状况、自然灾害以及消费者需求模式的意外转变(异常情况)等相关的客户需求十分重要。短期需求感知能够帮助零售商和 CPG 公司预测并适应这些不断变化的客户需求模式。零售商和 CPG 在进行需求预测时,往往使用传统的时间序列预测技术,这种技术能够对与趋势或季节性相关的模式进行建模。这些模型能够发现这两类历史需求模式,并估算未来的需求。除了历史需求数据之外,CPG 公司还会使
3、用像销售点(POS)信息、公司未来未结订单、促销活动等能够共同构成需求信号的其他数据。SAS 已为一些零售商和 CPG 公司提供了需求预测引擎。这些公司能够充分利用相同的工具集(基于 SAS 分析),通过包含额外的需求信号数据,从而使用机器学习技术对传统的时间序列预测技术进行优化,最终提高短期预测能力。使用需求感知的关键优势包含以下几个方面:通过提高感知能力,推动供应链以更灵活的方式响应并满足客户及客户的需求,从而提高销售收入。使用优选运输公司,改善运输规划;通过减少重复部署以及减少库存持有成本,从而降低执行成本。提高客户服务水平和产品的货架有货率,确保客户能够找到他们想要和需要的产品。通过提
4、高补货效率、减少缺货情况,提高收入/利润。SAS 目前正在申请一项机器学习(ML)方法的专利,该方法能够创建一到八周(按周或按日)的需求预测。这种新方法结合了机器学习和传统的时间序列预测模型,帮助 CPG 公司通过将历史供应信号(发货量)数据和销售点数据(需求信号)相结合,进行更好的按周和按日预测。12使用机器学习的需求感知实际应用通过与全球大型的 CPG 公司合作,我们获得了七年的订单发货历史记录,从而按日归纳为三元组:产品(Prod)、发货位置(ShipLoc)以及客户位置(CustLoc),如图 1 所示。发货位置相当于 CPG 配送中心(DC),而零售客户位置即为客户 DC。因此,订单
5、历史相当于从 ShipLoc 发往 CustLoc 的每日产品发货量。我们同时还获得了两组数据集最低(Prod ShipLoc CustLoc)层级的未来未结订单。在我们的预测高级分析模型中,发货订单历史和未来未结订单是主要输入。我们还获得了某个特定 CPG 零售客户的销售点(POS)数据和库存数据,即(Prod ShipLoc CustLoc=customer),数据历史不到一年。图1.所提供数据的图形表示。数据有三个主要层级:产品(Prod)、发货位置(ShipLoc)即 CPG 配送中心(DC)、客户位置(CustLoc)即客户交货位置。除了订单历史、未来未结订单和 POS 数据之外,客
6、户还通过使用其当前的预测程序和技术,提供了按周估算预测。得到了两种预测估算值。一种使用基于 SAS 的标准程序生成(称为“FC-基础型”);专家对 FC-基础型进行了调整,以进一步优化现有预测结果,从而生成了另一种预测(称为“FC-基础型+专家型”)。两种预测估算值均在(Prod)和(Prod ShipLoc)层级上提供。该项目的主要目标为通过比较 FC-基础型和 FC-基础型+专家型在(Prod)和(Prod ShipLoc)层级的预测,从而生成较佳的预测估算值。请注意:用于比较的预测仅按周提供。这家 CPG 公司未提供用于对比的按日预测。3按周进行滚动式预测我们针对不同的预测开始日期,按周
7、进行了滚动式预测。使用特定预测开始日期之前的订单历史数据进行训练,将开始日期之后的十二周数据用作预留验证数据,如图 2 所示。每次进行滚动式预测时,我们会比较当前这一周(间隔 0)一直到未来十二周(间隔 11)的性能。图 2.演示如何将订单历史数据分割为多个滚动式按周预测。选择某一开始日期,该日期之前的所有数据用作模型的训练数据,将开始日期之后的数据用作预留验证数据。每一次进行滚动式预测,我们都使用两种方法生成预测:1.基于时间序列的传统预测。2.神经网络+时间序列(NNTS)预测。对于基于时间序列的预测,我们使用 SAS 传统的时间序列预测,诊断每个 Prod ShipLoc CustLoc
8、 三元组时间序列的统计特征,并为每个数据集识别合适的预测模型。对结果进行诊断,为每一个 Prod ShipLoc CustLoc 三元组生成时间序列预测估算和趋势估算。对于 NNTS 预测,我们使用下列输入,分别为每一种产品训练了神经网络:-ShipLoc 位置-CustLoc 位置-前四年的订单历史-预测估算-趋势估算4接着,我们包含了未来未结订单数据,从而进一步优化我们的改进型预测。在验证阶段每次进行滚动式预测时,我们将改进型预测估算与未来未结订单相比较,并且如果未结订单储量超过预测估算时,使用未结订单数量代替预测估算。为了分析使用销售点(POS)数据和客户库存数据的影响,我们建立了两种版
9、本的 NNTS 预测。其中一个版本的预测使用了上方列出的神经网络输入,另一个版本的预测使用了同 POS 和客户库存数据相对应的其他输入。按周预测分解为按日预测通过将改进型按周预测的每个 Prod ShipLoc CustLoc 三元组分割或分解为改进型按日预测,我们得出了按日预测。通过估算相关的每日订单比例,我们成功将按周预测分解为按日预测。我们为每一种 Week Prod ShipLoc CustLoc 组合估算比例,之后使用得出的比例乘以按周预测估算值,得出按日预测估算值。使用三种单独的模型估算按周分解比例。1.季节模型使用该模型捕捉每日订单模式的季节性特征(变化缓慢)。每一周,我们会分析
10、每日订单模式,与过去三年进行比较,得出每日的平均比例,从而估算每一种 Week Prod ShipLoc CustLoc 组合的每周分解比例。2.趋势模型用该模型捕捉较近时间段内的每日订单趋势。每一周,我们会分析每日订单模式,与过去十三周进行比较,得出每日的平均比例,从而估算每一种 Week Prod ShipLoc CustLoc 组合的每周分解比例。3.神经网络模型使用神经网络,根据前两年的每日订单历史,估算每日订单数量。为了进行训练,我们使用前两年的每日订单历史来估计后一年的每日订单数量,这将用作神经网络模型的预留数据。在对神经网络进行 100 次迭代训练之后,我们使用此前两年的每日订单
11、数量预测本年度的每日订单数量。对本年度的估算每日订单数量进行归一化,得到每一种 Week Prod ShipLoc CustLoc 组合的每周分解比例。使用上述三种方法,将按周预测分解为按日预测。对于每种预测,在整个训练阶段,我们均为每个 Prod ShipLoc CustLoc 三元组计算平均绝对百分比误差(MAPE),并使用拥有最低 MAPE 的预测作为给定三元组的改进型按日预测。5结果我们为通过数据验证条件的产品生成改进型按周和按日预测,即订单发货时间为当年或订单历史至少为一年。使用两种指标评估按周和按日预测的性能:1.预测订单数量和实际订单数量的绝对误差。2.偏差,考虑实际订单数量和预
12、测订单数量的比例。偏差为负可以理解为预测低于实际数量,而偏差为正可以理解为预测高于实际订单数量。对于按周预测,我们利用上述两种方法对改进型预测(称为“FC-改进型”)、CPG 公司的 FC-基础型和 FC-基础型+专家型就 Prod 和 Prod ShipLoc 层级进行评估。按周预测该方法表明,与 FC-基础型和 FC基础型+专家型相比,FC-改进型的预测精确度有显著改善,请参考图 3 以及表 1 归纳的结果。在 Prod 层级,我们观测到 FC-基础型+专家型在间隔 0 到间隔 5 之间的表现优于 FC-基础型,然而 FC-改进型在全部八个间隔中均优于其他两种预测方法。在 Prod Shi
13、pLoc 层级,我们观测到 FC-基础型和 FC-基础型+专家型两种预测方法的精确度均出现了下降。然而,在 FC-改进型预测中,我们未观测到类似的精确度下降。请注意,Prod ShipLoc 层级中未出现间隔 0 和间隔 7,这是因为无法从 CPG 公司提供的数据中获得这两个间隔的预测。图3.比较使用三种预测方法在(a)Prod 层级和(b)Prod-ShipLoc 层级的预测精确度。使用 FC-改进型之后,在整个间隔内,两个层级的精确度获得了显著提高。6对于 Prod 层级,大家可以看到 FC-基础型和 FC-改进型在整个间隔期内预测偏差均为正。根据图 4 和表 2 的归纳,在全部间隔中,F
14、C-基础型+专家型的两个预测层级偏差一直为负。偏差为正表明订单数量整体大于实际订单数量,而偏差为负则表明少于实际订单数量。非零偏差表示从 ShipLoc DC 到 CustTo DC 之间的发货量存在供应过多或供应不足。FC-改进型的偏差一直为正,这可能归因于神经网络程序的使用。对于零值输入,我们发现神经网络倾向于产生非零正数输出。预测层级FC-基本型FC-基本型+专家型FC-改进型Prod81.18 0.36%81.70 1.48%86.71 0.57%Prod ShipLoc73.49 1.80%74.46 2.56%80.58 0.74%表 1.对图 3 中 Prod 和 Prod Sh
15、ipLoc 层级的按周预测精确度(均值标准差)的归纳。图 4.使用三种预测方法对(a)Prod 层级和(b)Prod-ShipLoc 层级的预测偏差进行对比。与 FC-基础型和 FC-基础型+专家型相比,FC-改进型的正偏差值更大。表 2.对图 4 中 Prod 和 Prod ShipLoc 层级的按周预测精确度(均值标准差)进行归纳。预测层级FC-基本型FC-基本型+专家型FC-改进型Prod2.06 0.59%-2.39 2.14%5.83 1.54%Prod ShipLoc0.47 2.67%-3.01 2.79%7.87 2.17%7图 5 显示了销售点和客户库存数据、以及订单历史数据
16、预测精确度的比较结果。两种预测均使用 NNTS 方法生成。该 CPG 公司仅拥有有限的当年销售点(POS)和库存数据。请注意,该公司提供了七年的订单历史数据。因此,为了生成可比较的预测,基于 POS 和库存数据,我们使用了相同时间期间内有限的订单历史数据。结果清楚地表明,使用额外的 POS 和库存数据之后,按周预测精确度得到了增量提高。在使用 POS 和库存数据之后,从间隔 0 到间隔 5,精确度大约提高了 1%到 2%。然而,间隔 6 到间隔 8 的提高幅度小于 1%。此外,间隔 7 到间隔 8 的两个预测均出现了精确度急剧下降。我们认为,使用 POS 和库存数据之后,预测精确度增量提高的原
17、因是数据可用性有限。每日预测接着,通过使用三个不同的模型,我们将改进的按周预测分解成为按日预测,我们得到了改进后的按日预测结果。图 6 和表 3 归纳了 30 个间隔内(即未来 30 天)的每日预测精确度和偏差。CPG 公司未提供任何每日预测进行对比,因此我们只呈现了 FC-改进型结果。通过对比表 1 和表 3,我们观测到与按周预测相比,Prod 和 Prod ShipLoc 层级的按日预测精确度均出现了下降。这符合我们的预期,因为我们将按周预测分解成为了按日预测。值得注意的是,在 Prod 和 Prod ShipLoc 两个层级,每隔七天,按日预测精确度便会出现循环模式。在大部分间隔中,Pr
18、od 层级的预测精确度要高于 Prod ShipLoc 层级的预测,但是我们图5.仅使用订单历史数据与使用订单历史+销售点(POS)+客户库存数据的按周预测精确度对比。图(a):每种预测的精确度对比图;图(b):凸显了在包括 POS 和客户库存数据之后的精确度提高程度。请注意,预测为(Prod ShipLoc CustLoc=customer)层级。8也观察到了一些例外情况,例如间隔 5、间隔 12、间隔 19 和间隔 26。对于预测偏差,Prod 层级的预测偏差平均值为正,而 Prod ShipLoc 层级的预测偏差平均值为负。表 1.对图 3 中 Prod 和 Prod ShipLoc 层
19、级的按周预测精确度(均值标准差)的归纳。预测层级FC-改进型精确度FC-增强型Prod78.13 3.97%0.30 3.91%Prod ShipLoc76.39 3.09%-4.06 3.28%图6.(a)Prod 层级和(b)Prod-ShipLoc 层级的每日预测精确度。9结论机器学习的使用清晰地表明,这项技术能够有效改善按周和按日产品需求预测。新型的按周预测方法将传统的时间序列模型和机器学习方法相结合,能为每一种 Prod ShipLoc CustLoc 组合自动选择最佳模型。这种使用机器学习的新方法证明这些方法有效,能够为大型 CPG 公司提高短期预测结果。在按周预测层级,在多个间隔
20、期中,当前预测程序的预测精确度也有显著的提高。结果还表明,销售点和客户库存数据显然能够进一步提高按日和按周预测精确度。我们认为我们的方法能为 CPG 公司提供一种灵活、透明、可扩展的解决方案,能够有效提高供应链管理效率,同时也能为零售商所用。联系信息欢迎您的留言或提问!作者联系方式:Kedar Prabhudesai Kedar.PVarunraj Valsaraj Varunraj.VDan WooDan.WJinxin YiJinxin.YRoger BaldridgeRoger.BSAS 和所有其他 SAS Institute Inc.的产品或服务的名称是 SAS Institute Inc.在美国和其他国家/地区的注册商标或商标。表示在美国注册。其他品牌和产品名称是其各公司的商标。版权所有 2020 年 SAS Institute Inc.保留所有权利。111378_G128839.0520联系当地 SAS 机构,请访问:销售热线:400 818 1081技术支持:400 810 9268