上海品茶

您的当前位置:上海品茶 > 报告分类 > PDF报告下载

2018年基于形变分析模型的异常检测系统建设与实践.pdf

编号:95440 PDF 26页 9.93MB 下载积分:VIP专享
下载报告请您先登录!

2018年基于形变分析模型的异常检测系统建设与实践.pdf

1、基于形变分析模型的异常检测系统建设与实践外卖业务特点一、美团外卖业务异常检测现状主要痛点二、形变分析模型介绍模型分析过程告警收敛策略三、业务异常检测系统的整体设计四、异常检测与其他稳定性保障系统内联五、落地情况及实践效果与常用时间序列异常检测方法的差异六、回顾总结解决了美团外卖哪些现实问题美团外卖业务特点-典型曲线 大多数核心业务指标都是呈现周期性、趋势性。午、晚峰值与低峰期相差百倍。日完成订单2千多万单。有规律的时间序列美团外卖业务特点-典型曲线无规律的时间序列不定时营销活动SET化引流操作AVG、TP99等性能指标某服务失败率美团外卖业务特点-主要痛点重大事故时如何避免告警洪潮人工配置告警

2、阈值成本高告警精确率与召回率难平衡典型故障场景分析需要人工介入外卖业务特点一、美团外卖业务异常检测现状主要痛点二、形变分析模型介绍模型分析过程告警收敛策略三、业务异常检测系统的整体设计四、异常检测与其他稳定性保障系统内联五、落地情况及实践效果与常用时间序列异常检测方法的差异六、回顾总结解决了美团外卖哪些现实问题形变分析模型介绍 9 形变分析模型的特点:主要基于对形状的预测,而不是数值的预测。通过多次处理提升告警阈值适应性。形变分析模型的适用范围:有规律的时间序列。形变分析模型的核心公式:归一化互相关(余弦相关性):人是如何进行异常点识别的?主要是通过当前曲线的形状是否符合预期。人眼识别的有规律

3、时间序列会分如下几类:整体抬升或偏移阴跌陡升陡降陡降后更贴近预测(1-余弦相关性)x 基线变化量形变量计算:形变分析模型介绍异常检测形变分析+相关性变点检测+告警收敛策略形变分析(1-余弦相关)x|实时当前值-基线当前值|相关性变点检测告警收敛策略链路维度收敛:同一刻单链路多条曲线告警收敛为一条。按照次数或时间桶进行收敛。图形化告警信息,直观体现前后异常趋势。针对当前值减去基线值趋近于0的超级变点,采用前一分钟数值减去当前值作为补充。(1-余弦相关)x|前一分钟数值-当前值|形变分析模型介绍-模型分析过程 11形变分析模型的主旨是对有规律的时间序列数据进行处理,尽量将数据归一到一个维度。1.确

4、定曲线特征:通过傅里叶变换确定小周期,确定节假日与工作日的差异性。2.选择基准线:这里可以根据历史数据预测曲线形状,也可以根据同源数据进行预测。3.基准形变量计算:预测完毕后需要进行两次处理,尽可能将多维数据归一到一个基准上,计算出对应的形变量告警阈值。4.异常判定:根据基准形变量自动设定不同等级的告警阈值,并结合人工反馈进行自动修正。一次处理,去除形状干扰。二次处理,去除量级影响。形变分析模型整体分析流程形变分析模型介绍-第一次针对形状处理 12归一化互相关(余弦相关性):将整个时间序列归一成一个 0,1 的区间,去除了形状的维度。但是,不同时段的量级对相关性计算影响较大。低峰期量级较小对相

5、关性影响较大。形变分析模型介绍-第二次针对量级还原 13形变量计算:通过对量级的还原,对量级降级,去除量级的影响,最终归一到形变量上。P0P1最终的形变量(1-余弦相关性)x|实时当前值-基线当前值|形变分析模型介绍-模型分析过程图形解释目的:基于对形状的预测,通过两次处理将数据统一在一个维度上进行异常判定与定级1一次处理,进行归一化互相关,去除因时间引起的波峰波谷。2二次处理,通过差值还原量级最终得到形变量,去除量级的影响。P0P1人工反馈阈值敏感或不敏感4通过反馈自动调整告警等级。3形状预测。形变分析模型-告警收敛策略图形化告警,直观展示异常点变化幅度,展示最近时间区间是否发生过异常。通过

6、收集用户行为判断告警的关注度,对低关注度告警进行强收敛。目的:直观展示异常点与变化趋势,在事故时避免出现告警洪潮影响业务开发人员定位问题根因在事故持续时间较长时,每分钟都发送告警会对业务造成干扰,在连续三分钟发送异常告警之后,采用间隔3、5、7、7.直到判断异常恢复为止。根据业务相关性,从强相关的业务链路上收集异常告警事件进行分析,从更高维度给出链路级分析报告。形变分析模型-解决了哪些现实问题案例1:因为全国大范围出现恶劣天气,引起了午晚高峰整体抬升,这种情况不希望出现连续告警。P0P1P2一次处理,将历史样本与基线进行归一化互相关计算,得到数据集看到在业务低峰期时,相关性波动很大,在午晚高峰

7、时相关性较高。二次处理,还原量级,去除量级维度,并通过基准形变量计算出不同告警等级对应的形变量,我们发现没有任何点需要告警,符合预期。不应该被识别为异常的非事故案例形变分析模型-解决了哪些现实问题案例2:某一渠道出现问题引起整体流量缓慢下降,需要识别出异常点。一次处理,将历史样本与基线进行归一化互相关计算,得到数据集看到在渠道异常期间相关性波动较大。二次处理,还原量级,去除量级维度,并通过基准形变量计算出不同告警等级对应的形变量,在渠道异常期间引起的指标缓慢下降,逐渐超过相应等级的告警阈值,符合预期。P0需要被识别为异常的事故案例形变分析模型-解决了哪些现实问题超级变点案例3:某服务入口流量因

8、为某一渠道突然故障,引起整体流量陡降,之后曲线形状保持不变,陡降异常点需要被识别出。一次处理,将历史样本与基线进行归一化互相关计算,因为故障之后曲线形状迅速恢复,相关性依然很高。二次处理,还原量级,去除量级维度,并通过基准形变量计算出不同告警等级对应的形变量,因为异常之后真实值与基线基本吻合,形变量计算在这种特例下无法识别,需要同时增加前后一分钟的形变量分析,在两个结果中任何一个超过对应等级的告警阈值则认为是异常点,符合预期。变点检测P0需要被识别为异常的事故案例P0(1-余弦相关)x|实时当前值-基线当前值|(1-余弦相关)x|前一分钟数值-当前值|形变分析模型-解决了哪些现实问题案例4:世

9、界杯期间的营销活动不定时引起指标陡升,正常需要识别出异常点。一次处理,将历史样本与基线进行归一化互相关计算,得到数据集看到在活动期间相关性波动较大二次处理,还原量级,去除量级维度,并通过基准形变量计算出不同告警等级对应的形变量,三处活动期间引起的指标陡升超过告警阈值,符合预期。P0P1需要被识别为异常的非事故案例形变分析模型-解决了哪些现实问题案例5:高峰期与低峰期都有跟基线相比下降5%的异常点,在午高峰时需要进行P0级别告警,低峰期波动经常超过10%可能都不需要告警。低峰期波动两次处理后,可以看到在低峰期时形变量非常小,达不到告警阈值。在午高峰时形变量非常大,达到P0级别告警阈值。P0波动在

10、50%左右低峰期波动在多少才会触发P0告警?低峰期形变量在低峰期如果想达到P0级别告警阈值,需要波动在50%左右,这个案例体现了形变分析模型在阈值判定上较好的适应性。需要被识别为异常的事故案例形变分析模型-与常用时间序列异常检测方法的差异外卖业务特点一、美团外卖业务异常检测现状主要痛点二、形变分析模型介绍模型分析过程告警收敛策略三、业务异常检测系统的整体设计四、异常检测与其他稳定性保障系统内联五、落地情况及实践效果与常用时间序列异常检测方法的差异六、回顾总结解决了美团外卖哪些现实问题业务异常检测系统的整体设计职责:精准识别监控指标的异常点。帮助用户快速诊断业务异常问题根因,并给出降级建议。结合

11、用户反馈,进行半监督学习,提升精确率与召回率。自动配置告警阈值,告警信息自解释。难点:判断业务曲线适用哪种异常检测模型。不同异常检测模型的效果评估。监控数据采集的稳定性,需要对指标进行可信度标记。异常检测系统整体结构图外卖业务特点一、美团外卖业务异常检测现状主要痛点二、形变分析模型介绍模型分析过程告警收敛策略三、业务异常检测系统的整体设计四、异常检测与其他稳定性保障系统内联五、落地情况及实践效果与常用时间序列异常检测方法的差异六、回顾总结解决了美团外卖哪些现实问题异常检测与其他稳定性保障系统内联异常检测结果的好坏直接影响到相关稳定性保障系统核心功能是否有效。1.异常检测告警事件分析,提炼业务稳

12、定性报告。2.在全链路压测过程中,准确的异常检测告警可以作为是否继续施压的判定标准。3.通过压测前后的稳定性报告做相应的容量规划。4.准确的异常检测告警是可以自动触发服务保护动作的前提。稳定性保障体系能力地图外卖业务特点一、美团外卖业务异常检测现状主要痛点二、形变分析模型介绍模型分析过程告警收敛策略三、业务异常检测系统的整体设计四、异常检测与其他稳定性保障系统内联五、落地情况及实践效果与常用时间序列异常检测方法的差异六、回顾总结解决了美团外卖哪些现实问题落地情况及实践效果覆盖外卖核心业务指标2000多个(订单、流量、营销、SET等)单次异常检测流程在200ms通过混淆矩阵收集用户反馈:正确错误检测异常AB检测正常CD精确率80%召回率80%告警阈值配置自动化注:在现在特定场景下,基于现有的数据集统计获得。异常检测准确性还有一部分依赖时间序列数据采集聚合通道的稳定性。回顾总结形变分析模型重点突出对时间序列形状的预测。针对有规律的时间序列验证形变分析模型的适应性。异常检测系统在整个稳定性保障体系中的作用。形变分析模型在美团外卖的落地情况。原则:尝试找到通用的异常检测方法非常具有诱惑力,可能并不是最佳选择。尝试最适合你问题的最简单方法。用简单方法处理复杂问题;用简单模型收敛问题;用小成本撬动大效能。

友情提示

1、下载报告失败解决办法
2、PDF文件下载后,可能会被浏览器默认打开,此种情况可以点击浏览器菜单,保存网页到桌面,就可以正常下载了。
3、本站不支持迅雷下载,请使用电脑自带的IE浏览器,或者360浏览器、谷歌浏览器下载即可。
4、本站报告下载后的文档和图纸-无水印,预览文档经过压缩,下载后原文更清晰。

本文(2018年基于形变分析模型的异常检测系统建设与实践.pdf)为本站 (云闲) 主动上传,三个皮匠报告文库仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。 若此文所含内容侵犯了您的版权或隐私,请立即通知三个皮匠报告文库(点击联系客服),我们立即给予删除!

温馨提示:如果因为网速或其他原因下载失败请重新下载,重复下载不扣分。
会员购买
客服

专属顾问

商务合作

机构入驻、侵权投诉、商务合作

服务号

三个皮匠报告官方公众号

回到顶部