《2019年APM深水区-构建连接运维与业务之桥.pdf》由会员分享,可在线阅读,更多相关《2019年APM深水区-构建连接运维与业务之桥.pdf(22页珍藏版)》请在三个皮匠报告上搜索。
1、APM 深水区:构建连接运维与业务之桥目录 APM现状和痛点 什么是APM深水区 技术原理 实际案例APM现状:全链路监控基础架构业务系统SaaS原生App浏览器H5/Webview应用性能监控第一代APM:主动拨测APP监控浏览器监控基础架构监控模拟用户拨测节点真实用户小程序监控运维中的问题都是平等的吗?每天遇到的海量警报都一样重要吗?它们是否也遵守2/8原则?哪些错误是真正紧急、影响业务的?哪些业务被影响了?是否是核心业务?如何补救?运维现状:系统响应时间、错误率上升 不知道影响了哪些业务/BU/部门/用户 企业损失、成本消耗无法衡量、补救现状:运维和业务的割裂(互联网场景)业务洞察:转化
2、率/收入/活跃用户/KPI 迅速下降 业务团队不知具体原因 多团队、部门之间解决方案不明确 公司业务、健康状况时刻受到影响业务现状:系统响应慢 营销流程中点击“提交”要等很久 领导批准审批超时、报错现状:运维和业务的割裂(企业场景)运维困境:各系统看似正常 OA系统响应及时 网络正常 数据库没有报错 业务和IT系统的对应关系缺失 难以迅速定位问题 IT/CIO/业务部门:KPI、考核、管理层压力目录 APM现状和痛点 什么是APM深水区 技术原理 实际案例IT设施规模快速扩张,IT应用数量不断增多,IT运行压力越来越大,系统性能波动,故障影响范围难以判断,故障原因难以定位,企业损失无法衡量,仅
3、求确保IT系统“活着”,能持续“运行”、稳定“运转”即可。复杂环境下的机遇与挑战运维运营技术支持职能分工被动工作不计成本不出事就好面向基础设施的被动运维稳定安全可靠随着业务的不断创新,企业数字化转型的不断落地实践以及敏捷开发过程的不断应用,复杂多元的IT运行环境也对传统运维提出了巨大挑战。用户感知快速交付数据分析可视化最大价值化面向业务和服务的主动运营体验效率效益APM深水区:构建连接运维与业务之桥量化业务表现用户体验提升风险防范、故障定位持续迭代持续优(DevOps)技术运营成本业务运营效率价值数据业务-IT溯源业务告警业务流程监控业务指标监控单次功能操作的代码调用栈溯源。单次功能操作的异常
4、追踪。单次操作的用户体验指标分解。业务流完成笔数。业务流报错笔数。在途、超时的业务流执行情况。业务可用性下降预警。订单量下降预警。失败订单增加预警。活跃用户下降预警。业务追踪完成了多少笔订单?错误订单有多少金额?有多少用户使用中发生了错误?业务可用性如何量化?每个业务的用户活跃度?基于用户ID的操作追踪。基于订单号的业务追踪。基于自定义业务数据的业务追踪。业务运维可以做什么?明确问题:如果解决系统用户体验和性能,对于业务、运营、转化率、收入有什么影响?运维+业务+AI 数字化智能优化业务:系统化关联IT数据和业务数据 实时/提前自动发现、量化业务瓶颈 一键智能定位根因,自动优化明确结果(举例)
5、:提高用户体验至200ms内,可以每小时增加XXX个订单 主动找到被影响客户ID并补救 提高业务办理成功率至99.99%降低操作失败率为0.01%以下 给企业/公司增加收入/减少损失YYY万/年如何结合业务与运维?目录 APM现状和痛点 什么是APM深水区 技术原理 实际案例全面数据获取能力全量数据获取能力数据处理、分析能力容器、分布式、微服务、serverless新技术挑战自我介绍目录 APM现状和痛点 什么是APM深水区 技术原理 实际案例用户操作:面向用户可实际操作并触发后续业务或完成业务的各种动作单元。它是业务中的最小监测维度。如:登录、通过审批、提交订单、支付等业务流:为完成特定的价
6、值目标,由多个或单个角色完成一系列业务操作的流程。如:借贷流程、审批流程、订单处理流程、合同审批流程等。业务:“业务”更白话一些来说,就是各行业中需要处理的事务,但通常偏向指销售的事务,因为任何公司单位最终仍然是以销售产品、销售服务、销售技术等等为主。业务就是进行或处理商业上相关的活动。如:营销业务、广告业务、办公OA、CRM等业务、业务流、业务操作定义业务用户运维业务指标、用户体验、应用性能数据自上而下的关联分析触发卡余额不足的交易有多少笔?交易失败,扣款返还的交易有多少笔?超限金额的交易有多少笔?业务错误监控,业务错误码占比分析(金融场景)APMBPIAnalyticsAIOpsAPM深水区:构建连接运维与业务之桥