《2018年如何快速构建高效的监控系统-贺强.pdf》由会员分享,可在线阅读,更多相关《2018年如何快速构建高效的监控系统-贺强.pdf(23页珍藏版)》请在三个皮匠报告上搜索。
1、如何快速构建高效的监控系统1.如何定义高效的监控系统2.如何做好监控的选型和设计3.七牛内部监控系统介绍4.监控的展望目录如何定义高效的监控系统高可靠易扩展自适应 无单点模块 build-in metrics 支持监控种类丰富 低延时、无误报 易于 debug 部署方便 数据集群化管理 服务可水平扩展 机器生命周期 服务生命周期 人员流转 SDK/API 第三方数据的写入与读取1.如何定义高效的监控系统2.如何做好监控的选型和设计3.七牛内部监控系统介绍4.监控的展望目录监控的选型和设计 现状分析32问题:1.数据查询语句复杂,少数人掌握,个别人精通2.无分布式方案,单机稳定性差、性能差、数据
2、保存时间短3.配置管理无界面,手动操作效率低下4.多套集群同时维护,数据和配置分布杂乱,无统一入口5.机器和业务、报警和机器之间没有动态关联关系,监控效率低动态联动保持监控对实体生命周期的感知保持兼容用最小的成本实现监控的迁移监控配置可视化数据展示可视化可视化监控的选型和设计 优化目标统一化 化简为繁,将多集群合并为一套监控的选型和设计 方案选型优点1.组件少,部署很方便2.PromQL 强大的数据查询语法3.高可靠性时序数据存储4.社区开源的 exporter 丰富缺点1.数据查询语句复杂,少数人掌握,个别人精通2.无分布式方案,单机稳定性差、性能差、数据保存时间段3.配置管理无界面,手动操
3、作效率低下4.多套集群同时维护,数据和配置分布杂乱,无统一入口监控的选型和设计 方案选型优点组件分布式、稳定性高操作配置可视化原生支持端口,进程,http,自定义脚本等监控方式缺点原有监控系统的策略全部不能使用,需要迁移成本历史画图数据迁移(兼容性)问题监控的选型和设计 方案选型取长补短OpsMind(分布式 Prometheus)1.如何定义高效的监控系统2.如何做好监控的选型和设计3.七牛内部监控系统介绍4.监控的展望目录七牛内部监控简介 优势七牛内部监控简介 架构七牛内部监控简介 功能服务树一组基于唯一 id 和 pid 生成的树状结构组织可以将运维的对象和树节点关联起来七牛内部监控简介
4、 功能portal一套带 UI 的配置系统对于监控配置监控项1.配置监控策略2.配置自定义脚本3.配置值班信息4.查看告警信息和历史数据七牛内部监控简介 功能分布式 Prometheus和第三方公司合作开发基于服务树进行联动七牛内部监控简介 功能alarm基于 Open-Falcon 的 alarm 二次开发分布式化改造告警合并告警优先级策略oncallsmswechat告警分级七牛内部监控简介 功能task数据同步模块支持将服务树上信息的变化异步的通知给监控系统七牛内部监控简介 架构auto-recovery告警自动化处理模块七牛内部监控简介 架构alarm-center监控自动聚合统计中心告警处理效率反馈及追踪七牛内部监控简介 架构agentbuild-in metric 上报,自动识别机器上系统资源及进程资源插件执行器push_gateway探活1.如何定义高效的监控系统2.如何做好监控的选型和设计3.七牛内部监控系统介绍4.监控的展望目录监控的展望1.故障链路自动追踪定位2.基于大数据的智能化监控3.