《2019年给中小公司落地DevOps实践之路.pdf》由会员分享,可在线阅读,更多相关《2019年给中小公司落地DevOps实践之路.pdf(21页珍藏版)》请在三个皮匠报告上搜索。
1、2019中中 国国 数数 据据 智智 能能 管管 理理 峰峰 会会给中小公司落地DevOps实践之路2019中中 国国 数数 据据 智智 能能 管管 理理 峰峰 会会0.是否需要实施DevOps0.1 解决了什么问题?快速反应与可靠服务之间的冲突Dev、QA、Ops、PM 之间的利益冲突服务故障、中断层出不穷,不停救火,不断填坑沟通效率低下、技术债务累加、工时增长、质量下降2019中中 国国 数数 据据 智智 能能 管管 理理 峰峰 会会0.是否需要实施DevOps0.2 带来了什么问题?开发模式变化,初期效率可能会降低需要构建新工具、系统,成本增加团队无法达成共识,产生内耗运维知识缺乏,需要
2、学习或补充新人2019中中 国国 数数 据据 智智 能能 管管 理理 峰峰 会会1.建立持续学习的上海品茶顶层意志,从自顶向下到全员自发小步快跑,从局部到整体持续优化,从最佳实践到制度规范他山之石,从开源到自研2019中中 国国 数数 据据 智智 能能 管管 理理 峰峰 会会2.找准切入点选择要求“做的快”的项目解决长期存在矛盾 标杆意义与业务保持契合 互联网业务特点收益直观 价值可以被快速理解输出成果:流程、规范、工具、需求2019中中 国国 数数 据据 智智 能能 管管 理理 峰峰 会会2.找准切入点选择乐于创新、接受变化的团队快速启动减少内耗灵活机动输出成果:组织结构2019中中 国国
3、数数 据据 智智 能能 管管 理理 峰峰 会会2.找准切入点选择价值可视、可理解、可度量的产品模范作用收益表现客观、直接容易推广输出成果:验收维度、标准2019中中 国国 数数 据据 智智 能能 管管 理理 峰峰 会会3.自动化&流水线基础 1:配置管理数据库(CMDB)计算资管管理平台(OpenStack)IDC管理系统&硬件配置抓取机器软件环境基线采集工作流引擎2019中中 国国 数数 据据 智智 能能 管管 理理 峰峰 会会3.自动化&流水线基础 2:唯一应用标识统一代码仓库和软件仓库2019中中 国国 数数 据据 智智 能能 管管 理理 峰峰 会会3.自动化&流水线基础 3:基础设施构
4、建自动、流程、标准创建应用创建虚机部署软件创建账号申请域名反向代理PortalQSRCQDeployQAgentQDnsDBOpenresty2019中中 国国 数数 据据 智智 能能 管管 理理 峰峰 会会4.持续集成&安全部署开发、测试、生产环境保证一致统一代码仓库、统一软件仓库、统一镜像仓库集成/部署自动化检查禁用规则;质量检查(sonar);发布测试;Codereview支持多种发布模式,降低风险灰度、金丝雀、等2019中中 国国 数数 据据 智智 能能 管管 理理 峰峰 会会5.快速、可靠的自动化测试平台快速构建测试环境系统-Noha自动化测试系统-QTA代码覆盖率检查Mock平台A
5、PI管理平台 YAPI缺陷跟踪管理系统 jira2019中中 国国 数数 据据 智智 能能 管管 理理 峰峰 会会6.有效、准确的监控系统指标监控基础监控 设备基础指标CPU、内存、负载、硬盘应用监控 GC、线程数、延迟业务监控 PV、交易量、支付成功量 2019中中 国国 数数 据据 智智 能能 管管 理理 峰峰 会会6.有效、准确的监控系统日志监控访问日志异常日志业务日志2019中中 国国 数数 据据 智智 能能 管管 理理 峰峰 会会6.有效、准确的监控系统事件监控运维变更事件应用发布事件配置变更事件硬件故障事件网络故障事件2019中中 国国 数数 据据 智智 能能 管管 理理 峰峰 会
6、会6.有效、准确的监控系统报警分级 不同级别报警策略不同多通道 IM、短信、电话毛刺抑制 忽略闪爆同类报警合并 大量报警自动合并可追溯可检索2019中中 国国 数数 据据 智智 能能 管管 理理 峰峰 会会7.故障快速定位&预测故障发生之后快速定位 减少平均修复时间(MTTR)把故障消灭在发生之前 增加平均无故障工作时间(MTBF)从而提高应用可用度 可用度=MTBF/(MTBF+MTTR)2019中中 国国 数数 据据 智智 能能 管管 理理 峰峰 会会8.降低变更风险事先计划变更步骤checklist回滚错失安全停止点周知利益相关方评审2019中中 国国 数数 据据 智智 能能 管管 理理 峰峰 会会9.故障管理建立制度上报制度定级标准升级策略故障review明确责任方、受影响方限定期限内,双方一起review故障,查找原因指定改进计划,并限定时间内完成改进故障沉淀入案故障演练不定期进行故障演练。模拟故障 或 拔线测试2019中中 国国 数数 据据 智智 能能 管管 理理 峰峰 会会10.信息安全全员化、日常化使安全成为每个人工作的一部分将安全性与CI/Cd集成设置安全性相关监控、报警杜绝认为对构建、发布流程的影响关键流程需要人工审批并留痕可审计减少对单点职能人/团队的依赖2019中中 国国 数数 据据 智智 能能 管管 理理 峰峰 会会THANK YOU!