《筑牢高可用基石AHAS赋能溪鸟安全生产探索与实践-企业互联网架构论坛(6页).pdf》由会员分享,可在线阅读,更多相关《筑牢高可用基石AHAS赋能溪鸟安全生产探索与实践-企业互联网架构论坛(6页).pdf(6页珍藏版)》请在三个皮匠报告上搜索。
1、筑牢高可用基石,AHAS赋能溪鸟安全生产探索与实践周洋阿里云智能资深技术专家故障是企业发展的拦路虎能力度量平台产品输出方式服务咨询安全生产平台(企业版)CNStack 1.1企业版本公共云SaaS镜像化输出故障定位与快恢大促活动保障混合云容灾管理安全生产组织建设可用性:99.99X%灾难恢复:RTO30s,RPO0组织效能:1-5-10牵引指标SRE型组织高可用架构极端常态性能压测压 测 周 期多 协 议 压 测开 源 生 态 压测生 产 写 压 测业务连续性管理故 障 管 理应 急 协 同事 件 管 理告 警 管 理统一监控业 务 监 控数 字 体 验监 控应 用 监 控基 础 监 控稳定性
2、防护限 流 降 级开 关 预 案弹 性 伸 缩故 障 自 愈混沌工程容 灾 演 练故 障 演 练预 案 演 练攻 防 演 练容灾多活同 城 双 活异 地 多 活异 地 应 用 双活异 地 主 备可用性改进可靠发布效能提升故障管理应急处理演练验收容错架构容灾架构快恢自愈可观测性容量规划可防护性UPGRADE!UPGRADE!UPGRADE!UPGRADE!小概率的故障,也可能带来不可挽回的经济损失,甚至是法律风险。多活容灾解决方案2.0以业务应用为中心的云原生容灾架构-MSHA同城一朵云:多AZ混合云:多云架构同城应用双活异地应用双活异地业务双活多云容灾Agent后端应用Agent后端应用AZ1
3、微服务/消息/分布式任务 灾难逃逸自封闭容灾网关AZ2对等应用机房级别流量隔离RTO=1min,RPO0探针旁路挂载,业务代码0改造Agent后端应用IDC1容灾网关Agent后端应用IDC2容灾网关数据中心级别流量隔离RTO=1min,RPO=10min业务分钟切换,数据层分钟级切换Agent后端应用IDC1容灾网关Agent后端应用IDC2容灾网关逻辑单元级别流量隔离RTO=1min,RPO0核心业务分钟切换,数据容错保护阿里云企业版阿里云公有云阿里云敏捷版企业自建IDC第三方云异地一朵云:近/远距离多数据中心支持不同云形态下的统一容灾纳管政府运营商金融能源互联网行业落地情况可信云混沌工程
4、平台先进级能力评估最高分亲宝宝亲宝宝亲宝宝的系统架构在面对复杂业务下频繁迭代时,系统依然具备面对故障的高容错能力面对故障的高容错能力,业务表现的更稳定、健壮、弹性。收钱吧收钱吧通过故障演练平台提供的微服务依赖治理能力,提升了业务的容错能力提升了业务的容错能力和系统整体稳定性和系统整体稳定性,并建立了面向失败设计的技术文化氛围。混沌工程实验最佳实践 Chaos基于混沌工程实验理论的故障演练平台AHAS Chaos自定义演练机器与场景,灵活自由经验库一键演练,简单快速高阶演练方案,按需配置可视化演练,支持基于业务架构拓扑一键发起演练业务0改造,一键接入业务系统架构自动化感知故障效果可视化、爆炸半径
5、可视化社区版在线托管至企业版,且支持一键升级至企业版多种演练恢复策略,安全可控多维度权限管控,可控演练应用级别的爆炸半径客户案例客户案例NEWNEWNEW200+故障场景,覆盖基础设施到业务应用支持SLB、ECS、RDS等多项阿里云服务主机节点兼容Linux、Windows多操作系统支持预检、断网、恢复、复盘一站式的容灾演练微服务演练2.0,支持服务级别强弱依赖自动化验证NEW业务系统全方位可用性防护ServicesFirewallNetworkNginx/IngressWeb ServersCacheDatabaseThird-partyAPIGateway支持从 Nginx/Ingress
6、 到应用网关、应用层、缓存、数据库、三方依赖等做全方位立体防护Nginx/Ingress 层流量控制能力Nginx/Ingress/Envoy服务 A 集群服务 B 集群服务 C 集群用户请求/foo/*/baz/*/order/*细粒度监控细粒度API 流控开箱即用接入精准化集群防护新一代全自动托管集群防护能力Spring CloudDubbo/HSFSC Gateway/Zuul)任意代码块Nginx/IngressService Mesh解决场景单机流量不均集群小流量场景业务集群流控(分钟小时级)集群热点防控框架支持核心能力超大量级集群秒级流量控制全自动托管 token server秒级
7、实时监控/节点流量分布业务精细化流量管控HLS/RTMP流媒体协议直播、短视频,陪练Websocket协议聊天室、弹幕HTTP/HTTPS协议零售、金融、教育Dubbo/SpringCloud微服务压测MQTT协议物联网场景压测场景构造压测场景构造数据工厂数据工厂参数文件管理DB数据筛选DB数据同步流量发起流量发起地域/运营商定制百万并发/千万TPS流量动态秒级调整基于Agent 无侵入技术的生产环境全链路压测无需代码改造,更全面、精准的验证系统状态。阿里云PTS,Performance Testing for Anything控制台录入流量录制JMeter脚本NEWNEWNEWNEWNEWHOTHOTNEW