《【网易数帆侯诗军】金融云原生架构变革过程中的道、术、器、用.pdf》由会员分享,可在线阅读,更多相关《【网易数帆侯诗军】金融云原生架构变革过程中的道、术、器、用.pdf(43页珍藏版)》请在三个皮匠报告上搜索。
1、金融云原生架构变革过程中的道、术、器、用侯诗军网易数帆资深云原生专家侯诗军拥有十多项云计算领域技术发明专利,kube-router、redis-operator、kube-ipam等kubernetes生态组件的源代码贡献者。参与国家信通院相关标准制定,曾就职于同盾科技、华为3COM等企业的技术与管理岗位,具备16年研发、架构设计与运维实践经验,从0到N的研发组织与技术变革经历,专注于云原生、分布式微服务、网络技术、自动化运维、DevOps、质量管理等领域。香港理工大学与华中科技大学双硕士 中国质量协会注册专家 CNCF认证云原生专家 云原生社区优秀讲师 网易数帆资深云原生专家个人简介企业架构
2、演变的规律云原生变革的破局之术云原生架构的七种武器用户的成功实践案例道术器用企业架构演变的规律道单体式架构-云原生微服务架构物理机器-容器化/服务网格手工运维-DevOps,。道德经低成本人口红利的野蛮生长阶段差异化客户体验驱动产品创新非连续性成长型思维保持竞争优势第二增长曲线企业第二增长曲线信息被动接收用户信息交互主动服务与分析通过计算机、通信网络等信息技术,替代了人工交易模式,实现了交易结算等核心业务的信息化。网上委托成为主要委托方式。金融科技上升为集团战略,成为公司核心竞争力。科技逐渐从后台走向前台,发挥前瞻性和牵引力的特性,引领业务体系升级,实现业务模式、服务模式、工作模式等创新。交易
3、操作需要到柜台进行手工操作,通过人工方式进行现场交易。报价、委托、行情、成交回报等都有手工完成。通过互联网技术和平台发行、定价、销售、交易、服务等全链条,覆盖经纪业务、理财产品代销、发行承销、衍生品交易、自营投资、“两融”交易等传统业务。现场交易电子化交易交易互联网化数字化转型02000200020142014当下金融行业发展趋势金融IT架构挑战数字化应用要具备更快的迭代速度,缩短新业务产品的研发与投产时间,快速响应市场和客户需求,需要成熟的分布式架构、敏捷交付流程和技术风险保障机制支撑。金融服务场景化个性化金融业务在数据驱动、移动化、开放平台等战略驱动下,要求IT架构具
4、备足够的弹性伸缩能力来满足高并发业务场景下的突发流量,以及业务的高可用问题。高可用与业务连续性分布式技术通过对平台能力的抽象和标准化,辅以微服务治理、敏捷的资源编排和管控技术,使开发者的关注重心上移,更关注业务逻辑本身。前沿技术发展趋势随着移动金融、普惠金融的快速发展,金融业务的在线化、场景化和差异化要求不断提升,目前金融机构技术供给能力难以满足全场景金融业务需求普惠金融业务需求金融IT架构面临的挑战2021年10月 中国人民银行办公厅、中央网信办、工信部、银保监会、证监会-发布关于规范金融业开源技术应用与发展的意见,鼓励金融机构将开源技术应用作为提高核心技术自主可控能力的重要手段,加强开源技
5、术研究储备,掌握开源技术核心,以应用促提升,依托金融业丰富的业务场景促进开源技术迭代升级。2018年6月 证监会-发布证券期货业“十四五”规划,推进开源开放平台建设,加强云原生架构、关键算法资源、低代码工具等供给,培育具有国际竞争力的开源生态。2021年3月 国务院-发布中华人民共和国国民经济和社会发展第十四个五年规划和2035年远景目标纲要,支持数字技术开源社区等创新联合体发展,完善开源知识产权和法律体系,鼓励企业开放软件源代码、硬件设计和应用服务。2016年7月 国务院-发布国家信息化发展战略纲要,提出根本改变核心关键技术受制于人的局面,形成安全可控的信息技术产业体系,电子政务应用和信息惠
6、民水平大幅提高。2021年10月 中国人民银行办公厅、中央网信办、工信部、银保监会、证监会-发布证券期货业科技发展“十四五”规划,阐明“十四五”时期金融行业数字化转型和科技监管工作的指导思想、工作原则及工作重点,提出一批具有标志性、前瞻性、全局性、基础性和针对性的重大战略举措,为新发展阶段证券期货业数字化转型发展提供纲领性指南。2022年1月 中国人民银行办公厅、中央网信办、工信部、银保监会、证监会-印发金融科技发展规划(2022-2025年),其中重点任务包括八个方面,即“健全金融科技治理体系、充分释放数据要素潜能、打造新型数字基础设施、深化关键核心技术应用、激活数字化经营新动能、加快金融服
7、务智慧再造、加强金融科技审慎监管、夯实可持续化发展基础。”金融IT架构变革政策指引领导以为的内部架构实际的内部架构运维痛点:手动操作多,稳定性和效率极其低,稳定性SLA无法保障。梳理思路:持续集成、编排、服务发现实现运维流程自动化。通过服务治理、全链路监控、风险预见等方式保障业务的SLA。企业传统架构存在的问题DevOps是一种软件研发的思想、文化、模式、理念,打破开发、运维、测试的部门墙,让软件研发整个过程(开发/测试/运维)更加敏捷高效。CI/CD是能够将DevOps进行实际落地的核心基础。有了CI/CD自动化的工具和流程,就可以将DevOps思想进行落地践行。容器的一次打包多环境不可变基
8、础设施的部署,以及K8S容器编排调度、弹性伸缩、故障自愈、滚动发布,就可以很方便的去进行进行CI/CD自动化。高内聚低耦合,不同工程师可以对各自负责的模块进行处理,分工协作。大量微服务开发、测试、运维部署,需要CI/CD和容器化,DevOps文化的践行。微服务持续集成DevOps容器化在架构设计上将业务应用拆分为多个高内聚,低耦合的服务,每个服务独立运行,由不同的团队开发和维护,独立部署,可以采用不同的语言。云原生的基本组成部分:微服务、DevOps、持续集成、容器化。+云原生架构的组成易于快速开发、迭代和维护可观测、可管理有利于保证业务连续性技术异构性强企业IT研发发展趋势传统单体架构云原生
9、微服务架构 IT与业务的关系:支撑满足业务-引领业务为满足业务显性功能,建设IT系统IT系统成为企业核心资产,引领和支撑业务发展;数据成为资源 业务变化周期:年-月-周传统瀑布型开发方式,业务系统建设/迭代周期长(3-6个月)资源自服务;敏捷开发,持续交付-具备每日可更新的条件 运维效率:串行/手工-自动化/自助式服务物理设备逐一维护升级,人均运维设备数50;运维能力手工处理,运维系统个数30;实例数小时自动化运维工具管理,人均运维设备数200;运维业务系统服务数1000;实例数10000;响应及恢复时间:分钟-秒 系统连续性:58(渠道)-随时随地0中断按季度版本变更、大变更需停机灰度发布、
10、预发环境验证、平滑迁移、业务0中断 用户体验:强调用户体验线下反馈、定期优化数据感知、分析、体验分流-千人千面云原生架构的优势云原生变革的破局之术术 1张蓝图 2个层面 3大步骤 4条路线,;,。孙子兵法条路线:云原生架构变革思路业 务 架 构单体架构 服务化架构 微服务架构研 发 流 程运维手工化 测试发布脚本化 研发流程平台化 DevOps技 术 架 构硬件物理机 虚拟化 SpringCloud+容器 Service Mesh组 织 架 构研发运维隔离 建立中台组衔接 架构委员会融合研发运维4(6)业务流程梳理(7)划分核心领域(8)确定界限上下文及相互关系(9)输出按照领域横向拆分架构(
11、10)技术底座部署、调试(12)选取试点业务,横向拆分(13)注册中心,API知识库/服务契约(14)API网关保障服务的平滑拆分(15)灰度发布,平滑迁移(16)保障质量,纵向分层拆分(17)业务拆分完毕,总结规范(18)质量看板,流程保障,绩效考核(19)进行服务化分组,各组制定拆分计划与里程碑(20)各组按照里程碑计划,逐步拆分(21)统一配置管理(22)容器化改造,PaaS平台化(23)统一日志管理(24)服务关系,定位问题难,全链路监控(25)为支撑高并发,进一步拆分(28)云原生中间件,分库分表,流量消峰填谷(26)服务网格,高级服务治理策略(27)大规模的服务治理,防止服务雪崩(
12、29)服务细分后环境多,流量染色(31)稳定性保障故障诊断根因分析(32)同城多活异地容灾多中心单元化(11)持续集成流程及工具的铺垫(1)需求调研(2)现状调研(3)方法论咨询(5)方案调研(4)技术选型梳理规划阶段性能优化/服务保障试点推广阶段微服务云原生应用层服务规模技术底座灵活性激活促进大步骤:云原生架构落地路径云原生架构的落地不是一蹴而就的,需要在架构演进过程中,不断完善相关的能力与规范,形成企业的组织文化与技术体系。(30)全链路压测,容量摸高,大并发全面云原生化3个层面:业务与技术双管齐下安全、稳定、可靠、技术成熟度高作为架构设计和技术选型的首要原则。循序渐进、分步实施,从局部探
13、索、核心试点再到全面推广落地,充分验证技术成熟度,确保稳定可控。低高高落地难度(涉及组织、流程、平台、架构的变革)微服务网格化零侵入快速接入多语言松耦合注册发现服务治理架构演进集中式单体架构多中心多活路线2:循序渐进、分步实施路线1:一步到位云原生网关高性能分布式认证鉴权插件扩展中间件云化运维自动化故障自恢复在线伸缩稳定性保障立体化监控风险预测根因分析AIOPS容器化 平台无关弹性伸缩资源池化管理创新类业务系统、电商场景业务、互联网金融场景业务。支撑型业务系统,如市场和销售支撑、客户管理、资产管理。整合式共享、变化可控,计划性强,如工作流、渠道系统。核心业务系统,如证券交易系统、银行的资金相关
14、账务系统、保险的理赔系统等。从周边到核心,先创新再传统。小步快跑,迭代演进。2云原生化程度张蓝图:云原生架构蓝图规划提供应用开发门户,支持研发生态建设,促进成果共享屏蔽底层存储、计算、网络等基础设施复杂性,按需一键申请和调度资源提供应用研发的全生命周期工具链支持,对研发人员屏蔽工具复杂性面向技术和业务提供可用、易用的应用服务基础设施环境,显著提升研发效率技术中台理念,PBC模块化可持续进化的中台底座设计企业级技术体系技术中台化建设企业级云原生微服务、中间件技术平台满足中长期技术发展需要云原生微服务架构,分布式去中心化,可线性扩展,数据面性能大幅提升敏捷基础设施,自动部署、自动弹性扩容、自动升降
15、级、自动限流降级持续交付,持续集成、持续部署、持续发布,更快、更频繁地交付更稳定的软件提供稳定的应用部署环境,支持一键快捷部署提供全链路运营监控和高效的运维管理支持掌握分布式架构云原生体系化形成并逐步完善分布式架构能力掌握分布式体系设计、实施、运维、观测能力 中台能力复用 企业资产沉淀 轻量解藕组装式研发效能提升 云原生敏捷弹性 服务治理故障自愈 降低成本接入性能提升可用性提升运维成本降低可持续进化的中台敏捷提效1云原生架构的七种武器器容器云平台平台融合网关双引擎微服务云原生中间件立体化监控稳定性保障APIDevOps,。论语Web2.0下的技术积累沉淀移动互联网多元化业务实践金融级基础架构方
16、案升级2007.2009.2015.2020.2022.大规模分布式机器学习系统 Serverless容器平台 Kubernetes/Harbor社区贡献 金融实时数仓 金融数据安全 金融数据治理 金融智能模型 Curve分布式存储开源 金融级分布式底座 信创兼容认证 99.999%可用性 KubeCube开源 KubeDiag开源 Hango开源 Slime开源 分布式并行计算平台2012.OpenStack私有云 Nova等组件贡献2017.2006.分布式文件系统分布式数据库中间件 微服务/服务网格平台 Envoy/Istio社区贡献 国有大型银行 全国性股份行 大型证券公司网易数帆金融
17、解决方案创新之路 依托网易集团二十余年互联网技术积累,网易数帆的金融解决方案创新之路。证券交易所 头部保险公司云原生服务治理服务管理IaaS基础设施DevOps平台需求管理研发协同效能度量质量看板集成测试灰度发布GitOps流水线研发一体化应用路由认证鉴权协议转换插件扩展流量控制负载均衡API网关服务集成服务引擎注册中心服务治理多注册中心支持租户隔离权限控制规则管理规则同步流量控制熔断保护服务注册发现服务降级请求容错参数分流接口鉴权流量染色服务探针无侵入接入全开发框架支持方法治理配置中心多格式支持版本管理灰度配置历史回滚权限管理服务目录服务元数据、交易码管理应用诊断黑白名单静态拓扑服务网格Se
18、rvice Mesh流量拦截流量路由流量治理流量安全故障注入一键热升级网格加速自动注入边车管理网格诊断协议栈加速SockOps云原生中间件PaaS自动运维分布式数据库分布式协调分布式消息分布式搜索分布式缓存故障自愈容器云平台资源调度集群管理健康检查容器管理配额管理滚动发布镜像管理异构环境管理弹性伸缩服务治理服务边车服务加速用户系统 资讯服务管理平台资金平台风控系统清算系统账户系统证券交易信用交易基金代销理财业务行情服务消息服务运营服务佣金服务社交服务研究能力交易能力一站式PB端到端资管大财富管理全业务链投行可观测性根因分析风险预测故障诊断全链路追踪日志采集日志过滤全文检索立体化监控稳定性巡检S
19、QL质量管理安全变更管控故障演练流量重放全链路压测稳定性保障平台特性信创适配多中心高可用资源集中托管开源生态治理体系化支撑支撑支撑金融云原生架构Kubernetes API多集群管理自建 K8S 集群公有云 K8S 集群托管 K8S 集群计算存储网络公有云/私有云计算存储网络虚拟机/物理机存储管理镜像管理基础监控网络管理应用编排弹性伸缩存储声明服务发现负载均衡配置管理日志监控 武器能力:为平台用户提供多云、混合云集群统一管理能力,服务生命周期管理能力。支持 K8S 资源可视化创建,对接RBAC。支持集群、节点、实例等多维度监控及自定义监控视图,提供日志、监控、告警等全链路运维能力。武器特性:多
20、云混合云:支持统一视图管理多云、混合云集群,屏蔽不同基础设施差异;弹性伸缩:支持根据系统指标、自定义指标自动扩容/缩容实例,高效应对业务流量波峰波谷;开放兼容:支持 Operator 仓库,Helm 应用市场,可快速接入并使用多个开源或自建市场;支持 OpenAPI 对接第三方系统。锻造成分:Kubernetes、Harbor、Helm、Operator、Promethues等武器一:容器云平台提高业务弹性与可用性kubecube社区:https:/ 武器能力:为平台用户提供代码管理、构建、代码扫描、部署等能力;集成企业代码仓库,提供一体化的分支管理能力,与企业的其他系统或平台集成完成持续集成
21、流水线;支持主机和容器部署,提供灰度部署、蓝绿部署、滚动部署等多种高级部署策略。武器特性:企业系统集成:集成企业内其他的系统或平台,完成单元测试、代码扫描、自动化测试等能力;可视化流水线:平台通过可视化的方式支持用户配置流水线,并支持用户自定义流水线阶段;高级部署策略:平台支持主机和容器两种类型的部署方式,并支持灰度部署、滚动部署、蓝绿部署等不同种高级部署策略,实现不停服发布与流量的精准控制。锻造成分:Kubernetes、Jenkins、Tekton、Argo、OAM等代码编译单元测试代码扫描构建制品自动化测试自定义模块GithubGitlabSubversion代码仓库可视化流水线开发环境
22、主机部署容器部署测试环境主机部署容器部署生产环境主机部署容器部署武器二:DevOps平台提高迭代与运维效率GoAPI生命周期管理OverMind项目管理 武器能力:作为应用南北向流量出入口,用于将系统内部服务进行统一暴露,所有对内部服务的请求调用通过API网关统一转发。调用方不需要维护目标服务的地址,只需要依赖API网关调用。武器特性:高性能:单实例15W+TPS,支持多实例部署,可横向扩展,生产场景性能表现业界领先;治理能力:提供多层级熔断、限流能力;支持请求Path重写、负载均衡、版本分流、支持多种协议互转等丰富的治理能力;安全可控:支持丰富的用户认证方式和多层级授权管理,使用 IP 黑白
23、名单机制,有效保护敏感资源访问;可观测性:支持服务级、路由级、请求级监控,包含请求总数、成功数、4xx、5xx数等指标;灵活扩展:提供增强级 Lua 扩展框架,基于 WebAssembly 多语言扩展插件,用户可以自由选择插件开发语言。锻造成分:Envoy、Istio、Kubernetes、Slime、Loggie等社区:https:/ Boot、Spring Cloud、istio等框架多协议HTTP、gRPC等多协议多报文格式基于XML/JSON报文格式转换业务形态注册中心无侵入接入服务注册发现实例上下线故障实例摘除配置中心配置热发布、回滚服务/全局级配置配置灰度发布配置推送轨迹服务目录元
24、数据统一管理跨环境共享元数据接口/方法级熔断服务熔断接口/方法级限流服务限流流量染色路由分流负载均衡服务/接口级容错服务治理微服务框架服务网格 武器能力:提供全面的微服务管理能力。支持对服务元数据跨环境统一管理,服务无侵入接入,自动服务注册发现。支持路由、熔断、限流、容错、流量染色等服务治理能力。支持服务配置运时动态下发、配置灰度发布等。武器特性:轻量无侵入接入:基于字节码增强技术的微服务框架需修改户代码和依赖包配置,需重新构建应用;多维度服务治理:支持熔断、限流等规则配置,实时感知业务报文异常,对流量进行精细化治理;多活流量调拨:支持基于请求参数、权重比例进行流量调拨,支持全链路灰度发布能力
25、。锻造成分:Spring Cloud、Javaagent、Arthas、Hystrix/Sentinel、Istio、Envoy、Slime等武器四:双擎多模微服务助力架构平滑演进信通院首批先进级认证 武器能力:为平台用户提供统一的中间件运维管理能力,提供基于容器的缓存、消息、索引、协调等高 SLA、高性能、低成本的分布式中间件。武器特性:自动化运维:基于云原生架构实现了中间件全生命周期管理,运维监控体系,弹性伸缩和故障发现等能力,实现自动化运维能力,相比开源处于Phase II的能力上实现了极大的提升;高可用:99.99%SLA保障,多区域多中心的高可用支持,稳定性保障系统的支持。异构基础设
26、施支持:支持纳管容器和虚拟机、物理机场景下的中间件集群,实现系统平滑演进;锻造成分:Kubernetes、Operator-Framework、Redis/Kafka/Pulsar/RocketMQ/RabbitMQ/ES/ZooKeeper/Nginx等武器五:云原生中间件解决多活与统一纳管业务接入层LoadBalancer ServiceNodePort Service基础设施层开箱即用中间件服务层数据面APIKubectl控制面控制台巡检和预警稳定性管控根因辅助定位集群异常自愈策略引擎KafkaZooKeeper应用市场(开源 Operator)RedisRocketMQElastics
27、earchRabbitMQ故障自愈多中心高可用跨机房数据复制中间件统一管理监控/告警/日志在线扩缩容权限管理操作审计信创基础设施公有云容器虚拟机物理机/裸金属PulsarNginx更多APPSDKJVMOS消息队列全文索引日志流聚合网关消息队列在线诊断拓扑分析链路监控指标聚合统一报警全文索引智能运维数据流日志模式匹配业务实时分析智能分析运维监控大盘多维分析应急处置故障定位服务监测业务监控异构系统全链路监控探针MiddlewareDB 武器能力:提供应用性能监控、业务数据监控和链路追踪能力,支持链路、日志、指标等数据采集,同时对接企业告警通道进行监控告警,平台提供集日志、指标度量、立体化监控于一
28、体的可观测能力。武器特性:代码无侵入:无需改动代码,接入成本低;高性能数据采集和处理:采集探针性能损耗5k TPS;立体化监控:通过关联业务ID,能端到端展示整个调链,并同步查看业务志。锻造成分:APM、Skywalking、Loggie、Filebeats、Promethues、ES、Kafka等武器六:全链路立体化监控增强可观测性MetricsTracingLogging风险预见深度指标采集应用指标采集2211引流回放全链路压测Kubediag根因分析根因分析专家知识库数据仓库算法模型机器学习强化训练ChatGPT专家会诊诊断建议3异常诊断事件分析影响范围分析关联分析异常图谱规则引擎根因分
29、析报告故障诊断建议数据支持输出4输出4流式计算Kubernetes集群虚拟机AppAppAppApp物理机中间件集群eBPF旁路采集SDK/Agent运维诊断专家知识库诊断流水线编排专家会诊智能定位专家经验沉淀诊断树预案推荐性能剖析Profiling3巡检数据支持智能巡检定时触发故障演练异常事件Insight立体化监控线上触发演练触发武器七:事前事中事后稳定性保障闭环用户的成功实践案例用证券案例银行案例保险案例,。荀子富国证券案例:某头部券商-案例概述双擎微服务治理平台(应用容器化部署)微服务框架服务网格应用多活分布式缓存分布式消息云原生中间件PaaS平台(容器化部署)负载均衡分布式KV注册中
30、心中间件市场分布式日志稳定性管控根因分析智能巡检中间件集群联邦无侵入应用性能监控网络加速服务治理云原生API融合网关高性能路由转发多协议扩展流量治理业务接入层中间件层服务治理层 性能弱,多次影响业务 不稳定,有zk中心节点抖动问题 吞吐量低,zuul网关转发问题难解决Zuul 网关Dubbo框架(应用虚拟机部署)传统中间件(主机部署运维)duubo框架依赖,开发效率低 Zookeeper瓶颈问题 Dubbo与外部业务集成难 可观测性监控指标覆盖不足,缺少主动发现问题手段 中间件版本规范不一,技术管理及运维难度大 申请周期长,资源损耗大,难以对业务资源计量 尝试自研容器PaaS中间件,缺少大规模
31、实践优化,遇到高可用调度和稳定性问题,不满足业务投产要求成效:提升业务研发迭代速度,快速响应新需求,响应周期缩短:从月级别缩短到周级别。提升业务连续性及可靠性,通过灰度发布保障业务连续性。提升资源利用率,对资源占用大的服务按需扩容动态伸缩。证券公司networkK8S PodK8S PodServiceService12345SR-IOV容器网络加速eBPF网络加速用户态协议栈加速eBPF网络加速515%50%30%证券案例:某头部券商-网格与容器云性能深度优化采用SR-IOV网卡直通,带宽隔离与性能保障;协议栈优化:用户态协议栈可实现协议栈卸载到用户态,省去用户态和内核态的切换开销;结合后端
32、的用户态容器网络实现基于用户态的全栈报文通信,降低Sidecar代理带来的时延开销30%以上;网络加速组件:基于eBPF自研sockops组件,加速Socket间通信,实现网络加速,延时降低15%以上。配置懒加载:Sidecar启动时间缩短80%以上,内存占用降低30%以上,配置下发时延降低50%以上,控制面处理负载、配置变动性能提升100%以上。证券业务系统对网络延时非常敏感。影响证券交易的因素:券商机房与证券交易所的物理距离、券商内部系统的数据传输延时、券商内部系统处理数据的速度。Slime社区:https:/ 协议等多协议业务共存场景,通过协议的兼容与嗅探,支持在此场景下不同业务的正常调
33、用、治理。HTTPDubboFIXStepFake ListenerListener Filterslistener filter对新连接进行预处理,预读该连接上少量字节来判断是哪种协议,之后选择对应协议的filter chain来处理证券案例:某头部券商-兼容私有协议调用及治理调度扩展程序Predicate-extPriority-ext扩展的优选调度算法扩展的预选调度算法证券案例:某头部券商-中间件多集群高可用调度机房A机房Bkubeletkubeletkubeletkubeletkube-apiservercontroller-managerkube-schedulerOperator
34、node1node2node3node4Schedulable nodesPredicatePre.filters:node3 doesnt have enough resourcePriority指定的优选调度算法Podnode2Node1:8分(priority)+100分(priority-ext)Node2:6分(priority)+1000分(priority-ext)将Pod实例Bind到node2扩展调度RedisPodKafkaPodZKPodRedisPodKafkaPodZKPodRedisPodKafkaPodZKPodRedisPodKafkaPodZKPodK8S集群
35、node1node2node1node2node3指定的预选调度算法中间件有状态集群高可用 单集群跨机房高可用;跨多集群联邦调度。多AZ均分部署同一Redis集群的所有实例Pod;同一分片的主从Pod不能同时存在于同一个AZ;在满足上述前提下,单个AZ内尽可能分散部署实例Pod到不同的Node节点;升级、扩缩容等运维操作不能打破上述约束。多机房多AZ均匀调度证券案例:某头部券商-稳定性保障故障演练域服务运行域故障观测域场景管理影子库管理录制管理压测模型全链路压测Mock管理报告管理混沌工程引流回放预案管理环境管理演练管理演练模版演练报告任务调度流量录制发压引擎数据隔离Diff测试服务网格稳定性
36、管控中间件稳定性管控风险预见/故障诊断/根因分析预见根因分析智能诊断立体化监控容量巡检管控面组件巡检故障感知数据面组件巡检网格排障流量治理稳定性巡检巡检报告配置管理根因分析故障自愈监控告警容量预见性能预见可靠性预见专家经验根因拓扑根因说明异常检测ebpf采集多维拓扑指标深度关联深度指标诊断触发器诊断能力管理诊断流水线诊断结果管理流量ETL流量降噪应用多活同城主备同城双活异地多活安全预见可观测能力根因分析技术银行案例:某大型国有银行-案例概述 烟囱系统成本高,各类系统孤岛,难以联动起来,发挥真正价值;API资产管理缺乏,各种历史遗留系统难以集成改造与平滑演进;开源微服务框架或自研框架对业务侵入性
37、强、性能低、异常率大;各类组件产品化程度低,资源利用率低、可用性低、运营成本高;没有分布式场景下的异地灾备、多机房多活等高可用的产品能力。成效:无侵入的微服务框架,降低微服务研发难度,通过在线页面配置的方式降低微服务治理的成本;通过统一中间件与API资产管理/CI/CD,提升资源利用率,降低IT系统运维成本;立体化监控,降低分布式云原生架构下的运维监控和排障难度;单机房和跨多中心机房的高可用容灾,故障切换与自动恢复。多中心拓扑可视化切换管理银行案例:某大型国有银行-中间件小机下移/跨IDC高可用轻舟统一管控/PaaS Manager机房1机房2API 网关API 网关服务1服务N服务1服务NS
38、idecarSidecarSidecarAgentAPI 网关服务1服务NAgentAgent轻舟中间件(分布式缓存、消息队列、弹性搜索、注册中心)轻舟中间件Operator机房3机房1银行案例:某大型国有银行-微服务治理演进与统一管控现有服务架构统一服务框架治理统一服务网格治理无SDK传统单体应用、外采自研SDKNSF-Agent原生SDKSpringCloud、Dubbo、gRPCNSM-SidecarNSF-AgentSidecar异构语言Go、python、Rust统一管控面垂直技术栈接入轻舟服务网格融合过渡期统一网格服务治理能力高性能业务Proxyless-SidecarNSF-Si
39、decar自研SDK银行案例:某大型国有银行-API资产管理/CI/CD服务接口契约,API全生命周期管理API管理涵盖API设计、开发、测试、部署、发布、运维等全生命周期,帮助银行进行API资产的沉淀与复用;制定API接口规范,统一API知识库;接口文档统一维护,文档与运行时一致,减少沟通成本。CI/CD结合业务容器化,实现持续集成/交付质量卡点:分支CI、版本CI、扫描、安全检测、规范检查;架构委员会制定流程,在CI/CD中增加Code Review和文档Review的流程;研发、测试、运维组织结构与文化融合,以便更好的运用与发挥价值。保险案例:某头部保险公司-案例概述成效:实现业务与技术
40、的解耦,业务降低技术依赖,服务治理能力下沉到 Sidecar 实现统一的服务治理,技术架构独立演进;传统应用平滑迁移,通过在适配行内标准协议,实现微服务架构与传统架构协议报文的转换,从而推动传统应用与微服务架构的融合治理,提高业务的可用性、降低服务治理的成本。不同业务有着不同的微服务架构,不同的框架、协议、注册中心难以统一管控应用调用网状交织,应用服务研发缺乏统一规范,微服务化接入对业务改造较大随着互金业务的开展,流量突增较大,没有很好的平台进行服务治理,服务上下线需要停机痛点梳理:保险公司保险案例:某头部保险公司-应用形态分析KubernetesF5设备1.外部通过网关http,IP请求2.
41、K8s 版本 1.12应用接口API应用接口APIDB应用服务内部API服务访问VM-业务部署单元1.Java2.JDK 1.8.03.实例部署在多台VM4.非 spring 框架配置信息/服务注册信息存储DB配置信息DB存储应用服务-1K8S PodK8S Pod应用服务-N注册中心Eureka场景一:部署在容器上的应用服务,Spring boot框架,基于较老的K8S 1.12底座上,服务Pod部署,信创国产化JAVA应用服务器。场景三:部署在虚机上的应用服务,非Spring boot框架,采用老的Structs1框架,信创国产化JAVA应用服务器。F5应用接口API应用接口APIDB应用
42、服务VM-业务部署单元1.Java2.JDK 1.8.03.实例部署在多台VM4.spring 框架配置信息/服务注册信息存储场景二:部署在虚机上的应用服务,Spring boot框架,遵循unic的脚手架技术栈,信创国产化JAVA应用服务器。内部API服务访问F5Agent负责应用内服务治理Agent负责应用内细粒度服务治理(方法级)Sidecar负责应用间细粒度服务治理(接口级)Agent可自主脱离,或新业务直接使用Sidecar单独Agent模式:Agent+Sidecar模式:单独Sidecar模式:保险案例:某头部保险公司-双擎多模式架构平滑演进Online用户中心保单中心产品中心交易中心前端网关(流量接入层)用户中心交易中心产品中心新保单中心前端网关(流量接入层)用户请求交易请求产品请求保单请求服务拆分时候,通过网关对前端应用屏蔽服务拆分,前端无感知。为保证平滑拆分,新拆服务应灰度发布。Online用户请求保单请求产品请求交易请求用户请求保单请求产品请求交易请求用户请求保单请求产品请求交易请求保险案例:某头部保险公司-服务无感拆分与灰度旧保单中心90%10%灰度发布A/B测试结束语,。,。新技术:驱动金融架构转型 业务创新 瞰未来:抓住第二增长曲线 迎难而上谢 谢 观 看Thanks