《阿里云:微服务×容器Meetup:云原生架构与应用专场PPT合辑(2023)(131页).pdf》由会员分享,可在线阅读,更多相关《阿里云:微服务×容器Meetup:云原生架构与应用专场PPT合辑(2023)(131页).pdf(131页珍藏版)》请在三个皮匠报告上搜索。
1、R RP PC CW W E EB B服服务发现流流量量管管控控可可观测认证鉴权丰丰富富生生态全全链路路追追踪踪010203Rest 协议支持可观测体系Native Image 原生支持04其他010203为什么需要服务治理OpenSergo 微服务治理标准与实践Sentinel 2.0 自适应限流为什么需要服务治理现代微服务架构的挑战企业实施微服务的挑战微服务&微服务治理微服务治理范围业界微服务治理存在的问题为什么是OpenSergoOpenSergo 领域&生态OpenSergo 服务治理架构体系OpenSergo流量路由OpenSergo流量路由OpenSergo流量防护与容错OpenS
2、ergo治理标准-流量防护与容错OpenSergo RoadmapOpenSergo 社区共建Sentinel 演进历程1920Sentinel Sentinel 在阿里巴在阿里巴巴集团内部迅速发巴集团内部迅速发展,成为基础技术展,成为基础技术模块,覆盖了所有模块,覆盖了所有的流量稳定性核心的流量稳定性核心场景场景Sentinel Sentinel 正式正式开源,社区迅速开源,社区迅速发展,不断扩充发展,不断扩充生态与能力,逐生态与能力,逐步成为最受欢迎步成为最受欢迎的同类组件的同类组件SentinelSentinel 开始在多开始在
3、多语言的生态中探索,语言的生态中探索,推出推出 C+C+原生版原生版本,同时针对本,同时针对Service Mesh Service Mesh 场景场景也推出了也推出了 EnvoyEnvoy 全全局流控的支持局流控的支持SentinelSentinel 推出推出 GoGo 原原生版本,并不断与生版本,并不断与Dubbo/Dubbo/DaprDapr/MOSN/MOSN/斗鱼斗鱼等社区进行合作,继续等社区进行合作,继续朝着云原生方向演进朝着云原生方向演进SentinelSentinel 推出推出RustRust 原生版本,原生版本,并基于此对并基于此对EnvoyEnvoy 集成及集成及eBPFe
4、BPF 层流控的探层流控的探索索?Sentinel 品牌升级1.0:1.0:流量防护流量防护标准化云原生多语言全方位生态能力升级Sentinel 2.0:服务治理的标准实现原生对接 OpenSergo 流量治理标准云原生架构升级:local brain(SDK,Mesh)+micro brain(控制平面)针对微服务、云原生体系,全方位覆盖多语言异构化框架与组件生态能力升级为流量治理与服务自愈,全方位保障服务稳定性与容错Sentinel 2.0 演进Sentinel 2.0 Overview服务隔离统一控制面(决策与治理中心)规则存储指标监控流量治理能力的标准实现API 模型标准化(nouve
5、au model)规则配置标准化(OpenSergo 数据源)策略服务接口标准化(gRPC service)标准化流量治理与自愈WeightCalculator权重计算Router流量路由LoadBalancer负载均衡TrafficScheduler流量调度TrafficShapingController流量控制AdaptiveThrottler自适应流控策略CircuitBreaker不稳定服务熔断基础指标统计指标统计扩展控制策略扩展调度策略扩展规则数据源扩展扩展机制自适应流控异常流量调度服务防抖流量路由流量染色流量控制服务熔断治理规则管理标准化(OpenSergo)全局指标汇聚与计算治理
6、策略服务标准化(gRPC)治理策略预计算全局治理策略控制(如集群流控、全局维度的权重策略调整)Sentinel 2.0 流量治理010203seata简介Seata的可观测实践总结与展望为什么需要seata?seata简介业务趋于复杂、规模不断扩大单库容量、性能瓶颈,向多库、多表架构演进单一本地事务多库多表分布式事务seata管理分库分表场景下的分布式事务为什么需要seata?seata简介单体应用分布式应用单一本地事务跨服务的分布式事务seata管理跨服务场景下的分布式事务组件架构seata简介事务协调器,维护全局事务的运行状态,负责协调并驱动全局事务的提交或回滚。Transaction C
7、oordinator(TC)控制全局事务的边界,负责开启一个全局事务,并最终发起全局提交或全局回滚的决议,TM定义全局事务的边界。Transaction Manager(TM)控制分支事务,负责分支注册、状态汇报,并接收事务协调器的指令,驱动分支(本地)事务的提交和回滚。RM负责定义分支事务的边界和行为。Resource Manager(RM)一个标准的分布式事务链路场景seata简介用户请求交易服务交易服务锁定库存交易服务创建账单账单服务进行扣款业务逻辑Business(TM)开启分布式事务,获取全局XIDXID 在微服务调用链路的上下文中传播,Storage(RM)、Account(RM)
8、、Order(RM)执行本地事务,并向TCregister、report分支事务Business(TM)向TC发起针对此XID的全局事务commit/rollbackTC调度此XID下的各个RM:Order、Account、Storage服务按序commit/rollback事务链路为什么需要可观测?Seata的可观测实践 seata在解决了用户易用、分布式事务一致性等问题时,需要多次消息交互;尤其随着微服务调用链路复杂度上升,必须引入可观测能力以作为观察、分析事务链路的依据。1.分布式事务消息链路较复杂 可观测能力可帮助我们直观分析异常链路,快速定位、解决问题;可选择性针对耗时高、资源消耗量
9、大的业务链路优化;2.故障排查难定位,性能优化无从下手 可观测能力一方面能提供可视化大盘,直观反应系统、事务等状况;还能存储历史量化数据,便于事务量化、资源评估。3.可视化、数据可量化可观测能力概览Seata的可观测实践可观测维度seata期望的能力技术选型参考Metrics功能层面:可按业务分组隔离,采集事务总量、耗时等重要指标性能层面:高度量性能,插件按需加载架构层面:减少第三方依赖,服务端、客户端能够采用统一的架构,减少技术复杂度兼容性层面:至少兼容Prometheus生态Prometheus:指标存储和查询等领域有着业界领先的地位OpenTelemetry:可观测数据采集和规范的事实标
10、准。但自身并不负责数据的存储,展示和分析Tracing功能层面:全链路追踪分布式事务生命周期,反应分布式事务执行性能消耗易用性方面:对使用seata的用户而言简单易接入SkyWalking:利用Java的Agent探针技术,效率高,简单易用。Logging功能层面:记录服务端、客户端全部生命周期信息易用性层面:能根据XID快速匹配全局事务对应链路日志-MetricsSeata的可观测实践Seata可观测模块的设计思路1.Seata作为一个被集成的数据一致性框架,Metrics模块将尽可能少的使用第三方依赖以降低发生冲突的风险Metrics模块将竭力争取更高的度量性能和更低的资源开销,尽可能降低
11、开启后带来的副作用配置时,Metrics是否激活、数据如何发布,取决于对应的配置;开启配置则自动启用,并默认将度量数据通过prometheus exporter的形式发布不使用Spring,使用SPI(Service Provider Interface)加载扩展Metrics模块设计Seata的可观测实践seata-metrics-core:Metrics核心模块,根据配置组织(加载)1个Registry和N个Exporter;Seata-metrics-api:定义了Meter指标接口,Registry指标注册中心接口;seata-metrics-exporter-prometheus:内
12、置的prometheus-exporter实现;seata-metrics-registry-compact:内置的Registry实现,并轻量级实现了Gauge、Counter、Summay、Timer指标;MetricsSeata的可观测实践指标体系Meter类型描述Gauge单一最新值度量器Counter单一累加度量器,可增可减Summary多Measurement输出计数器,将输出total(合计)、count(计数)和tps(合计/时间间隔),无单位Timer多Measurement输出计时器,将输出total(合计)、count(计数)、max(最大)和average(合计/计数)
13、,支持微秒为单位累计Metrics指标-TCSeata的可观测实践Metrics指标-TMSeata的可观测实践Metrics指标-RMSeata的可观测实践Metrics观测效果Seata的可观测实践Tracing分布式事务可观测seata为什么需要Tracing?1.引入seata后,对业务性能会带来多大损耗?主要时间消耗在什么地方?如何针对性的优化业务逻辑?seata的所有消息记录都通过日志持久化落盘,但对不了解seata的用户而言,日志非常不友好。能否通过接入Tracing,提升事务链路排查效率?对于新手用户,可通过Tracing记录,快速了解seata的工作原理,降低seata使用门
14、槛。TracingSeata的可观测实践SkyWalking是一站式APM领域的的佼佼者,所以早在2019年,seata社区就向SkyWalking社区提出了使用其可观测能力的诉求,并在2021年,两个社区合作,将seata的Tracing可观测进一步提升:1.Seata的性能可被更好的观测2.分布式事务执行过程有痕迹3.定位问题的提效seata的Tracing效果Seata的可观测实践业务场景描述图服务调用链路图Seata的可观测实践LoggingSeata的可观测实践可读性强、结构化清晰、重点运行时信息透出、可扩展性好等数据可视化监控告警日志存储日志采集日志格式设计Logging这一块其实
15、承担了可观测几个维度中兜底的角色。日志格式Seata的可观测实践线程池规范命名方法全类名可追溯重点运行时信息透出消息格式可扩展总结与展望metrics 总结:基本实现分布式事务的可量化、可观测 展望:更细粒度的指标、更广阔的生态tracing 总结:分布式事务全链路的可追溯 展望:根据xid追溯事务链路,异常链路根因快速定位logging 总结:结构化的日志格式 展望:日志可观测体系演进010203诞生背景发展历程未来展望诞生背景阶段一:Higress的诞生阶段二:Higress支持优酷Nginx网关迁移阶段二:Higress支持优酷Nginx网关迁移(续)阶段二:Higress在流量网关与微
16、服务网关的融合探索阶段二:Higress支持阿里中间件“三位一体”战役,推出商业化产品阶段三:Higress推出业内首个商业化Wasm插件市场阶段三:Higress支持Nginx Ingress Annotation平滑转换阶段三:Higress支持HTTP转Dubbo未来展望未来展望010203游戏云原生趋势游戏云原生化的困境与解法游戏云原生化的案例解析增效降本成为游戏行业主旋律,云原生技术红利释放大有可为用户隐私保护,游戏防沉迷、游戏版号的不确定性等。游戏买量智能化分层、自然量减少、靠技术手段增长行业竞争加剧,用户对高品质游戏的需求,精品化是必然趋势2022年中国游戏市场收入下降10.33
17、%,行业寻找新的增长点市场饱和后疫情时代,互联网行业用户时长减少,付费用户随之减少后疫情时代隐私保护增长方式游戏精品化云原生技术DevOps敏捷基础设施容器和编排微服务化CICD路由分发服务游戏服DbgateMySqlRedis数据层数据库服务SLBdispatchgate游戏服务gameAPI路由平台交互服务订单 multiSLSKafkaDataX游戏数据平台FlinkDataworksMCHologresBI数据集成数据应用离线计算实时计算CDNOSS游戏下载OpensearchACKEIPSLBRDSRedis游戏主站ACKEIPSLBRDSRedis游戏平台双活架构ACKEIPSLB
18、RDSRedis上海北京DDOSDDOSDCDNWAF游戏发现游戏下载平台调用游戏服直连访问游戏服服务调用数据采集数据采集短信SLSMail内容安全公共服务PAI数据采集游戏游戏数据数据发行发行平台平台平台平台安全安全下载下载游戏容器化现状:平台容器化比例大,游戏服容器化比例小游戏行业容器化调研:效率是核心诉求,新业务进展快于存量业务客户名称主营游戏类型价值诉求国内 or 海外云原生化节奏规划概述拜访总结*MOBA/卡牌/策略资源效率/运维效率海外为主平台完成,游戏计划中有计划*卡牌/策略弹性国内/海外平台完成,游戏少量有计划*卡牌弹性,运维增效国内*已上线*动作RPG/卡牌资源效率国内/海外
19、平台服容器化中,游戏服架构已完成后续自研游戏服上容器有计划K8s:熟悉阶段OpenKruise:暂未接触*卡牌/RPG运维增效海外客户是游戏代理公司,发力自研游戏后会把自研游戏服部署在容器上自研项目规划中*休闲弹性,降本增效国内游戏服、平台服已经容器化已上线*休闲运维增效国内/海外平台服、游戏服均容器化已上线*二次元运维增效国内平台服容器化已上线*RPG运维增效国内Linux部分在用ACK,Windows部分直接用docker已上线*多种运维增效国内平台服部分容器化已上线*策略运维增效:-停服、启服会比较快-热更新(sidecar set)国内/海外新游游戏服已经 K8s 容器化,当前还没上线
20、,使用已经大半年自研框架项目规划中K8s:深度使用OpenKruise:深度使用*多种运维增效国内分工作室,很多工作室不了解 K8s,目的做技术储备-当前仅做了 Docker 容器化,没有走 K8s 编排-其实只是使用了容器的进程隔离管理,当轻量虚拟机用有计划*卡牌/策略运维增效国内拥有一个容器支撑的游戏 PaaS,-新游戏海外版,已经在容器上,一两百台服务器-存量核心游戏还没迁移有计划*SLG 策略运维增效国内/海外将 K8s 当 Supervisor 来用,其实就是把容器当虚拟机看了已上线K8s:使用很浅,非标用法OpenKruise:不了解新游戏几乎所有的新游戏都在基于容器测试或者在进行
21、容器化休闲/卡牌类/平台卡牌类/休闲类游戏容器化程度较高,游戏平台几乎都完成容器化能力诉求IP/端口固定,热更新,故障隔离和诊断,弹性伸缩等游戏容器化技术大图:阿里云开源多个插件助力游戏行业容器化PaaSPaaSTerraform/CADTTerraform/CADTACK OneACK OneKubeVelaKubeVelaFinOpsFinOps成本套件成本套件CICDCICDOpenKruiseGameOpenKruiseGameSkynetSkynet无状态化无状态化AgonesAgonesMetricsMetricsiLogtailiLogtail开源开源OpenTelemetryO
22、penTelemetry应用应用镜像镜像代码代码服务化服务化游戏框架标准化游戏框架标准化OCGIOCGIIstioIstioOpenSergoOpenSergoAppActiveAppActiveSeataSeataNacosNacosSentinelSentinelChaosBladeChaosBladeFluidFluidKubeflowKubeflowArenaArena应用和交付应用和交付平台服平台服游戏服游戏服大数据大数据AIAI多云多集群管理多云多集群管理ACKACKACK DistroACK DistroASKASKACKEdgeACKEdgeASKEdgeASKEdge公共云公
23、共云多云多云边缘云边缘云客户客户IaaSIaaSKataContainerKataContainer龙蜥龙蜥KoordinatorKoordinatorACKACK差异化差异化SLOSLOOpenYurtOpenYurtKubernetes APIKubernetes API可观测性可观测性游戏容器化价值总结:研发效率、资源效率、架构创新云原生技术提高软件和服务的交付效率,即提高游戏研发/创新效率游戏业务统一资源池,提高固定资源池部署密度,提升弹性资源池使用比例游戏平台游戏游戏游戏游戏固定资源池弹性资源池弹性资源池弹性资源池云原生产品生态,易于游戏开发者进行游戏架构创新,安全能力,可观测性等。
24、小团队快速迭代去中心010203游戏云原生化的趋势游戏云原生化的困境与解法游戏云原生化的案例解析OKGOKG特性介绍特性介绍 全品类游戏场景兼容全品类游戏场景兼容OKGOKG特性介绍特性介绍 多种网络模型自动适配多种网络模型自动适配OKGOKG特性介绍特性介绍 灵活弹性策略降本增效灵活弹性策略降本增效010203游戏云原生化的趋势游戏云原生化的困境与解法游戏云原生化的案例解析案例分享案例分享 H5H5卡牌游戏卡牌游戏案例介绍:游戏平台(冠赢)冠赢互娱是一家网游自研、发行为一体的游戏公司。通过OpenKruiseGam e实现了自研Paas游戏平台的交付。?vsw i tchgam e cont
25、ai nerGam eServer-G1-0C onfig Vol um eN ATO SS BucketG am eServerSet-G 1gam e contai nerGam eServer-G2-0C onfig Vol um e游戏平台的核心业务场景:?游戏脚本、配置热重载?NAT网络IP直连?自定义服务质量状态告警G am eServerSet-G 2Kube-Event案例分享案例分享 PVEPVE类型游戏类型游戏010203云边协同云边协同OpenYurt架构及重要特性OpenYurt在云边协同的落地案例04总结和展望边缘计算快速发展万物智联的时代,越来越多企业希望在靠近端侧
26、或者数据源头的边缘侧使用智能边缘服务。使连接更敏捷、业务实时性更高,减少中心云和网络带来的传输束缚。Gartner预计到2029年,将有超过150亿台物联网设备连接至企业基础设施。边缘网关大型数据中心大型数据中心中心云中心云边缘数据中心边缘数据中心边缘站点边缘云边缘云带算力端设备边缘盒子终端终端手机,普通摄像头,机器人,传感器,以及各式各样的微型终端手机,普通摄像头,机器人,传感器,以及各式各样的微型终端边缘计算(边缘计算(Edge Computing Edge Computing)边缘计算是相对传统集中通用计算而言,将工作负载边缘计算是相对传统集中通用计算而言,将工作负载部署在边缘部署在边缘
27、的一种计算方式;的一种计算方式;分散式运算架构,分散式运算架构,靠近靠近物、数据源或用户的地方进行物、数据源或用户的地方进行应用计算与数据存储;应用计算与数据存储;边缘计算边缘计算四大驱动力四大驱动力:延迟:延迟/确定性,数据确定性,数据/带宽,带宽,有限的自治权,隐私有限的自治权,隐私/安全性。安全性。边缘计算的核心目标是边缘计算的核心目标是快速决策快速决策。行业行业:汽车、农业、交通、医疗保健、运输、国防、能源、:汽车、农业、交通、医疗保健、运输、国防、能源、航空、制造业、采矿、石油和天然气、自然资源、电信和航空、制造业、采矿、石油和天然气、自然资源、电信和公用事业公用事业云边协同Gart
28、ner发布的十大战略科技发展趋势报告中说道“从云到边缘(Cloud to the Edge)”被视为未来科技发展重要趋势云计算:海量数据存储,分析,长期在线服务边缘计算:更靠近端设备,擅长于海量设备管理,实时,短周期数据处理分析。云计算和边缘计算相辅相成,有机结合,实现高效的云边协同,才能更好的满足客户日益增长的业务需求。Infrastructure EdgeE.g.CDN,ENSDevice EdgeE.g.工厂、园区、楼宇、机场、设备网关云计算边缘计算云端统一管控边缘适度自治设备就近接入支持多种设备接入协议AI预测实时计算直播、转码云游戏+需要一套完备的技术体系来承载云边协同云原生加速云边
29、协同云原生的概念最早是在2013年被提出,经过这几年的发展,尤其是从 2015 年 Google 牵头成立 CNCF 以来,云原生技术开始进入公众的视线并逐渐演变成包括 DevOps、持续交付、微服务、容器、基础设施,Serverless,FaaS等一系列的技术,实践和方法论集合。Edge ComputingEdge ComputingCloud ComputingCloud Computing 在任何基础设施上提供和云上一致的功能和体验:实现云-边-端一体化的应用分发;更加安全的工作负载运行环境,流量控制、网络策略等能力 云原生技术对异构资源的适用性逐步提升,在物联网领域,能够很好的支持多种
30、CPU架构(x86-64/arm/arm64)和通信协议,并实现较低的资源占用010203云边协同OpenYurtOpenYurt架构及重要特性架构及重要特性OpenYurt在云边协同的落地案例04总结和展望OpenYurt 简介1 多地域应用管理2 边缘自治能力3 跨网络通信4 云原生设备管理010203云边协同OpenYurt架构及重要特性OpenYurtOpenYurt在云边协同的落地案例在云边协同的落地案例04总结和展望1 ACKEdge 阿里云云原生业务新边界2 冬奥会奥运场馆智能验票业务3 网约车自动驾驶ChallengesSolutionResult 较低的运维效率:apt in
31、stall 定制化交付:定制CI、CD 系统,缺少通用方案 运维困难:车辆运行状态,监控,日志,远程运维安全 有限资源限制:CPU/内存有限,需要给业务预留更多资源 统一交付:云原生、容器化能力 全局灵活管理:全局监控,日志数据采集、OTA能力 增强型安全运维:双向认证和加密,云边运维通道 低资源利用率:减少不必要的组件安装,降低资源消耗 提高60%运维效率 降低50%资源使用率4 智慧物流拦截件业务 申通快递申通快递IoTIoT云边端架构是快递行业在边缘云边端架构是快递行业在边缘侧演进云原生架构的首例落地方案侧演进云原生架构的首例落地方案 提供提供同云上研发体系完全一致的研发模型同云上研发体
32、系完全一致的研发模型,实现云上和云下资源的统一管理实现云上和云下资源的统一管理 提供边缘开箱即用的容器化隔离应用环境提供边缘开箱即用的容器化隔离应用环境,边端应用相互间影响范围大幅缩小边端应用相互间影响范围大幅缩小,边缘高边缘高可用可用,稳定性从稳定性从9999.9 9%提高到提高到9999.9595%云边协同的一体模式云边协同的一体模式,统一的监控体系统一的监控体系,研研发模型发模型,同云应用开发效率和体验一致同云应用开发效率和体验一致,云云原生边缘原生边缘DevOpsDevOps平台平台,统一快递行业面向统一快递行业面向边缘边缘IoTIoT场景的研发场景的研发,运维场景运维场景,整体边端整
33、体边端体系体系RTRT降低到平均降低到平均5050msms以下以下。5 智能路测停车系统400万像素摄像头(可利旧)道路停车AI一体机(停车小脑)比传统高位视频AI相机的优势算力充足:跟踪车辆动态轨迹,跟踪时间更长;可识别25种道路停车异常场景,识别准确率更高,可达97%,比业界平均水平高10%软硬分离:AI算法与摄像头分离,摄像头选择余地更大,支持多家主流厂商的高清摄像头设备利旧:可盘活存量摄像头成本降低:2路普通高清摄像头+一体机比 2路AI摄像头的整体成本低30%010203云边协同OpenYurt架构及重要特性OpenYurt在云边协同的落地案例04总结总结和展望和展望社区现状社区活动
34、2023/1/112023/1/11 第第7777次会议次会议容器化上云最佳实践瑶靖阿里云智能-基础产品事业部2023/02/22容器化上云最佳实践容器化价值 客户痛点 容器化价值 容器服务 ACK01ACK 核心优势 稳定安全 降本提效 无界兼容02客户案例 民生银行 任意门03012022/Q1,Forrester 容器企业平台评测:容器企业平台评测:全球领导者、产品能力第一全球领导者、产品能力第一图取自20202020年GartnerGartner competitivecompetitive landscapelandscape连续三年,国内唯一入选连续三年,国内唯一入选 Gartne
35、r 公共云容器公共云容器服务竞争格局,产品布局全球领先服务竞争格局,产品布局全球领先斩获信通院可信云容器类以及其他各类奖项斩获信通院可信云容器类以及其他各类奖项国内首批可信云容器解决方案(容器服务整体国内首批可信云容器解决方案(容器服务整体ACK)国内首批可信云大规模容器集群性能国内首批可信云大规模容器集群性能 卓越级卓越级国内首批可信云无服务器解决方案国内首批可信云无服务器解决方案-先进级(先进级(Serverless容器服务容器服务ASK)国内首批可信云服务网格解决方案国内首批可信云服务网格解决方案-先进级(服务网格先进级(服务网格ASM)中国电子四所(容器服务整体中国电子四所(容器服务整
36、体ACK)容器拉起效率测试容器拉起效率测试 3.4s/10000容器容器ISO9001/ISO20000/ISO27001/ISO27017/ISO27018/ISO22301/ISO27701/ISO29151/BS10012/CSA STAR/等保三级/PCI-DSS/公安部部标认证/工信部信创认证(测试通过)权威机构评测阿里云 ACK 云上生态集成存储云监控ARMSAHAS云安全中心可观测微服务引擎MSE文件存储 NAS块存储 Disk对象存储 OSS文件存储 CPFS弹性裸金属 EBM云服务器 ECSGPU 云服务器弹性计算 ESS负载均衡 SLB专有网络 VPC容器实例 ECISLS
37、ACR证书管理 KMS访问控制 RAM分布式任务调度SchedulerX服务网格 ASM一键打通所有基础设施,提供一站式企业级容器管理平台安全与合规微服务云上最佳运行环境一致性Kubernetes,无lock-in,最优的弹性管理多云、混合云最佳载体,云计算技术演进主航道阿里云 ACK 核心优势稳定安全全链路观测全托管节点无界兼容ACK OneACKEdge提效降本极致弹性云原生AI套件业务监控应用性能监控容器监控基础设施监控云监控可观测 全景图事件中心事件中心链路追踪PrometheusARMS 日志中心日志中心SLSSLSFrom blog of Peter Bourgon可观测-事件中心
38、开箱即用的事件中心灵活的告警事件订阅以事件为锚点的资源生命周期监控(节点/Pod事件)预置 Ingress 流量大盘可观测 日志中心审计日志应用日志对比项普通节点池托管节点池基础管理能力完整的节点池基础管理能力完整的节点池基础管理能力节点升级升级内容kubelet(原地升级)docker(替盘升级)containerd(替盘升级)OS镜像(替盘升级)用户手动触发节点池升级升级内容kubelet(原地升级)docker(替盘升级)containerd(替盘升级)OS镜像(替盘升级)在运维窗口内自动触发镜像ID更新(不影响存量节点)在运维窗口内自动触发节点池升级节点故障修复(自愈)用户手动触发【修
39、复节点故障】功能自动发现并尝试修复节点故障(自愈)节点CVE漏洞修复用户手动触发【修复节点池CVE】功能自动发现并尝试在运维窗口内触发【修复节点CVE漏洞】功能节点池弹性伸缩用户可配置的节点弹性伸缩能力用户可配置的节点弹性伸缩能力容器优化的OS(ContainerOS)手动更新OS镜像自动更新OS镜像稳定安全:免运维的全托管节点池稳定安全:容器安全体系基础设施安全,构建夯实的平台底座最小化攻击面,提供容器基础架构安全纵深防御,构建从供应链到运行时的一体化安全流程 镜像扫描/加固 镜像加签 云原生应用交付链 代码扫描 行为分析 镜像验签 策略实施(OPA)安全沙箱容器 机密计算 网络策略 应用配
40、置巡检 运行时威胁检测 容器防火墙ACRCodeUpACKACKSecurityCenter构建部署运行KubernetesECSPodPodPodPod抢占实例PodPodPodPodGPU 实例PodPodPodPod神龙PodPodPodPod虚拟节点ECIECIECIECIHPAPodPodPodPodPodVPAPodPodCron HPAPodPodPodPodPodPod应用层伸缩资源层伸缩提效降本:极致弹性https:/ Metrics Adapter提效降本:云原生 AI 套件基于 Kubernetes,全栈优化 AI 性能、效率和成本,帮助客户快速构建云原生 AI 平台Ji
41、ndofs阿里云AI服务开源AI框架异构资源调度与隔离优化ACK Kubernetes 集群容器服务 ACK公共云边缘云专有云AI 数据访问加速K8S 原生 AI 任务调度、生命周期管理异构算力监控PAIEMRAIACCACK 对 AI 负载类型在基础服务层的增强:云原生AI套件无界:分布式云容器平台 ACK One无界:ACKEdge 云边端一体化方案民生银行 IT 架构现代化中国民生银行的主要应用程序是以 C 语言和 Java 语言编写的,采用传统架构。“我们面临的最大挑战是怎么让传统的旧有应用程序能够适应云原生环境“。阿里云和民生银行共同建设的民生银行容器平台,构建起民生银行强大的云原生
42、生态体系,将管理视角和重心由以IT资源为核心转换成以应用业务为核心,标准化应用模型,提升应用研发效率和技术管控能力。借助民生银行容器平台,目前上线应用涵盖了AI 应用程序,区块链应用程序,大数据分析应用,以及容器化的数据中台,交付效率提高了3-4倍,资源利用率翻了一番,其中云原生化的数据中台为民生银行零售、公司、网金、供应链、监管等10余个业务领域的数据诉求提供支撑,涵盖100余项专业化金融场景、数百项数据服务,日均调用次数超1000万。资源利用率提升超过100%开发、运维和运营效率提高了3倍部署时间从若干小时减少到若干分钟入选CNCF官方案例信通院云原生十大优秀案例客户背景业务痛点产品方案达到效果云原生AI平台ACKAI推理集群AI训练集群云原生AI套件OSS