《基于ACK One 实现简单的跨云协同 让业务管理更高效.pdf》由会员分享,可在线阅读,更多相关《基于ACK One 实现简单的跨云协同 让业务管理更高效.pdf(33页珍藏版)》请在三个皮匠报告上搜索。
1、基于ACK One实现简单的跨云协同让业务管理更高效庄宇阿里云高级技术专家Contents目录01分布式云容器平台ACK One02注册集群-接入和管理不同形态K8s集群03边缘集群-接入和管理边缘计算资源04多集群舰队-统一管理多个K8s集群05全托管Argo工作流集群分布式云容器平台ACK One01分布式云已经成为新常态 Gartner报告中,到 2025 年,50%的大型企业将在他们选择的地域通过分布式云服务实现业务模式转型 Forrester 报告中,未来 89%的企业至少使用两个云,74%的企业至少使用三个甚至更多公共云。Gartner报告指出,安全、运维复杂性、财务复杂性是多云架
2、构的主要挑战。分布式云容器平台ACK One云上弹性多集群应用分发备份恢复云上云下一致体验ACK One Fleet 统一运维与安全统一资源调度统一应用交付统一备份恢复Open Cluster Management3rdK8s connector公共云边缘本地数据中心K8s 集群K8s 集群K8s 集群三方公共云K8s 集群多集群运维管理使用ACK One统一管理多个K8s集群,提升安全水位和业务连续性,减少25%的资源用量,运维效率提高80%混合云负载感知弹性,5分钟实现业务数万核扩容。(以上数据为客户业务场景应用结果)注册集群-接入和管理不同形态K8s集群02ACK One注册集群架构云上
3、云下一致的运维体验注册集群 2注册集群 3ACK One 注册集群本地数据中心阿里云K8s ClusterKCM/SchedulerAPI Server三方公共云K8s ClusterAPI ServerKCM/SchedulerAgent PodAgent PodARMS(APM)SLS(Logging)PrometheusSecurityMSE 微服务注册集群 1其他账号ACK 集群ASM 服务网格云上弹性Virtual Kubelet(ECI CPU/GPU)Node Pool(ECS CPU/GPU)FinOps场景1:云上弹性ACK One 注册集群 节点池弹性调度Virtual n
4、ode 弹性容器实例 ECI ECS NodePool按量计费节点池 ECS WorkersPodPodPodPodPodPodPodPodPodOScontainerdkubeletECIECIECIECIECIECIECIECIECIECIECIECIVirtual node Pool工作流/流水线云网络侧 Terway CNI,CSI 云存储侧:NAS/CPFS/OSSIDC 节点PodPodPodPodPodPodPodPodPodOScontainerdkubelet调度优先级 调度优先级 调度优先级 在混合云工作流程中每天按需处理 400-1000 个癌症检测样本,每个病例的成本将
5、降低 60%。通过ACK One统一管理北京混合云集群,应对突发话题数分钟扩容30K core计算资源。通过ACK One统一管理北京,义乌,杭州多个云上云下集群,利用云上弹性资源处理基因分析下机数据,峰值 100TB/天.场景2:云上云下一致的运维体验(可观测)MonitoringEvents and AlertingARMS PrometheusEvent Centerfrom SLSPrebuilt Dashboard for Ingress access log from SLS场景3:云上云下一致的运维体验(安全)配置巡检:1.安全性:特权参数配置,高危内核 Capabilities
6、,root 用户启动,未开启 TLS 的 Ingress,匿名用户权限绑定等。2.有效性:CPU/Memory 资源配额限制缺失等 3.稳定性:liveness 和 readiness 探针缺失,单副本启动等 运行时安全检查:对存在恶意进程的容器进行检查,并通过钉钉发出警报 策略管理:限制容器以特权模式启动,重要命名空间防删除等基于容器安全最佳实践,一键化免费检查多云/混合云集群应用配置安全,保证多云/混合云集群容器应用的安全性、有效性和稳定性。发现应用配置潜在的安全稳定性隐患。场景4:云上云下一致的运维体验(成本)使用ACK One统一管理多个K8s集群,提升安全水位和业务连续性,减少25%
7、的资源用量,运维效率提高80%Cost Insight迁移到云上成本估计成本和归属可观测Cost Control成本预测预算告警公共云本地数据中心ACK 集群 /ACK One 注册集群 多视角成本洞察:Cluster/namespace/node pool/application 成本治理:浪费发现,成本预测,预算告警 开放:支持OpenCost标准和集成KubeCost(以上数据为客户业务场景应用结果)场景5:应用与数据的备份恢复用户数据中心 混合云存储容灾(Hybrid Backup Recovery-HBR)数据灾备库应用上云数据灾备业务容灾异地多活提供跨地域和数据中心的应用一致性备份
8、和秒级恢复,帮助用户业务应用快速上云提供跨地域和数据中心的有状态应用备份,支持备份策略和恢复策略提供跨地域和数据中心的应用和数据容灾提供兼容Kubernetes/开箱即用的两地三中心容灾系统,帮助用户搭建高可用系统场景6:混合云跨云数据访问接入第三方分布式存储:连接云上计算实例与云下存储加速存储访问:降低计算成本场景7:微服务治理注册集群 1注册集群 2ACK One 注册集群三方公共云 或 本地数据中心阿里云微服务引擎MSE服务网格ASMMSE控制面连接ASM控制面连接ASM 控制面连接MSE控制面连接云上ASM服务管理K8s集群中的服务网格云上MSE服务管理K8s集群中的微服务K8s Cl
9、usterDeploymentServiceConnectorK8s ClusterDeploymentServiceConnectorDemo 通过注册集群使用云上Severless ECI运行大模型应用注册集群 1ACK One 注册集群阿里云Virtual Kubelet(ECI CPU/GPU)云上弹性2.onectl:注册集群创建,接入,组件安装3.kubectl:创建应用4.使用云上资源笔记本Kind K8s ClusterDeploymentServiceConnector1.创建Kind K8s集群Demo 通过注册集群使用云上Severless ECI运行大模型应用边缘集群-
10、接入和管理边缘计算资源03边缘集群 ACK Edge 云边协同一体化ACK Edge-Container Platform for Edge and IoT DevicesInsta 360是专业的运动相机和全景相机制造商,产品远销200+国家和地区,借助ACKedge平台来管理相机工厂里的计算设备,可以快速的将工厂里的相机校准视频上传,也可以从云端下发校准参数到工厂,极大的提高了生产效率借助ACK Edge平台,成功整合了云上PaaS平台和边缘端服务,将云原生技术扩展至边缘侧。这不仅提升了服务稳定性,还显著提升了用户验票体验,将人均验票时间缩短了70%。同时在北京冬奥会和杭州亚运会等大型赛事
11、的500+场次项目中,成功处理了近300万张的验票。数据中心和场馆机房移动终端(以上数据为客户业务场景应用结果)New专线网络边缘节点池CEN+CCNCDN,ENS,IDC专线工厂、园区、楼宇、机场Lite Kubelet主机网络模式节点池大规模轻量化接入NewACK Edge(Powered by OpenYurt 1.4+ACK Pro)非侵入能力阿里云生态融合边缘自治异构资源支持跨地域网络通信多地域工作负载云边混合弹性OTA升级日志服务云监控云安全Prometheus设备和终端数据中心和机房Raven普通公网节点池车载、交通、桥梁淘麦郎影石Insta360OpenYurt:非侵入的云边协
12、同平台多地域应用管理l节点池管理l单元化应用部署模型lService流量路由拓扑管理lNodePort端口监听隔离l边缘业务支持OTA升级01跨网络域通信03l实时流式通信的运维通道l云边低数据安全传输通道l基于STUN的边边高效通信l与原生K8s CNI网络无缝融合边缘自治能力02云原生设备管理04l边缘业务自愈能力l增强型的Pod驱逐管理l节点强绑定业务管理l云边管控流量复用l业界主流IoT解决方案(EdgeXFoundry)无缝融合l云原生设备管理模型Kubernetes零修改 设计理念 易于集成与被集成多集群舰队-统一管理多个K8s集群04多集群舰队架构本地数据中心K8s Cluste
13、rDeployment/SvcPolicyMulti-cluster svc应用分发流量控制Open Cluster Management公共云ACK ClusterKubernetes 资源分发安全策略全局监控统一控制面ACK One FleetDeployment/SvcPolicyMulti-cluster svcACK Cluster多集群应用分发GitOps-全托管 ArgoCDK8s ClusterDeploymentPublic CloudOn-PremServiceIngressACK ClusterDeploymentServiceIngresscompare/sync Se
14、rverless ArgoCDACK One FleetPlatform teamsDeveloper teamsDevelopercommitGitOpen Cluster ManagementHelm repoContainer registrydocker pushupdatewatch and pullACK One GitOps 应用分发优势:全托管开源ArgoCD,提供ArgoCD原生CLI和UI体验。专属ArgoCD控制台域名,集成阿里云账号SSO登录,支持多用户权限设置。多集群分发,ACK One关联集群自动加入ArgoCD。GitOps优势:可靠性强:Git作为应用部署的唯一
15、来源,提供版本控制、回滚和审计能力。安全性高:开发者使用GitOps无需任何K8s集群权限应用持续部署:K8s集群和Git仓库中的应用状态自动同步基于ACK One实现多集群CICD1.向业务代码Git仓库提交代码。2.全托管Argo工作流集群自动运行CI任务build镜像,推送到ACREE镜像仓库。3.GitOps发现新的镜像版本。4.GitOps回写到应用部署代码Git仓库。5.GitOps发现应用部署代码Git仓库变化,拉取部署YAML。6.自动同步部署新镜像到Dev集群,并验证Dev集群中的应用运行是否符合预期。7.手工触发生产集群(Production)部署,并与验证。Argo CD
16、Application for Dev ClusterApplication forProduction ClusterWatch&updateACREE 或全托管Argo工作流2 构建&推送镜像1 提交代码变更ACR EE3 Check镜像变更业务代码仓库应用部署仓库4 回写变更5 pull yamlsdeploymentACK One FleetDev ClusterProduction Cluster6 自动发布7 手动发布GitOpsdeployment流量管理-多集群网关ServiceACK ClusterACK ClusterDeploymentOperatorMultiple C
17、lusters Gateway ACK One Fleet Routing configEnd userTrafficTrafficTrafficAZ 1AZ 2Region 1ServiceDeployment 南北流量管理 全局Ingress网关(单地域)基于Ingress灵活的路由策略:weight,header,fallback 同城多可用区多活:灰度,容灾Demo-ACK One Fleet 案例:同城多活容灾1.双AZ,双ACK集群 -集群容灾2.ACK One GitOps 多集群应用发布-应用容灾3.ACK One 多集群网关,同城Global Ingress-流量容灾注意:数
18、据库和消息等同城容灾方案需参考相应云产品Demo-ACK One Fleet 案例:同城多活容灾全托管Argo工作流集群05全托管跨地域Argo工作流集群成本优化 自动选择多AZ/地域弹性算力,优化成本与效率高IO带宽 通过分布式数据缓存,提供20GB+/s聚合读带宽,支持跨地域访问。资源预测 通过负载感知自动调整资源规格规模化计算 支持千级并发工作流,数万计算任务事件驱动-支持Git、阿里云MNS、OSS等事件源触发工作流自动运行资源成本节省数据读吞吐提升(文件/对象存储场景,相较传统 NAS/OSS)规模提升文件存储NAS文件存储CPFS内置文件存储加速、对象存储客户端对象存储 OSS仿真
19、计算持续集成科学计算数据处理30%15倍10倍全托管Argo工作流集群分布式数据缓存NEW在12小时内完成处理数千例样本的处理,速度提升50%,成本下降30%.(以上数据为客户业务场景应用结果)地域-1托管 Serverless Argo 控制面可用区 A,B,C,按量 ECI Pod抢占 ECI Pod地域-2可用区 A,B,C,按量 ECI Pod抢占 ECI Pod按量 ECI Pod抢占 ECI Pod按量 ECI Pod抢占 ECI Pod全托管Argo工作流集群可用区 1ECI 运行工作流可用区 2ECI 运行工作流调度分布式Argo工作流集群OSSMNS三方系统(Argo SDK
20、)Gitpush commitworkflow apiargo cli/uiupload filegit eventoss eventoss eventArgo EventArgo WorkflowKubernetes控制面Event Bridgeeventevent挂载数据源ARMSSLSRAM认证授权监控日志OSSNAS持续集成基因计算数据处理Demo 全托管Argo工作流集群通过OSS事件触发工作流运行可用区1ECI 运行工作流调度分布式Argo工作流集群1.创建工作流2.upload filesoss eventArgo EventArgo WorkflowKubernetes控制面3.工作流处理数据文件OSSDemo 全托管Argo工作流集群通过OSS事件触发工作流运行分布式云容器平台 ACK One实现简单的跨云协同注册集群边缘集群多集群舰队全托管Argo工作流THANKS