《钟仕骏- 新东方DevOps运维门户进阶之.pdf》由会员分享,可在线阅读,更多相关《钟仕骏- 新东方DevOps运维门户进阶之.pdf(28页珍藏版)》请在三个皮匠报告上搜索。
1、2023 DevOps 国际峰会 暨 BizDevOps 企业峰会 北京站新东方DevOps运维门户进阶之路钟仕骏 高级经理首师大毕业,现就职于新东方教育,曾就职于搜狐、快手。搜狐大厦资深老烟民,曾在搜狗、搜狐视频移动端NO工作过,负责运维及后台数据研发。快手第一位SRE,曾负责快手所有运维基础化建设,规划并参与了2020年春晚红包项目。现任新东方教育运维研发高级经理,负责企业基础架构标准化体系研究、自动化平台研发等。01平台需要解决的问题02我们是怎么做服务树的03案例分享04经验沉淀目录Content01DevOps平台的建立初期困境2023 DevOps 国际峰会 暨 BizDevOps
2、 企业峰会 北京站面临的困境:急需一体化平台集成,解决孤岛效应烟囱效应早期发展过程中,企业按照垂直个性化的逻辑部署IT系统,目独立采购建设,导致内部系统烟囱林立,很难做到数据互联互通。01数据孤岛新业务新市场的拓展过程中各内部系统没法直接复用和迭代,产生的新数据无法与原有的数据互通,加剧了数据孤岛的问题。02组织熵增各个平台功能单一化,平台与平台之间的协调配合、数据交互异常混乱,随着企业核心业务增长,却带来了效率低下的问题。032023 DevOps 国际峰会 暨 BizDevOps 企业峰会 北京站资源申请信息检索流程操作业务上线成本控制数据安全高效稳定问题1:哪些独立功能需要集成?2023
3、 DevOps 国际峰会 暨 BizDevOps 企业峰会 北京站资源获取资源位置资源类型项目节点云主机C端数据库云教室ES/Kafka小课堂申请流程IDC数据纳管私有云API同步公有云标准化的流程规范和体系化的工具建设是实施DevOps 的关键要素问题2:集成后如何方便地进行资源分摊?2023 DevOps 国际峰会 暨 BizDevOps 企业峰会 北京站集团集团业务线业务线项目集项目集项目项目应用应用一级-集团结构顶层,根节点二级-业务线各大机构、组织业务三级-项目集同类项目集合四级-项目各类研发立项五级-应用模块、APP组件等解决办法服务树2023 DevOps 国际峰会 暨 BizD
4、evOps 企业峰会 北京站云化资源上线发布PaaS管理数据平台安全中心集团业务线项目集项目应用集中授权通过服务树关联集成业务功能02DevOps与数据平台大数据研发体系的割裂与整合2023 DevOps 国际峰会 暨 BizDevOps 企业峰会 北京站E EL LK KHiveSQL/SparkSQLHive/HudiYARNHDFSK8SOSAmbari大数据基础平台大数据基础平台实时数仓(Real-time data warehouse)StarRocks系统日志业务日志业务数据业务数据埋点日志分布式数据库集中式数据库业务日志实时计算平台(streaming)SQL任务JAR任务Xst
5、ream增量数据分发CDC增量采集Filebeat采集报表系统实时大屏数据探索数据服务全量数据初始化Xdata(数据初始化)全量增量全量增量增量1、自研实时计算开发平台已经在项目上正式推广使用2、实现实时数仓交互式分析引擎框架统一标准化建设案例1:实时计算平台 大数据实时计算架构2023 DevOps 国际峰会 暨 BizDevOps 企业峰会 北京站案例1:实时计算平台 上下游通过流程串联2023 DevOps 国际峰会 暨 BizDevOps 企业峰会 北京站实时计算平台初版包括:7个功能模块,14个功能点。案例1:实时计算平台 需求细化,功能模块拆分2023 DevOps 国际峰会 暨
6、BizDevOps 企业峰会 北京站模块一:数据源管理模块二:队列权限管理模块三:任务ITEM管理模块四:任务约束表达式管理模块五:FLINK-SQL配置管理模块六:实时计算表单创建模块七:CI配置管理模块八:任务列表模块九:任务配置列表模块十:任务全盘操作历史模块十一:SINK 操作模块十二:资源统计模块十三:SOURCE树 白名单模块十四:宏管理模块十五:监控创建管理员1、2、3、4、5、13 公共8、9、12、15 用户6、7、10、11、14管理员 40%用户 33%公共 27%模块分布比例管理员用户公共案例1:实时计算平台 集成方案和功能实现2023 DevOps 国际峰会 暨 Bi
7、zDevOps 企业峰会 北京站建立自动化数据研发管理模型,由割裂变集成,通过数据驱动,将业务库表联动服务树,利用报警组机制将风险快速反馈至研发人员,推动研发改进分析模型,提升数据分析效率。目前上线了16个业务线,130+个分析任务,累积提单5300+节省了30%以上的跨平台人工调用、邮件数据传递成本。案例1:实时计算平台 数据处理能力升级-实时数据研发平台03DevOps与安全中心关于DevSecOps的一些CASE2023 DevOps 国际峰会 暨 BizDevOps 企业峰会 北京站红蓝对抗渗透测试边界入侵钓鱼地方校、机构客服提权生产环境SQL注入XSS/CSV垂直越权敏感数据检测敏感
8、资产识别规则任务模板安全中心管理合规漏洞事件APP合规闭环CA认证&KMS应用加固风险评估安全评分传输加密密钥存储CA认证托福Pro云教室东方甄选策略流程二级备份不容忍、不产生、不传递安全项目驱动开发-部分项目展示2023 DevOps 国际峰会 暨 BizDevOps 企业峰会 北京站案例2:APP闭环检测系统流程基于现有的APP安全检测设备的基础上,从管理和技术两个方面,对于集团下属APP进行安全合规管理,从而减低APP的安全风险。2023 DevOps 国际峰会 暨 BizDevOps 企业峰会 北京站目的为了进一步增强集团及下属分支机构所开发APP的安全合规性,降低相关APP因安全合规
9、风险被外部主监管部门的风险,充分利用集团现有的App安全检测设备,实现应用市场APP下载APP安全合规检查安全合规问题展示APP安全合规问题通报APP修复检查的全流程管理。1任务统一两款三方系统的交互模式,封装出高质量且具有一致性的后端接口,考虑到三方系统不可控因素过多,需要完善报错信息与检测状态的多样性,防止因外部系统崩溃导致程序不可预估的风险,另因外部系统接口不完善,还要建立人为结果录入的机制。成果对于存在的APP高危风险的APP问题,触发问题工单或邮件通知到各应用负责人,帮助其了解自己所负责的APP的风险的同时也变向的支持了公司的安全战略规划。32关键业务数据p APP纳管数量:8p A
10、PP检测次数:390p当前纳管APP检测平均分:60p线上高危漏洞:12p线上中危漏洞:16案例2:APP闭环检测系统架构2023 DevOps 国际峰会 暨 BizDevOps 企业峰会 北京站案例2:APP闭环检测系统DashBoard和详情页2023 DevOps 国际峰会 暨 BizDevOps 企业峰会 北京站传统密码认证CA机构自签认证公私密钥对认证优点:认证相对方便简单缺点:易于拷贝传递背诵优点:需要三方共同认证身份,传递无效缺点:实现较复杂,业内实践少优点:难于拷贝背诵缺点:仍可传递,且不常变案例3:CA认证中心2023 DevOps 国际峰会 暨 BizDevOps 企业峰会
11、 北京站案例3:CA认证流程图2023 DevOps 国际峰会 暨 BizDevOps 企业峰会 北京站案例3:CA认证中心实现安全登录04经验沉淀项目开发过程经验总结2023 DevOps 国际峰会 暨 BizDevOps 企业峰会 北京站业务板块聚焦上云及容器化精简申请流程闲置资源回收超额资源审核1.分为降本(资金和时间成本)和增效两环节;2.约整体降本30%,增效40%,加速投产。降本增效的经验:聚焦和成本控制2023 DevOps 国际峰会 暨 BizDevOps 企业峰会 北京站复制牛人经验,提高作战能力核心模块抽象,高内聚低耦合架构微服务化,增加通用接口文档定期沉淀,鼓励知识共享wiki、技术公众号利用网关接口路由实现基础能力可重用避免重复造轮子技术提效思维2023 DevOps 国际峰会 暨 BizDevOps 企业峰会 北京站目标定义需求分析目标拆解阶段实现 方向统一原则 明确拆分依据 需求分级拆解 定义类别属性 沟通业务痛点 了解现有资源 熟悉运维流程 构建基本思路 明确需求方向 确认优先级 确认需求难度 规划实现方针 依据优先级 阶段性产出 管理时间分片 目标达成率运维业务研发精进过程2023 DevOps 国际峰会 暨 BizDevOps 企业峰会 北京站ThanksDevOpsDevOps 时代社区时代社区荣誉出品