《鹏华基金李学森-鹏华基金研运一体化平台落地实践.pdf》由会员分享,可在线阅读,更多相关《鹏华基金李学森-鹏华基金研运一体化平台落地实践.pdf(27页珍藏版)》请在三个皮匠报告上搜索。
1、研运至简,创新无限鹏华基金研运一体化平台落地实践鹏华基金 李学森目录CONTENTS01一体化技术平台的思考02运维“监、管、控”一体化建设03研发“效能工具链”一体化建设04平台能力自主扩展,探索数字化转型目录CONTENTS01一体化技术平台的思考02运维“监、管、控”一体化建设03研发“效能工具链”一体化建设04平台能力自主扩展,探索数字化转型研发运维发展演进:烟囱林立,人工为主复杂系统确定系统全面推进数字化建设的过程中,业务系统开发复杂度日益增加IT流程灵活性差,流程分散在多个内部系统工具烟囱,碎片化工具多,存在多套监控系统自动化程度低、日常巡检工作依靠人工脚本研发工具分散,各个工具之
2、间数据孤立存在,无法形成统一模型和高质量的数据沉淀研发过程管控弱,缺少研发体系的规范化、标准化和流程化鹏华基金是一家总资产管理规模过万亿、累计服务客户过亿的公募基金管理公司,公司致力于打造业界一流的综合资产管理平台,金融科技在服务公司各业务领域数字化建设中起着至关重要的作用。业务、技术的复杂度不断提升,技术团队规模不断发展,支持技术工作的研发和运维平台在灵活性、拓展性和效能方面存在不足,规划建设一体化平台,支持金融科技团队工作效能的提升。破局:践行“系统+流程+数据”三位一体打通需求-交付-运维-运营的全流程闭环,基于组织、流程、工具的联动,提高企业研发效能、运维效率和运营价值,助力市场竞争与
3、应变!组织协同业务支撑研运能力项目经理开发业务部门研发经理运营测试运维质量CI(研发)CD(运维)CO(运营)面向研发面向运维面向运营实现需求-交付-运维-运营的全流程闭环管理研发、运维、运营过程部署/发布监控/作业项目协同编码开发持续集成测试/质控管控/服务运营/优化人流程工具平台层能力共享低代码+框架开发+流水线+托管服务破局:建立体系化的研运支撑能力,推进IT数字化及业务数字化转型业务全流程贯通数据资产沉淀能力持续改进CI(持续集成)CD(持续部署与运维)CO(持续运营)研发运维一体化平台一体化平台建设需要考虑的问题效率ABCD不重复造轮子引入平台及现成工具平衡内外部成本定制开发和自主开
4、发并行关注技术人员能力提升运维开发能力研发管理能力从研发、运维到运营人员与组织的价值提升成本能力转型建设平台引入工具定制开发自主扩展自主开发运维平台发展阶段系统系统人工自动化平台化数据化智能化专家运维脚本编辑经验固化到工具多个独立工具运维开发自动化工具链运维服务化Data OpsAIOps自动化工具链运维服务化大数据平台系统数字化可视化自动化工具链运维服务化大数据平台系统数字化可视化机器学习智能决策人决策人执行100%100%人决策人执行100%80%系统人决策人执行80%80%系统系统人决策人执行80%95%系统系统人决策执行95%100%引入运维PaaS平台建设自动化场景建设自动化运维流程
5、当前阶段深化端到端联动一体促进研发运维数据融合建设运营度量体系未来目录CONTENTS01一体化技术平台的思考02运维“监、管、控”一体化建设03研发“效能工具链”一体化建设04平台能力自主扩展,探索数字化转型监、管、控 联动一体CMDB自动化运维监控中心ITSM移动端告警通知配置数据消费配置数据消费工单信息、处理配置录入自动发现配置数据消费任务执行运维PaaS平台身份验证用户同步用户认证用户认证配置数据回写待办工单信息、处理鹏华OA门户访问跳转访问跳转AD告警处理告警中心采集下发运营大屏运营数据LinuxWindows小型机Docker虚拟机物理机存储设备网络设备IT基础设施业务系统、中间件
6、、数据库等纳管对象流程化、规范化、自动化:所有IT内部服务在线自助化通过平台底座的流程引擎能力重塑运维服务流程,融入自服务、敏捷化、协同化运维思想。流程驱动运维工作,流程与自动化无缝融合无缝融合,为业务提供安全高效的服务支撑。服务运营服务供给服务构建利用平台流程编排能力,自主设计实现IT相关流程需求(1000+工单受理)、事件(300+工单受理)、变更(2000+工单受理)安全漏洞应急演练主机服务(主机自动注册CMDB)配置驱动自动化,打通数据流、操作流和管理流,形成工作闭环配置主数据识别定义控制审计资源人员过程技术用户服务交付IT服务管理(ITSM)CMDB不再等待信息配置信息、监控信息、沟
7、通上下文、告警信息、应用信息、人员信息标准结构化CMDB定义元数据,流程表单填写,资源交付标准均基于CMDB元数据定义管控建设统一告警体系,提升运维保障效能ELK日志监控eSight网络监控蓝鲸监控中心ITSM关键业务、致命告警转工单告警产生告警处理告警关单异常检测硬件监控管理员系统运维网络监控管理员服务台/值班人员告警处置完毕,关闭告警事件,形成闭环管理告警通知告警压缩降噪告警持续优化:根据告警处理过程发现的问题,新增、优化监控指标及告警收敛策略告警标准化和告警丰富,如获取告警对象的位置信息、业务信息、责任人等234568告警工单分派CMDB监控告警管理流程后台及其他操作说明告警中心监控告警
8、管理规范监控纳管及配置统一告警策略标准运维人员由运维人员完成监控告警配置SCP云平台REST-API推拉推推IT运维对象硬件服务器中间件数据库.主机 网络设备业务系统 自动化运维故障现场保留、进程重启等告警自动处理7NAS存储推TBDS推建设统一告警体系,提升运维保障效能自主扩展告警源插件,接入蓝鲸监控平台、SCP云平台、NAS存储、大数据TBDS平台、OCP平台、ELK日志等告警事件源告警标准化告警集中汇聚,将各类监控系统告警汇聚平台,统一集中式管理统一标准与规则,标准化告警事件 告警整合预警实现故障预警、故障告警,告警直达移动终端,探索故障自愈。告警联动消费自动创建事件工单,闭环管控告警事
9、件。无缝联动CMDB,丰富告警对象业务信息。目录CONTENTS01一体化技术平台的思考02运维“监、管、控”一体化建设03研发“效能工具链”一体化建设04平台能力自主扩展,探索数字化转型构建端到端研发效能平台,为研发全生命周期各阶段提供全面能力支撑建设前建设后在线文档Excel/WordNexusConfluenceJiraCTeam敏捷协同CCI持续集成CTest测试管理CPack制品管理蓝鲸PaaS平台蓝鲸DevOps平台APITestdbexecutorITSM奇安信安全卫士第三方系统集成容器平台移动端CodeCC代码检查CMeas度量分析社区版蓝盾1.各团队管理需求方式不统一,有使用
10、在线文档管理、有通过Excel/Word等线下文档管理、有通过confluence管理,各系统间的数据割裂,不利于统一管控;2.测试管理主要通过线下Excel管理,协作效率低、管理困难;3.没有建设企业级的统一制品库管理工具,无法保证依赖包的安全和可信;4.生产发布和测试发布平台不统一;5.第三方工具未打通,均是独立使用,无法实现各工具之间的高效协同;研发效能工具链统一3、奇安信安全卫士4、容器平台5、移动端消息通知1、dbexecutor:支持数据库脚本自动化执行;2、APITest:实现研发运维一体化的全生命周期管理将软件产品生命周期分为三个阶段(业务需求、需求实现、需求运营),将管理流程
11、与工程流水线相互衔接,按照规范设置的准入准出规则进行自动化控制,在确保产出物的质量的同时,提升研发整体效能。工程过程(DevOps)管理流程(ITSM)需求提出业务需求需求实现需求投产需求运营需求分析领导审批EPIC需求需求评审需求分析及拆分需求编码(本地)制品生成入库需求测试(功能/业务)(Ctest)代码库(Git)分支关联CI/CD(CCI)制品库(CPack)生产问题科技需求(手动)业务需求阶段需求实现阶段需求运营阶段状态数据回传投产申请变更实施消息通知消息通知CI/CD(CCI)应用系统生产环境制品抽取基线重置代码库(Git)业务验收工单状态校验手动操作实现开源治理:唯一可信源,控制
12、风险,高效协同云端仓库本地仓库依赖包申请查询判断结果反馈提交审批审批添加白名单白名单检查漏洞扫描填写申请信息:1、项目名称2、包名3、版本号4、依赖包类型上传二方包检查依赖包类型判断不通过填写不通过原因,提出替代办法通过存在不存在三方包二方包各类依赖制品统一管理,维护简单;建立唯一可信源,集中进行安全(开源许可证)扫描,可设置质量门禁自动禁用依赖包;白名单机制进一步确保制品安全;统一的权限管理,保障制品流动安全;集群方式部署,支持横向扩展,灵活应对高并发上传、下载场景;12345通过CPack接口查询实现多维度的研发效能数据度量5大维度,60+张图表,涵盖需求管理、测试管理、缺陷管理、代码管理
13、、发布管理研发全生命周期度量数据可视化。接入项目17个,全部按照DevOps平台标准实施指引接入,其中线上化管理需求1000+个,任务数3800+,测试用例数8000+,共建设自动化部署流水线100+条,自动化部署执行4000+次。目录CONTENTS01一体化技术平台的思考02运维“监、管、控”一体化建设03研发“效能工具链”一体化建设04平台能力自主扩展,探索数字化转型运维团队能力进阶:从脚本到运维开发 1、基于蓝鲸作业平台,实现脚本管理和共享,挖掘和复用现有的自动化工具 2、基于标准运维编排自动化流程,如软件安装、配置发布等,实现流程自动化、标准化 3、基于蓝鲸PaaS框架,低门槛、低成
14、本的Python类的轻运维工具开发,实现运维的自主可控030102运维场景自主扩展:支撑部门日常巡检统一管理巡检中心:利用蓝鲸平台开发框架,自研上层应用,并完成移动端开发,有效支撑部门日常巡检统一管理蓝鲸平台开发者中心,整合了通用的前后端开发框架,集成了统一登录,原子平台调用等,从传统运维向运维开发转型,打造一支自主可控的运维开发团队基于运维需求自主研发自动化SaaS,敏捷开发、持续迭代、一键部署,应对运维管理需求运维场景自主扩展,自主探索运维转型效能平台自研员工绩效门户,结合工单数据,展示研发效能指标,包括需求工单情况、需求完成情况、需求成本情况等需求指标,支持下钻明细列表运维通知管理中心为
15、加强运维过程管理,针对需求、变更、事件、巡检、安全等运维管理类通知场景,对接机器人,推送卡片消息提醒利用蓝鲸开发框架,结合IT管控场景,开发落地效能平台、运维通知管理中心等,探索运维转型研发场景自主扩展:流水线插件集成蓝鲸DevOps自主扩展实践:1.能力:平台提供插件开发和上线使用的能力,可以结合实际场景进行扩展;2.创新:配置管理团队由被动的响应所有研发团队的需求,变为主动的创新;3.共享:基于配置管理团队或研发项目组建设的插件,可以在内广泛推广和共享;运维开发展望:让CMDB从后台走向前台全生命周期管理监控告警资源平台全生命周期管理立项|研发资源交付上线投产运营维护系统下线应用发布应用拓扑版本信息告警屏蔽资源对象管理属性、关联拓扑应用系统状态应用系统信息应用拓扑主机等资源信息资产信息资源交付驱动资产对象状态作业平台应用拓扑故障处置主机对象消费场景统计报表资产信息维保信息CMDB(模型|实例|拓扑关系)基于CMDB数据消费场景的应用:以消费为导向,以自动化及管理手段为支撑,优化运维工作 让数据有价值,形成自循环流动:面向各团队提供全领域运维资产数据可视,方便开发组查询各自关联的资产数据,做到好用,易用,可用。支撑运营活动,清晰账目,摸清家底:面向各团队提供各组资源成本分析、资源用量分析等THANKS谢谢观看