《江正煜-多云融合下的IT资源管理体系建设实践.pdf》由会员分享,可在线阅读,更多相关《江正煜-多云融合下的IT资源管理体系建设实践.pdf(19页珍藏版)》请在三个皮匠报告上搜索。
1、多云融合下的IT资源管理体系建设实践国投证券 江正煜江 正 煜国投证券 运维开发专家在国投证券运维开发专家,具备8年运维工具建设与运营经验。当前专注于国投证券智能运维一体化平台建设,主导CMDB、ITIL及自动化等关键运维能力的建设与运营。深耕金融行业CMDB领域,曾深度参与多家金融机构的CMDB平台规划与建设。目 录contents01IT资源管理体系建设思路02IT资源管理建设最佳实践03降本增效:运维管理能力提升PART 01IT资源管理体系建设思路IT资源管理体系的几个建设阶段及建设目标IT资源管理体系建设历程基于IT资源的全生命周期管理流程,进行配置数据治理、运营和完善,以及各类消费
2、场景的建设。加速平台从配置管理进阶到IT资源管理,识别管理问题并推动优化,建设IT资源的全生命周期流程,实现闭环管理。场景建设运营明确CMDB作为核心数据源的定位,自上而下的推动下,建立技术+管理相结合的数据质量管控体系,持续提升数据质量。通过定期对账、自动化合规检查、一致性校验、消费场景建设等手段,深究数据问题根源,持续提升数据质量。数据治理建设统一的配置管理平台,实现公司内部的配置统一管理和术语统一.结合公司现状,梳理资源模型,制定相应管理规范。围绕核心模型,进行数据丰富,包括操作系统安装代理、各类基础资源平台集成、流程完善等。平台建设010203配置管理 IT资源管理 领导定义数据问题资
3、源管理问题数据反哺运维场景完善消费闭环IT资源管理平台定位研发及架构管理 IT资源管理平台(CMDB配置数据,支撑全局数据共享)基础资源采集云管平台云新平台信创私有云DBaaS容器云网管系统业务及标签信息北斗监控安全运营ITSM统一自动化架构可视化需求、项目DevOps运营管理安全运营管理平台IT服务ITIL流程数据资产管理平台PaaS平台运维管理工具统一自动化北斗监控日志大数据故障演练表单低代码布谷鸟通知云管平台DBaaSOA项目管理IAM研发管理及运营自动化运维巡检报表及大屏监控应急管理IT运维门户其它场景.项目及组织架构信息PART 02如何成功建设IT资源管理体系IT资源管理最佳实践多
4、云体系下,服务器资源种类繁多,分布散乱,基于来源进行分类,再抽象为操作系统进行汇总,实现管理的统一,并满足分类统计需求。分类与统一:数据融合机制IT资源图谱定义-模型定义和数据采集基于CMDB平台的统一资源管理,生成相应的资源图谱,覆盖多云资源环境 资源图谱的组成与功能轻量级IT资源生命周期管理流程IT资源生命周期管理过程与CMDB紧密结合,尽可能的降低用户表单填写工作,既保障数据的鲜活力和准确性,也能降低表单填写成本和误差,实现MRI(Minimum Required Information)轻量级的ITSM。统一监控业务感知APM监控运维大数据平台运维日志分析设备调配设备上架/资源申请研发
5、测试测试部署生产部署系统上线系统下线统一监控CMDB需自动化设备下架/资源回收设备搬迁结束运营监控采购入库设备需求资源回收流程设备搬迁流程资产管理系统设备上架流程带外监控系统资源平台采集PaaS平台自动化测试ITIL平台基础资源监控ITIL平台统一自动化设备下架流程消费场景与数据治理的相辅相成识别问题设定目标根因分析制定对策实施对策评价结果及过程持续跟进匹配率达到95%问题:1.监控覆盖度无法准确评估,监控纳管率不高;2.监控告警查询负责人或归属业务信息准确率不足90%;解决方案收益:支撑IT资源监控体系建设的同时,也CMDB自身的资源完善度及准确度带来提升。每日、每周跟进已达到95%以上CM
6、DB标记应纳管监控平台实际纳管分析原因:l 按类解决问题l 解决TOP问题l 找到根本问题IT资源图谱多维可视化资源可视化举例:l 系统资源增长趋势图l 操作系统虚拟化率l 机房资源3D视图l 系统架构图各团队服务器虚拟化率系统服务器资源增长趋势图系统架构图机房机柜3D视图PART 03IT资源精细化管理,保障系统运维既要省、又要稳降本增效:运维管理能力提升IT资源成本分摊模型底座IT成本分摊数据模型图:基于IT资源统一管理,输出基础资源配置及关联拓扑支撑IT成本分摊的数据模型构建,输出多维度成本数据,推动降本增效。系统资源优化及容量规划支持 CMDB的IT资源图谱与监控性能数据结合,输出容量
7、视图及低利用率主机报表,推动资源合理化使用深度分析及优化。混沌工程实践支撑故障演练平台:CMDB平台支撑工具加速建设 新增资源可自动同步IT资源图谱 对于单一演练场景可基于系统清单批量创建 资源权限控制基于CMDB中的系统及关联的组织架构信息混沌工程:基于系统的IT资源图谱进行故障演练 根据应用资源自动生成系统架构图谱 识别关键节点针对性场景设计 主机节点关联告警分析场景化运维管理能力运维精细化:ITSIA-IT服务连续性管理智能运维:算法结合资源拓扑提高运维效率GOPS 全球运维大会 2024 深圳站T h a n k s高 效 运 维 社 区D e v O p s 时 代荣誉出品感谢大家观看