上海品茶

ODCC:2021数据中心智能监控管理白皮书(35页).pdf

编号:64965 PDF  DOCX   35页 906.87KB 下载积分:VIP专享
下载报告请您先登录!

ODCC:2021数据中心智能监控管理白皮书(35页).pdf

1、 数据中心智能监控管理 白皮书 编号 ODCC-2021-06002 开放数据中心委员会 2021-09-15 发布 ODCC-2021-06002 数据中心智能监控管理白皮书 i 目目 录录 前 言 . iv 版权说明 . v 1. 术语说明 . 1 2. 发展现状 . 1 3. 数据中心智能监控管理平台架构 . 2 3.1. 平台技术架构 . 2 3.2. 平台部署架构 . 4 4. 数据中心智能监控管理平台业务功能 . 5 4.1. 运维工作台 . 5 4.2. 监控管理 . 5 4.2.1. 告警功能 . 5 4.2.2. 监控视图 . 6 4.2.3. 电力监控 . 7 4.2.4.

2、 暖通监控 . 11 4.2.5. 环境监控 . 13 4.2.6. 安防与消防监控 . 14 4.3. 运维管理 . 15 4.3.1. 巡检管理 . 15 4.3.1.1. 巡检任务管理 . 16 ODCC-2021-06002 数据中心智能监控管理白皮书 ii 4.3.1.2. 巡检计划管理 . 16 4.3.1.3. 巡检模板管理 . 16 4.3.1.4. 巡检逻辑区域管理 . 16 4.3.1.5. 巡检点管理 . 17 4.3.1.6. 巡检视图管理 . 17 4.3.2. 维保管理 . 17 4.3.2.1. 维保作业任务管理 . 17 4.3.2.2. 维保模板管理 . 17

3、 4.3.2.3. 维保作业项管理 . 18 4.3.2.4. 维保计划配置 . 18 4.3.2.5. 维保统计管理 . 18 4.3.3. 演练管理 . 18 4.3.3.1. 演练方案管理 . 18 4.3.3.2. 演练计划管理 . 19 4.3.3.3. 演练团队管理 . 19 4.3.3.4. 演练流程管理 . 19 4.3.4. 变更管理 . 19 4.3.4.1. 变更类型管理 . 19 4.3.4.2. 变更流程管理 . 19 4.3.4.3. 变更时间管理 . 20 4.3.5. 事件管理 . 20 4.3.6. 运维知识管理 . 20 ODCC-2021-06002 数据

4、中心智能监控管理白皮书 iii 4.3.7. 运维概览 . 21 4.4. 运营管理 . 21 4.4.1. 能效管理 . 21 4.4.2. 容量管理 . 22 4.4.3. 资产管理 . 23 4.4.4. 租户管理 . 23 4.4.4.1. 信息服务 . 23 4.4.4.2. 租户服务 . 24 4.4.4.3. 服务管理 . 25 4.5. 系统管理 . 26 4.5.1. 分权分域 . 26 4.5.2. 账号管理 . 26 4.5.3. 日志管理 . 27 5. 未来发展 . 27 ODCC-2021-06002 数据中心智能监控管理白皮书 iv 前前 言言 数据中心自身的定位

5、要求其在高稳定、低成本下运行,因此对设备状态监控、能源消耗、机房利用率以及人员、事件的管理提出了更好的要求,监控管理平台在此背景下应运而生。随着数据中心自身规模、数量的持续增长,政策方面对行业绿色、可持续的引导,对监控管理平台的要求也越来越高。近些年数据中心运行管理模式逐渐成熟,AI 相关技术不断取得突破,智能监控管理平台受到广泛关注。 本白皮书从用户需求角度出发,结合市场产品经验,对数据中心智能监控管理平台重新理解定义,目的在于为行业数据中心监控平台发展提供参考,助力监控平台标准化、智能化方向发展。 起草单位:百度、腾讯、中国信息通信研究院(云计算与大数据研究所) 参编单位:中国电信 起草人

6、(排名不分先后):吕行、李欣、王月、许可欣、饶云飞、翟骏、姚文奇 ODCC-2021-06002 数据中心智能监控管理白皮书 v 版权说明版权说明 ODCC(开放数据中心委员会)发布的各项成果,受著作权法保护,编制单位共同享有著作权。 转载、摘编或利用其它方式使用 ODCC 成果中的文字或者观点的,应注明来源:“开放数据中心委员会”。 对于未经著作权人书面同意而实施的剽窃、复制、修改、销售、改编、汇编和翻译出版等侵权行为,ODCC 及有关单位将追究其法律责任,感谢各单位的配合与支持。 ODCC-2021-06002 数据中心智能监控管理白皮书 1 数据中心智能监控管理白皮书数据中心智能监控管理

7、白皮书 1.1. 术语说明术语说明 BA:Building Automation 楼宇自动化 CFD: Computational Fluid Dynamics 计算流体动力学 DCIM: Data Center Infrastructure Management 数据中心基础设施综合管理, 是一种管理思想, 其定义了一套方法论和一套软件管理系统, 对数据中心的设备、设施、人力和能力进行统一的管理。 ITIL:IT Infrastructure Library IT 基础架构库 ITSM:IT Service Management IT 服务管理 PE:Power&Environment 动力

8、和环境 PUE:Power Usage Effectiveness 能源效率指标 RFID:Radio Frequency Identification 无线射频识别 VS:Video Surveillance 视频监控 WUE:Water Usage Effectiveness 耗水效率指标 2.2. 发展现状发展现状 数据中心监控管理平台发展已久,从 Gartner 提出 DCIM 概念至今已十余年,但行业发展相对缓慢。追溯原因不难发现,一方面整个市场对 DCIM 概念定义并不一致,缺乏标准化的认知和形态;另一方面,DCIM 在中国落地的动力相对匮乏,用户难以深切感受到产品所带来的价值。

9、受技术等多因素影响, 目前市场产品整体技术能力不足, 很多产品缺少核ODCC-2021-06002 数据中心智能监控管理白皮书 2 心竞争力, 这造成行业内监控平台厂商数量繁多, 质量参差不齐。 用户和厂商在产品理解、价格理解上不能达成一致,这也是市场面临的最大痛点之一。 3.3. 数据中心智能监控管理平台架构数据中心智能监控管理平台架构 3.1.3.1. 平台技术架构平台技术架构 数据中心智能监控平台是面向数据中心数字化、 智能化运营需求, 构建基于海量数据采集、汇聚、分析的服务平台,通过物联网、大数据、人工智能等新兴技术,构建更精准、实时、高效的数据采集体系,建设包括存储、集成、访问、分析

10、、管理功能的使能平台,实现数据中心技术、经验、知识模型化、软件化、 复用化, 实现数据中心各类创新应用。 包括数据中心智能监控平台包括边缘、平台、应用三大核心层级,如下图所示。 第一层是边缘, 通过大范围、 深层次的数据采集, 以及异构数据的协议转换与边缘处理, 构建数据中心智能监控平台的数据基础。 主要实现设备接入、协议解析和边缘数据处理三大功能。 设备接入:基于工业以太网、工业总线等工业通信协议,以太网、光纤等通用协议,3G/4G、NB-IOT 等无线协议将数据中心现场设备接入到平台边缘层。 协议转换:一方面运用协议解析、中间件等技术兼容 Modbus、OPC、CAN、Profibus 等

11、各类工业通信协议和软件通信接口,实现数据格式转换和统一。ODCC-2021-06002 数据中心智能监控管理白皮书 3 另一方面利用 HTTP、MQTT 等方式从边缘侧将采集到的数据传输到云端,实现数据的远程接入。 边缘数据处理: 基于高性能计算芯片、 实时操作系统、 边缘分析算法等技术支撑, 在靠近设备或数据源头的网络边缘侧进行数据预处理、 存储以及智能分析应用,提升操作响应灵敏度、消除网络堵塞,并与云端分析形成协同。 第二层是平台, 以容器、 微服务技术为基础架构, 大幅提高平台功能解耦和集成的效率。根据功能,平台的分层服务能力由六层构成。 数据汇聚层,实现边缘数据的汇总、二次加工及数据路

12、由。 消息服务层, 实现平台微服务之间的消息通信, 并为大数据处理提供数据源及存储能力。 数据存储层,根据不同的数据类型,对视频、音频、文本等异构型数据分别采用文件型数据库、 时序数据库和关系型数据库进行存储; 根据不同数据访问的频率,对数据进行冷热分区和缓存处理,提升数据访问速度。 计算框架层, 根据数据的业务处理特性, 提供针对实时计算的流计算平台和针对历史数据计算的批处理(离线)数据处理平台。 数据分析与处理层,利用数据存储、计算框架、AI 等基础设施,对数据进行分析、检索、挖掘,形成知识。 基础微服务层, 将平台的能力以微服务组件库方式向上提供开放能力, 供上层应用调用,支撑快速创新应

13、用。 第三层是应用, 基于平台层的数据及微服务功能实现应用创新, 形成满足不同数据中心、不同应用场景的 APP,包括数据中心运营工作台、设施监控、运维管理、运营管理、配置管理、性能/服务管理几大类关键应用。 除此之外,数据中心监控管理平台还包括 IaaS 基础设施,构成了数据ODCC-2021-06002 数据中心智能监控管理白皮书 4 中心监控管理平台的基础支撑。 3.2.3.2. 平台部署架构平台部署架构 数据中心监控管理平台的部署采用一体化扁平式端、 边、 云部署架构, 消除数据中心信息孤岛, 就近部署边缘, 并和云端实现云边协同。 部署逻辑图如下所示。 边缘层采用就近部署原则, 一般在

14、独立的物理单元部署边缘节点。 根据边缘端接入设备及应用的重要程度,边缘采用采集器和 PLC 两种模式。对于动环相关的设备、传感器接入采集器,对于暖通和电力设备推荐接入 PLC,一些非关键设备或传感器也可以就近接入采集器(对应上图红色虚线)。特别的,对于模块化机房的监测,可以以模块为单元,统一接入采集器或 PLC。考虑高可用, 可以根据数据中心的可用性等级需要, 对边缘层设备、 网络采用冗余配置。 云层部署数据中心监控管理平台及相关的应用模块,推荐私有云(IaaS)部署, 也可以采用物理服务器部署。 考虑高性能和高可用, 可以根据数据中心可用性等级及性能需求,采用双机或集群部署。 ODCC-20

15、21-06002 数据中心智能监控管理白皮书 5 4.4. 数据中心智能监控管理平台业务功能数据中心智能监控管理平台业务功能 4.1.4.1. 运维工作台运维工作台 运维工作台应根据不同角色的定位, 设置千人千面的工作台管理能力。 工作台应从全球视野到局部数据中心模组不同的维度展示相关运维信息,并且根据运维角色的不同,从管理者到专业运维人员均可呈现最值得其关注的信息。 除此之外,运维工作台通过整合基础设施与 IT 资源,围绕业务价值构建多维度的运维监控体系, 通过监控系统对象的指标、 健康度、 告警以及对象之间的关联关系快速发现、分析并定位故障。 运维工作台围绕着个人工作事件进行展开,针对当前

16、该角色的重点工作任务, 包括但不限于告警事件、 当日排班任务、 历史遗留问题处理等相关待办工作事项。 工作台整合了待办信息, 解决了多页面浏览的混乱低效, 让运维人员可更加专注于工作,提高工作效率。 4.2.4.2. 监控管理监控管理 4.2.1.4.2.1. 告警功能告警功能 智能监控平台需要提供一个统一告警管理模块,实现告警数据格式、内容、 策略的标准化处理和告警事件的关联分析。 告警的目的是为了保障系统的稳定性。告警功能的总体原则是及早预警、快速告警、不误告警、不漏告警。当前告警扮演着辅助运维工组的重要角色,随着 AI 技术的发展,智能告警将成为趋势,告警的重要性将得到增强。 告警应具备

17、以下能力: (1) 集中监控。集中监控。 智能监控平台告警对现场重要设备及子系统进行统一集中监控,拥有统一的展示及查询功能,可以根据事件的时间、级别、所属专业、系统或设备、事件的类型等参数进行分类展示及组合查询事件的关联事件、 关联设备、 关联ODCC-2021-06002 数据中心智能监控管理白皮书 6 流程等告警生命周期信息。 (2)(2) 准确无漏。准确无漏。 告警应保证准确, 因数据中心告警数量类别较多, 应该根据告警的重要性进行分级分类,不同级别的告警可按策略发送给不同的用户,不丢失告警信息,告警准确率 100%。 (3)(3) 快速响应。快速响应。 设备从告警产生到发出整个环节须在

18、短时间内完成,不同等级告警对应的响应时间可以有所区别,最长时间不超过 10s。当告警发生后,支持界面报警、声光报警、邮件报警、电话及语音报警等方式,第一时间向相关人员推送告警事件的详细内容,包括不限于时间、等级、所属专业、系统或设备、事件类型及关联事件和关联设备位置信息。要求响应人员能够快速甄别事件及时报障,同时也应避免非在岗工作人员接受报警信息。 (4)(4) 灵活配置。灵活配置。 数据中心智能监控平台具备告警规则库,规则能覆盖数据中心的所有事件。通过灵活的规则自定义,批量应用到不同的监控实例。规则类型包括阈值、延时、屏蔽、等级、通知方式等。 (5)(5) 智能化。智能化。 数据中心智能监控

19、平台具备告警知识库, 知识覆盖告警所对应的设备、 空间等资产信息, 发生告警时可智能关联到相关的告警处理预案, 也具备关联故障库推送相关故障处理方案。 告警也应具备智能收敛的功能, 通过知识库建立对应场景,对告警风暴进行溯源并收敛通知。 4.2.2.4.2.2. 监控视图监控视图 系统监控视图应采用友好的操作界面。 出于管理的实际需要, 监控视图的ODCC-2021-06002 数据中心智能监控管理白皮书 7 界面应可提供低代码的配置环境。提供丰富的绘图元素,例如:饼图、曲线、表格、 柱状图等, 以便管理人员进行界面修改。 对于同一类型设备展示采用同一展示界面,减少软件界面,提高系统运行效率。

20、 系统提供友好的人机仿真交互界面,通过 B/S 或 C/S 客户端浏览查看,以便实时掌握监控到的基础设施状态。 监控系统提供界面组态功能, 可以由用户自由地用各种图元,如曲线,流水线,柱状图,仪表,机柜等器件组合成仿真效果, 并能在数据中心发生变更时进行相应的变更。 通过仿真实际机房结构布局,让用户能更清晰、准确地定位故障点。 4.2.3.4.2.3. 电力监控电力监控 主要监控对象及监控指标 中高压变配电系统 数据中心的中高压变配电系统主要监测变压器、各种高压配电柜,包括各种中高压配电柜的运行状态和参数,变压器铁芯温度、变压器绕组温度以及风机状态等。通常情况下,中高压配电信息的监控内容由中高

21、压电力监控子系统通过通信协议提供。 发电机组 当市电供应中断后,由蓄电池组通过 UPS 对负载进行持续供电直至作为数据中心的后备电源的发电机启动运行。对发电机进行实时监控有利于保障发电机稳定运行,保障数据中心的电力供应。 通常需要监测的发电机运行参数(状态)包括,三相输出电压,三相输出电流,输出频率,输出功率参数,及其工作状态(运行、停机)、工作方式(自动、手动)、市电故障状态;还有发电机蓄油罐的液位、润滑油油温、油压等参数也是需要监测的内容;另外,可根据情况考虑监测其运行时间、转速、水温(水冷)、皮带断裂(风冷)、启动失败,过载状态、报警ODCC-2021-06002 数据中心智能监控管理白

22、皮书 8 信号、故障信号等;并机系统工作状态(自动/手动),报警信号、故障信号。 监控管理系统要能够实现对发电机的控制,包括发电机组的开/关机、紧急停车、主备用机组切换等。 低压进线配电系统 低压进线配电系统,主要是监测进线配电柜的运行状况。通常的监测内容包括,三相电的相电压、线电压、相电流、频率、功率(有功功率和无功功率)、功率因数、电度、三相不平衡度、零地电压、谐波含量参数,以及断路器的分、合状态;可监测 SPD 运行状态。 系统的实时数据采集,使得管理人员能够非常方便地读取配电系统的运行数据,了解供电情况;系统的历史数据分析和统计,能够帮助预防故障。 ATS 自动切换开关 ATS 作为控

23、制主备回路供电进线的重要切换装置,是组成低压进线配电系统一个重要组成部件。ATS 的实时监控反映了主备回路的运行状况。其主要监测项包括,表征主备回路供电品质参数,如主备回路电压、频率、电流,以及表征 ATS 运行状态的数字量参数,如主备开关位置状态,还有 ATS主备开关的转换次数、转换记录等。 UPS/HVDC UPS/HVDC 作为不间断电源保障负载可持续供电。对输入柜的监测主要集中在三相电的相电压、线电压、相电流、频率、功率、电度参数;根据情况考虑监测断路器的分、合状态。UPS 输出配电柜通常是安装有集中静态旁路开关、集中维修旁路开关等开关设备和保护装置的低压配电柜。监测 UPS 输出配电

24、柜的实时数据既是了解数据中心负载供电的需要,也是计算数据中心能源效率 PUE 值的需要。对 UPS 输出柜的监测主要集中在三相电的相电压、线电压、相电流、频率、功率、电度参数;另外,断路器的分、合状态也是较为重要的监测参数。 ODCC-2021-06002 数据中心智能监控管理白皮书 9 对 UPS 设备本身,通常需要监测的参数有,UPS 三相输入电压,三相输入电流、输入功率、输入频率、三相输出电压、三相输出电流、输出功率、输出频率、电度、旁路电压、旁路电流参数,UPS 输入、旁路、逆变器、整流器状态及电池充放电状态;另外,根据实际情况,蓄电池时间参数也可能是 UPS 监测包含的内容。 对 H

25、VDC 设备本身,由于其模块化特点,因此需要监控的点位包括输入交流信息、模块信息、输出直流信息及电池信息。 蓄电池组 UPS 电源和直流电源均带有蓄电池组,蓄电池组不仅提高电源质量,更是停电后持续供电的保障。因蓄电池物理上的特殊性,蓄电池的管理和使用需要特别注意;如果管理使用不善,如过度充放电或电池老化,都会导致电池损坏或电池容量急剧下降(即便只有一节电池性能恶化,也会严重影响整组电池的性能),影响设备的正常供电。因此,对蓄电池组的监测十分必要。 一般地,通过在线式电池监测仪、直流电流传感器等设备对蓄电池组进行实时数据采集,包括蓄电池组总电压、单体电压、充放电电流参数。鉴于温度对蓄电池容量与寿

26、命有较大影响,可使用微型温度传感器对蓄电池的表面温度进行监测;另外,蓄电池的单体内阻也是较为重要的反映电池健康状况的参数。 判断电池是否健康可以通过分析充放电曲线和电池内阻方式进行。在电池进行充放电时,通过记录电池的充放电曲线,通过曲线判断各节电池的健康状态。 其他配电柜 主要是指空调、照明,安防及其他用途的配电柜,与低压进线配电柜和UPS 输入配电柜类似,空调,照明,安防及其他用途配电柜的监测,通过监控系统实现实时监测,保护的下游的空调、照明、安防及其他用途的用电设备。 ODCC-2021-06002 数据中心智能监控管理白皮书 10 这类低压配电柜一般需要监测三相电的相电压、线电压、相电流

27、、频率、功率、电度参数,以及断路器的开关。 STS 静态切换开关 STS,静态切换开关,需要实时监测的参数主要包括,输入、输出线电压,输入、输出相电流,频率,有功和无功功率,功率因数,输出负载率等参数,以及双路电源的开、关状态。 列头柜 列头柜运行参数的监测,对以提高能源利用效率 PUE 值为目的的节能减排项目,和以租用 IT 机柜为主营业务的 IDC 数据中心而言是非常有意义的。 一般列头柜主要监测,三相电(主进线)相电压和线电压、相电流、总功率、三相和单相功率因数、电度参数(总电量)、频率;另外,分支电路中的支路电流、分支电量、分支功率、分支功率因数、各支路开、合状态以及断路器的分、合状态

28、等也是较为重要的参数。 PDU 电力分配单元(机柜级 PDU) PDU,电力分配单元,主要需要监测 PDU 主输入的电压、电流、功率、电度参数;根据实际应用场景需要,可监测各支路电流,并控制开关开、合状态。 普通的机柜级电力分配单元不支持这些数据的采集以及通讯,但是智能机柜级电力分配单元可以做到。 2 2)配电管理)配电管理 配电拓扑系统图 通过绘制完整的配电系统拓扑图,采用符合国标的电气图形符号展示:中压柜、油机、低压柜、UPS、HVDC、列头柜、PDU 等之间的层级关系、链接关系。 ODCC-2021-06002 数据中心智能监控管理白皮书 11 配电链路带电状态展示:通过颜色区分配电回路

29、的通电(红色)、断电状态(绿色)。 电气设备关键参数展示:展示配电柜的主要参数,例如:三相电压、三相电流等。 设备跳转:点击配电拓扑图中设备图标,可跳转至设备监控界面。 配电拓扑动态仿真 当电气设备带电状态发生变化时(例如:操作断路器断开/合上,操作隔离开关拉开/合上等),配电拓扑系统图应和现场配电运行情况保持一致,随现场变化展示配电回路状态,包括:设备状态、链路带电状态。 配电系统的受电逻辑呈现 上游追踪:采用动态图形化展示,展示任意设备受电路由及源头,可追踪至市电来源。 下游追踪:采用动态图形化展示,展示任意设备馈电路由及尽头,可追踪至末端用电设备。 4.2.4.4.2.4. 暖通监控暖通

30、监控 主要监控对象及监控指标主要监控对象及监控指标 冷冻水系统 数据中心冷冻水系统的监控主要集中在,独立冷水机组、冷冻水一次泵、冷冻水二次泵、冷却塔、冷却水泵、板式换热器、蓄冷管和补水系统进度监控。具体监控内容包括: 冷冻水供、回水温度、压力与回水流量、压力监测、冷冻泵启停控制(由制冷机组自备控制器控制时除外)和状态显示、冷冻泵过载报警、冷冻水进出口温度、压力监测、冷却水进出口温度监测、冷却水最低回水温度控制、冷却水泵启停控制(由制冷机组自带控制器时除外)和状态显示、冷却水泵故障报警、冷却塔风机启停控制(由制冷机组自带控制器时除外)和状态显示、冷却塔风机故障报警。 ODCC-2021-0600

31、2 数据中心智能监控管理白皮书 12 给水系统的水泵自动启停控制及运行状态显示;水泵故障报警;水箱液位监测、超高与超低水位报警。污水处理系统的水泵启停控制及运行状态显示;水泵故障报警;污水集水井、中水处理池监视、超高与超低液位报警。 蓄冰制冷系统的启停控制、运行状态显示、故障报警、制冰与溶冰控制、冰库蓄冰量监测及能耗累计。 压缩式制冷机系统和吸收式制冷系统的运行状态监测、监视、故障报警、启停程序配置、机组台数或群控控制、机组运行均衡控制及能耗累计。 热电联供系统的监视包括初级能源的监测;发电系统的运行状态监测;蒸汽发生系统的运行状态监视能耗累计。 一般通过独立的自动化控制系统实现对冷冻水系统的

32、控制,并且通过数据集成方式,把数据集成到数据中心监控系统,实现统一监控管理。 空调 空调对控制数据中心的温湿度起着决定性作用。数据中心空调停止运行后,数据中心温度就会迅速上升,此时计算机设备运行可靠性大大降低。对空调系统运行状况进行实时监控,才能保证空调稳定运行,保障数据中心温湿度的稳定、可靠。通常需要全面监测空调各部件,并对空调进行远程控制。具体监控内容包含: 空调机组启停控制及运行状态显示,过载报警监测,送、回风温度监测,室内外温、湿度监测,过滤器状态显示及报警,风机故障报警; 冷(热)水流量调节,加湿器控制,风阀调节,风机、风阀、调节阀连锁控制,室内空气品质监测,(寒冷地区)防冻控制,送

33、回风机组与消防系统联动控制。 针对精密空调,主要监测其开、关状态、送风温度/湿度、回风温度/湿度参数;远程控制其开、关机。 针对普通空调,主要监测其开、关机状态,控制其开、关机,温度设置;根据实际情况需要,可考虑其来电自启动功能。 加湿机、除湿机 ODCC-2021-06002 数据中心智能监控管理白皮书 13 主要监测项包括,开、关机状态,湿度设置;根据实际情况需要,可考虑加湿器的开、关机的远程控制功能。 通风系统 通风系统主要包括新风系统和排风系统。数据中心内使用的新风机的过滤器容易发生堵塞,影响数据中心的新风供应。因此,过滤器(压差)状态是新风监测的重要内容。另外,送排风系统的启/停状态

34、,以及与其他系统(如空气质量系统、压差、消防等)的联动控制功能。监控内容: 过滤网压差状态,以及与其他系统(如空气质量系统、压差、消防等)的联动控制。 变风量(VAV)系统的总风量调节,送风压力监测,风机变频控制,最小风量控制,最小新风量控制,加热控制,变风量末端(VAVBOX)自带控制器时应与建筑设备监控系统联网,以确保控制效果。 送排风系统的风机启停控制和运行状态显示,风机故障报警,风机与消防系统联动控制。 风机盘管机组的室内温度测量与控制,冷(热)水阀开关控制,风机启停及调速控制。 4.2.5.4.2.5. 环境监控环境监控 主要监控对象及监控指标主要监控对象及监控指标 漏水检测 数据中

35、心可靠性要求高,并且投资巨大,任何漏水情况都有可能造成无法挽回的经济损失,因此选用可靠、耐用、高效的漏水报警系统将十分必要。 数据中心要防止水患,通常是采取主动和被动两种措施,主动措施是在数据中心规划时就考虑减少漏水隐患原则来做规划;被动措施是万一发生漏水,能在第一时间发现并处理,采用漏水检测系统可实现该目的。 漏水检测,主要是监测有水源区域的漏水情况。一旦漏水发生,及时准确地检测到并通过监控系统发出报警;同时可联动排水设备排水,如联动进ODCC-2021-06002 数据中心智能监控管理白皮书 14 出水管的电磁阀开、关;如果漏水隐患在地板下的分布范围较广,还需要监测漏水的具体位置,这样才能

36、迅速找到泄漏点,以便及时处理。 空气质量系统 监测对象一般包括氢气、硫化物、粉尘;按照所属区域不同,所监测的内容也有所不同: 一般主机房内,监测空气所含硫化物、粉尘含量; 蓄电池间,主要监测空气所含氢气浓度。 机房温湿度 监测机房环境温度、湿度值。 机房正压 为确保机房区域保持微正压状态,需监测主机房与主机房外的压差,且能够实现压差与新风机的联动。 4.2.6.4.2.6. 安防与消防监控安防与消防监控 消防系统消防系统 消防系统,主要是从消防控制器上获取消防报警信号、气体喷淋信号,不对消防系统进行控制。一般需注意: 通过集成方式监测数据中心独立的消防系统,不对数据中心独立敷设传感器进行消防监

37、测; 监测消防系统的各消防防区报警状态和报警时间,不对消防系统进行控制; 对消防系统的监测是从物理上进行隔离,这样确保不影响消防系统的正常运行。 2 2)视频监控系统)视频监控系统 视频监控系统是从前端摄像机获取视频信号,然后通过录像机等设备进行存储和转发的系统。视频监控系统是确保整个数据中心安全的电子眼,通过视频方式实现对数据中心的实时监控。 ODCC-2021-06002 数据中心智能监控管理白皮书 15 通常视频监控系统为独立管理系统,它支持多画面浏览、录像回放、视频远传、触发报警、云台控制、设备联动等功能;通过集成方式接入监控管理系统,由监控管理系统进行实时视频查看、录像回放、远程控制

38、等操作。 3 3)门禁系统)门禁系统 在数据中心区域重要位置安装门禁系统,以便对出入人员进行有效监控管理,出于安全考虑,门禁系统设计时采用控制与读卡分开的结构。门外安装读卡器,室内隐蔽处安装门禁系统控制器,(分开放置)防止有人通过技术手段破坏并非法进入。 门禁系统由控制器、感应式读卡器、电控锁和开门按钮等组成(联网系统外加通讯转换器)。读卡方式属于非接触读卡方式,持卡人只要将卡在读卡器有效范围内晃动一次,读卡器就能感应到有卡请求验证并将卡中的信息发送到主机,主机将检查卡的有效性,然后决定是否进行开门。 门禁系统一般为独立管理系统,通过集成方式接入监控管理系统,总控中心能够实时监控门禁系统的状态

39、,实现对开、关门状态、门的刷卡记录进行监测,并远程控制开门;对门禁系统的历史数据进行处理、查询、报表输出等。 4 4)防盗系统)防盗系统 对数据中心的重要出入口位置敷设入侵报警设备进行监测。 4.3.4.3. 运维管理运维管理 运维管理平台 将运维工作划分了事前、事中、事后三个环节。事前主要包含了巡检、维保、演练等功能,事中包含了事件、变更功能,事后主要聚焦在问题管理,除此之外,我们还可以通过统一的运维知识模块来积累运营经验,贯穿在整个运维工作的全流程中。 4.3.1.4.3.1. 巡检管理巡检管理 传统的巡检工作都由巡检人员带着一张纸质的表单,在设备面前抄写相应的读数,既费时费力,又无法对相

40、关的数据进行统计分析,沉默数据在文ODCC-2021-06002 数据中心智能监控管理白皮书 16 件档案库中无法得以应用。因此智能化的巡检需要解决数据线上化的问题,并且通过系统来辅助巡检人员解决巡检中发生的问题。 4.3.1.1.4.3.1.1. 巡检任务管理巡检任务管理 系统提供巡检任务相关信息展示, 帮助运维团队查看巡检任务情况、 任务进度、是否超时、是否异常等巡检完成情况。 1) 巡检任务详情:系统能够查看巡检任务详情,协助运维人员掌握巡检任务的完成情况 2) 巡检任务转单:系统能够将巡检任务转给他人处理,在巡检任务查看页面,每个巡检任务都有对应的转单按钮,点击转单按钮,填写巡检责任人

41、,按下确认按钮,即可转单,巡检任务由 A 转移至 B, 相关任务考核由 A 转交至 B。 4.3.1.2.4.3.1.2. 巡检计划管理巡检计划管理 系统提供巡检计划信息展示功能以及支持巡检计划自由定制,针对对巡检任务设定周期性计划,自动生成巡检任务。可以提前定制巡检计划并在系统上查询查看权限范围内的巡检计划,管控巡检进度,保证巡检质量。 4.3.1.3.4.3.1.3. 巡检模板管理巡检模板管理 不同的基础设施配套需要制定不一样的巡检模板,以适配各种场景下的巡检,系统应提供巡检模板管理功能来保证巡检的内容项,确保巡检内容的完整性和适配性。 4.3.1.4.4.3.1.4. 巡检逻辑区域管理巡

42、检逻辑区域管理 巡检逻辑区域主要为了解决巡检人员效率问题,巡检中不在需要逐个设备区扫描 RFID 芯片,而是一次扫描就能完整制定该逻辑区域的巡检路线。系统支持用户自定义巡检的逻辑区域,并对逻辑区域范围进行管理,以此提升巡检的工作效率,在巡检逻辑区域管理页面提供展示信息。 ODCC-2021-06002 数据中心智能监控管理白皮书 17 4.3.1.5.4.3.1.5. 巡检点管理巡检点管理 巡检点是将设备的巡检项目细颗粒化,这种细颗粒度巡检点能灵活的设计更合理的巡检模板,并针对不同时期的数据中心运行的情况进行快速便捷的调整优化巡检模板和巡检计划。 4.3.1.6.4.3.1.6. 巡检视图管理

43、巡检视图管理 系统提供巡检视图, 包括巡检及时率, 巡检完成率等视图, 帮助用户快捷统计分析巡检工作情况, 具体的展示数据和视图包括展示巡检设备数据、 巡检完成率、巡检准时率、日常巡检异常统计(按系统、设备类型、厂商分类)、高危巡检异常统计(按系统、设备类型、厂商分类),日常巡检排行榜。 4.3.2.4.3.2. 维保管理维保管理 系统能够帮助运维团队构建周期性或临时性的维保任务,并通过维保模板指导维保工作师如何对设备进行维保工作。最终统计维保工作的完成情况,保障设施都能够准确及时地进行维保,有效防范故障的发生。 4.3.2.1.4.3.2.1. 维保作业任务管理维保作业任务管理 维保作业任务

44、是指按照条件预设的维保计划,可以通过计划进行周期性的维保作业任务, 或是临时制定的一次性维保作业任务。 通过维保作业任务设定能够指导维保工程师何时进行相应的维保工作,并最终验收管理相应维保工作的完成情况。系统支持用户实时查看维保任务安排及完成情况。 4.3.2.2.4.3.2.2. 维保模板管理维保模板管理 维保模板是指一个维保作业任务需要采用的工作模板,该模板能指引维保工程师如何完成此次维保作业, 包括但不限于相关的维保操作、 维保所需要的耗材、 维保预计消耗的人力情况等。 系统支持用户实时查看维保模板及其管理情况。 ODCC-2021-06002 数据中心智能监控管理白皮书 18 4.3.

45、2.3.4.3.2.3. 维保作业项管理维保作业项管理 维保作业项是指将维保工作拆分成细颗粒度,对设备的每个独立维保动作都可以设定为维保作业项。通过维保作业项可以灵活构筑维保模板来指导维保工作, 当运营过程中发现需要对维保模板进行修改时, 通过维保作业项的变更和重组也能快速便捷地支撑相应要求。系统支持用户自主查看维保作业项,完善维保作业任务管理。 4.3.2.4.4.3.2.4. 维保计划配置维保计划配置 系统支持用户自主对不同的模组配置维保时间计划,用户为每个模组配置维保计划的时候, 需要考虑和输入的信息包括维保工程师人数, 每人每天工时、每日平均工时、每日总工时可偏移、校正值、维保周期可偏

46、移天数,输入完成后,生成新的维保计划,进一步完善维保工作的管理体系。 4.3.2.5.4.3.2.5. 维保统计管理维保统计管理 系统应提供维保视图, 方便用户快捷统计分析维保工作情况, 用户点击维保统计管理页面中的维保视图, 系统可展示的内容包括维保设备数据、 维保作业完成率、维保作业准时率、维保作业成功率。 4.3.3.4.3.3. 演练管理演练管理 系统能够帮助运维团队构建演练的方案、安排演练的团队分工,并制定相应的演练计划。 最终对演练的情况进行分析, 通过演练来发现运维过程中需要优化完善的不足之处。 4.3.3.1.4.3.3.1. 演练方案管理演练方案管理 系统支持用户实时查看演练

47、方案及其管理情况,在演练方案管理页面可支持用户对现有的演练方案进行搜索,创建,编辑,删除等功能。 ODCC-2021-06002 数据中心智能监控管理白皮书 19 4.3.3.2.4.3.3.2. 演练计划管理演练计划管理 系统支持用户实时查看演练计划并对其进行管理,通过设定的演练计划和完成情况来综合评判演练效果,是否有需要改进之处。 4.3.3.3.4.3.3.3. 演练团队管理演练团队管理 系统支持对演练计划设定相应的演练团队, 演练团队的各个对应的角色在演练流程中对应各环节应有的相应操作,来推进整个演练工作的完成。 4.3.3.4.4.3.3.4. 演练流程管理演练流程管理 系统能够允许

48、用户自定义演练流程, 并对数据中心的已有演练流程进行全面的管理。 用户可以对创建演练流程, 对已有的演练流程进行修改和删除, 也可以在演练流程中添加或删减流程节点。 4.3.4.4.3.4. 变更管理变更管理 系统能够创建变更工单, 并保存在系统中, 使用户可以持续保持关注。 该功能支持变更工单的申请,终止,查询。变更工单可以囊括数据中心各个方面。 4.3.4.1.4.3.4.1. 变更类型管理变更类型管理 系统能够涵盖数据中心所有变更类型, 形成子系统-设备类型-变更名称三级变更类型管理 4.3.4.2.4.3.4.2. 变更流程管理变更流程管理 系统能够允许用户自定义变更流程, 并对数据中

49、心的已有变更流程进行全面的管理。 用户可以对发起变更申请, 对已有的变更申请进行修改和删除, 也可以在变更流程中添加或删减流程节点。 ODCC-2021-06002 数据中心智能监控管理白皮书 20 4.3.4.3.4.3.4.3. 变更时间管理变更时间管理 系统支持用户自定义和管理变更时间,从而有效规范变更发起时间,规避有重大风险变更,保障数据中心安全运营。 4.3.5.4.3.5. 事件管理事件管理 系统提供对当前的事件工单查询并进行处理, 用户可以输入事件工单的解决方案和业务恢复方案等,等待责任人和业务审核完成之后,结束工单。 1) 事件转问题 遇到不能马上解决的事件工单, 系统需转成问

50、题工单并保持持续跟进, 用户在核对工单信息和现场实际情况之后,可进行事件单结单或者转单的操作,转单时需填写转单备注和转单责任人,确保事件流程正常进行。 2) 告警转事件 遇到无法即刻消除的告警时,系统需将告警转成事件工单并自动发送待办和提醒给相关责任人,相关责任人在核对事件工单信息和现场实际情况之后,可进行告警信息进行管理,然后处理事件工单。 4.3.6.4.3.6. 运维知识管理运维知识管理 系统应建立丰富的运营经验智库,包括巡检智库、维保智库、演练智库、告警智库、故障处理智库,方便对积累的运营经验进行管理 1) 知识创建: 支持创建新的知识条目以丰富运营经验库,方便对积累的运营经验进行管理

友情提示

1、下载报告失败解决办法
2、PDF文件下载后,可能会被浏览器默认打开,此种情况可以点击浏览器菜单,保存网页到桌面,就可以正常下载了。
3、本站不支持迅雷下载,请使用电脑自带的IE浏览器,或者360浏览器、谷歌浏览器下载即可。
4、本站报告下载后的文档和图纸-无水印,预览文档经过压缩,下载后原文更清晰。

本文(ODCC:2021数据中心智能监控管理白皮书(35页).pdf)为本站 (渔人也) 主动上传,三个皮匠报告文库仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。 若此文所含内容侵犯了您的版权或隐私,请立即通知三个皮匠报告文库(点击联系客服),我们立即给予删除!

温馨提示:如果因为网速或其他原因下载失败请重新下载,重复下载不扣分。
客服
商务合作
小程序
服务号
会员动态
会员动态 会员动态:

158**27... 升级为至尊VIP  wei**n_... 升级为至尊VIP 

 wei**n_... 升级为至尊VIP 153**39...  升级为至尊VIP

152**23...  升级为高级VIP   152**23...  升级为标准VIP

 wei**n_... 升级为标准VIP  姚哥 升级为至尊VIP  

微**...  升级为标准VIP 182**73...  升级为高级VIP

wei**n_...  升级为标准VIP  138**94...  升级为标准VIP

wei**n_...  升级为至尊VIP A**o  升级为至尊VIP 

134**12... 升级为标准VIP   wei**n_... 升级为标准VIP 

wei**n_...  升级为标准VIP 158**01...  升级为高级VIP

wei**n_...  升级为标准VIP 133**84... 升级为高级VIP

 wei**n_... 升级为标准VIP 周斌  升级为高级VIP 

wei**n_...  升级为至尊VIP  182**06... 升级为高级VIP

139**04...  升级为至尊VIP wei**n_...  升级为至尊VIP

 Ke**in 升级为高级VIP  186**28... 升级为至尊VIP

 139**96... 升级为高级VIP  she**nz... 升级为至尊VIP 

wei**n_... 升级为高级VIP    wei**n_... 升级为高级VIP

 wei**n_... 升级为标准VIP  137**19...  升级为至尊VIP 

419**13...   升级为标准VIP 183**33...  升级为至尊VIP

 189**41... 升级为至尊VIP 张友   升级为标准VIP

奈**... 升级为标准VIP  186**99... 升级为至尊VIP 

187**37... 升级为高级VIP   135**15... 升级为高级VIP 

 朱炜 升级为至尊VIP   ja**r  升级为至尊VIP

wei**n_... 升级为高级VIP  wei**n_... 升级为高级VIP 

 崔** 升级为至尊VIP  187**09...  升级为标准VIP

189**42...  升级为至尊VIP  wei**n_... 升级为高级VIP

 妙察 升级为标准VIP wei**n_...  升级为至尊VIP

137**24...  升级为高级VIP  185**85... 升级为标准VIP

 wei**n_... 升级为高级VIP 136**40...  升级为标准VIP 

156**86...  升级为至尊VIP   186**28... 升级为标准VIP 

135**35... 升级为标准VIP    156**86...  升级为高级VIP

wei**n_... 升级为至尊VIP  wei**n_...  升级为高级VIP

wei**n_...  升级为标准VIP  wei**n_... 升级为标准VIP 

 wei**n_... 升级为高级VIP 138**87... 升级为高级VIP

185**51...  升级为至尊VIP 微**...  升级为至尊VIP

136**44...  升级为至尊VIP 183**89...  升级为标准VIP

 wei**n_... 升级为至尊VIP  8**的... 升级为至尊VIP

 Goo**ar... 升级为至尊VIP  131**21... 升级为至尊VIP

 139**02... 升级为标准VIP wei**n_...  升级为高级VIP

 wei**n_... 升级为高级VIP  wei**n_... 升级为至尊VIP

 wei**n_...  升级为至尊VIP  138**05... 升级为至尊VIP

 wei**n_... 升级为高级VIP wei**n_... 升级为至尊VIP

 wei**n_... 升级为至尊VIP wei**n_... 升级为至尊VIP

131**77...  升级为高级VIP wei**n_... 升级为标准VIP 

186**06... 升级为高级VIP  150**97... 升级为至尊VIP 

 wei**n_...  升级为标准VIP wei**n_... 升级为至尊VIP

185**72...  升级为至尊VIP  186**81... 升级为至尊VIP

升级为至尊VIP 159**90...  升级为标准VIP 

 ja**me 升级为高级VIP  wei**n_...  升级为标准VIP 

 wei**n_... 升级为至尊VIP 黑碳 升级为高级VIP

 黑碳  升级为标准VIP wei**n_...  升级为高级VIP