《中国移动:中国移动新型智慧城市白皮书(2023版)-IT运维分册(65页).pdf》由会员分享,可在线阅读,更多相关《中国移动:中国移动新型智慧城市白皮书(2023版)-IT运维分册(65页).pdf(65页珍藏版)》请在三个皮匠报告上搜索。
1、前 言随着信息技术的快速发展与广泛应用以及居民对于城市治理水平、公共服务水平、居民生活质量、生态环境保护等方面诉求的不断增加,智慧城市的建设已经成为全球城市发展的重要趋势,伴随着大量智慧城市相关项目的落地,智慧城市相关业务系统运维保障的诉求也在日益增加,因此如何依托先进的技术、方案、资源,建立完善的智慧城市运维服务体系至关重要。中国移动作为全球最大的通信运营商,积极投身于智慧城市建设与运维,以推动信息通信技术与城市运营的深度融合,为城市居民创造更美好的生活体验。中国移动在智慧城市运维方面具有得天独厚的优势。首先,中国移动拥有庞大的用户群体和丰富的信息资源,可以为智慧城市建设、运维提供数据支撑和
2、信息平台支持;其次,中国移动在通信技术、云计算、大数据、物联网等领域具有很强的技术实力和经验积累,可以为智慧城市提供可靠的运维技术保障和解决方案。本书结合中国移动在智慧城市运维领域的探索与实践经验,通过阐述智慧城市相关政策导向、行业发展现状对智慧城市领域发展趋势进行了剖析;通过智慧城市运维愿景、内涵的相关描述总结了智慧城市运维的本质及目标;依托运维全生命周期服务范围的制定为智慧城市运维标准体系的建设提供了指导原则;从流程、技术、资源及项目案例方面分别阐述了中国移动在智慧城市运维领域的服务能力。旨在为推动智慧城市的可持续发展及平稳运行提供有力参考。本书编写组指导单位中国移动集团公司政企事业部编写
3、单位中移系统集成有限公司云智慧(北京)科技有限公司润建股份有限公司华为技术有限公司北京直真科技股份有限公司主编高有军、刘子毅(中移系统集成有限公司)参编赵剑明、贾然、杨维强、周欢欢、许伟杰、李东太、徐鲁旭(中移系统集成有限公司)张博、李伯涵、卢鑫源(云智慧北京科技有限公司)陈盼、汤志伟、孙任、唐雪林、黄能柠(润建股份有限公司)徐波(华为技术有限公司)王杰、杨朝令(北京直真科技股份有限公司)目录01行业趋势02愿景内涵03服务内容04能力简介05典型实践06生态合作201行业趋势31.1智慧城市的概念及实践在全球范围内得到了广泛的关注和推广,并已成为政府、企业和公众合作改善城市服务、提高生活质量
4、、促进经济发展和保护环境的重要途径。智慧城市运维涉及的范围广泛,包含了信息技术、环境保护、公众参与等多个领域。政策导向成为推动和规范智慧城市运维发展的关键因素。(1)多项政策都在鼓励和指导智慧城市朝着数字化方向发展。例如,十四五规划明确提出加快构建以全球领先的数字基础设施为支撑的数字中国,这为智慧城市运维的数字化提供了方向。(2)数据安全法明确规定了数据收集、处理和使用的标准,智慧城市运维必须严格遵守相关规定,确保数据安全与公民的隐私权利。智慧城市运维过程中,网络安全至关重要。(3)网络安全法要求必须建立完善的网络安全保护体系,对信息系统进行定期检查和评估,加强数据的存储和传输安全。(4)智慧
5、城市应致力于环境保护和节能减排,国家的环保法规为智慧城市运维提供了清晰的标准和指引。(5)根据国家的社会治理现代化方向,智慧城市在运维过程中应增强公众参与,通过互动交流平台等方式,让市民更好地理解和参与城市的运营管理。(6)国家正积极倡导建立“政府、产业、学术、研究、民用”等多元协同创新机制,这为智慧城市运维模式创新提供了可能。4(7)政策鼓励引入最新的科技进行数据分析预测,提供更高效率的服务。例如,人工智能、区块链、大数据等在智慧城市运维中的应用。总的来说,国家针对智慧城市运维的政策导向,不仅规范了数据、网络安全的使用,也指明了智慧城市的发展方向,并为智慧城市创新运维模式提供了政策支持。它们
6、将一同推动智慧城市运维更高效、更安全、更人性化的发展,提升公民的生活质量和幸福感。1.2智慧城市是指在城市管理和发展过程中,通过运用先进的信息技术和通信技术,实现城市各项功能和服务的智能化、高效化和可持续发展。运维作为保障智慧城市平稳运行的重要一环,随着智慧城市建设要求的不断提高,及科技的不断进步和全球城市化的快速发展,智慧城市运维行业也呈现出蓬勃的发展态势。主要表现在:(1)运维平台的智能化发展:随着人工智能和机器学习技术的不断发展,智能运维平台在提升运维效率、实现智能化管理方面,起到重要的作用。它通过自动化的方式,可处理大量重复性的工作,极大地提高了工作效率;可以通过大数据技术,识别出潜在
7、的风险和问题,提高系统可靠性;它还可以通过对历史数据和实时数据的分析,提供针对性的建议和优化方案,进一步提升运维效率和管理水平。(2)自动化运维工具的应用:随着运维技术的发展,越来越多的自动化运维工具被应用到企业中,例如 Ansible、Puppet 等。这些工5具可以帮助企业更好地实现自动化部署、配置管理、容器化等方面的运维工作。(3)智慧城市运维行业借助大数据分析技术,能够收集、整理和分析大量的城市运行数据,从而提供科学、精准的决策支持。这使得城市管理者能够更好地了解城市的发展趋势和问题,并及时采取有效的应对措施。(4)运维安全性的重视:随着网络攻击和数据泄露事件的增加,运维安全成为企业关
8、注的重点之一。因此,如何在保障业务正常运行的同时,加强运维安全成了一个重要的课题。(5)运维人员技能的要求提高:随着运维技术的不断发展,对运维人员的技能要求也越来越高。运维人员需要不断学习和掌握新的技术、工具和方法,才能更好地适应企业的需求。(6)人工智能和机器学习在运维领域的应用逐渐增多。602愿景内涵7中国移动在智慧城市 IT 运行维护领域的愿景是结合智慧城市相关信息系统的技术、业务特点,建设一个高效、智能的运维体系,通过先进的技术和管理方法,实现对智慧城市相关信息系统的持续支持和优化。核心目的是提高智慧城市相关的业务运行效率,降低运维成本,保障业务稳定和安全进而达到提升城市运行管理和公共
9、服务水平,提高城市居民幸福感和满意度的最终目的。为了实现这个愿景,智慧城市 IT 运行维护需要实现以下几个方面的目标:(1)提高智慧城市 IT 运行维护服务的智能化、自动化水平,实现对 IT 系统的智能监控、故障预警和自动处理,减少人工干预。(2)优化智慧城市 IT 运行维护流程和管理体系,建立标准化、规范化的运维流程,提高运维服务的质量和效率。(3)提升智慧城市 IT 运行维护的质量,加强对运维人员的技能培训和团队建设,提高运维团队的综合素质和业务能力,保障运维服务的稳定性和可靠性。(4)保持智慧城市 IT 运行维护的创新性和适应性,随着技术的快速发展和业务需求的不断变化,智慧城市 IT 运
10、行维护需要保持创新和适应性。通过引入新的技术和方法,可以不断优化和改进运维流程,以适应不断变化的环境和需求。8智慧城市 IT 运行维护的本质主要是通过合理地利用运维服务所涉及的流程、人员、技术、资源来确保运维服务的目标,保障系统主体可以正常、高效、平稳、安全的运行。通过合理的智慧城市 IT 运行维护管理流程规范,确保智慧城市 IT运行维护工作的高效执行,并使运维工作人员的工作变得有章可循,降低了工作的难度,保证了工作的质量,提高了工作的效率。通过设置合理的智慧城市 IT 运行维护人员组织架构及制定合理的人员技能提升机制可以提升整体运维服务的效率,确保运维服务的质量。通过智慧城市 IT 运行维护
11、相关的新技术采用、新平台的打造、新应用的丰富以确保智慧城市 IT 运行维护在快速地新技术变革、迭代过程中的创新性和适应性。充分利用各类智慧城市 IT 运行维护资源如运维管理平台、告警监控平台、灾备管理平台、智能客服系统等来提高整体运维服务的自动化、智能化、标准化水平。903服务内容10运维全生命周期服务是一个综合性的服务模式,旨在保障企业 IT系统全生命周期的平稳、安全、高效运行。本文以 ITSS 中 IT 服务生命周期(PIOIS):规划设计、部署实施、服务运营、持续改进、监督管理为指导原则,结合智慧城市系统运维服务诉求特点,制定了智慧城市系统运维全生命周期服务内容要求,进而更好地帮助智慧城
12、市领域相关客户节省时间和成本,提高系统的稳定性和安全性,从而保障智慧城市相关领域业务持续向好地发展。图 1 智慧城市运维全生命周期服务113.1.1 运维咨询智慧城市运维咨询需根据 ITSS 规范与地方标准相结合为客户提供一系列运维咨询服务,旨在帮助城市有效整合和使用各种资源,以达到更好的管理效果和公共服务质量。可以为城市提供全方位的支持,助力城市科技化、智能化,有效地提升城市管理和服务水平,提高居民的生活质量。(1)需求支持智慧城市运维咨询的需求支持需要全面覆盖技术、业务、政策、人力资源和应急响应等方面,为智慧城市运维提供专业、系统、有效的咨询服务。在智慧城市运维过程中,可能需要引入不同的信
13、息技术,如大数据、云计算、物联网等。因此,技术咨询需求将提供如何合理选择和使用这些技术,包括系统或平台的选型、架构设计、软硬件配置、系统测试和优化等。咨询服务可以针对不同的城市业务流程,提供优化和改进建议。例如,对于公交调度管理、环保监测、公共安全等具体业务,都需要详细分析现有运维流程,然后提出优化方案。由于智慧城市涉及众多法规政策,咨询还包括如何符合相关法律法规,尤其是关于数据安全和公民隐私的法律法规,以及专门针对智慧城市的国家或地方政策。12智慧城市运维需要一支高效的团队,咨询服务应提供如何建设和管理这个团队,包括人员培训、团队激励、人员配置等。咨询服务需要提供如何应对各类紧急情况的建议,
14、包括设备故障、数据泄漏、网络攻击等,以保证智慧城市运维的持续稳定。(2)数据分析咨询在智慧城市项目中,数据是最重要的资产之一。咨询服务可以帮助城市建立高效、安全的数据管理体系,包括数据收集、存储、分析和使用等方面。通过先进的数据分析方法和工具,可以从数据中提取出有用的信息和知识,以辅助决策和优化服务。(3)IT 基础设施咨询IT 基础设施咨询可以提供高效、安全、稳定的运维服务。智慧城市运维中的 IT 基础设施咨询,涵盖了对智慧城市的硬件和软件设备的规划、配置、优化和管理等服务。这类咨询主要帮助实现智慧城市的运维效率、安全性和稳定性。包括物联网卡在内的硬件设施是智慧城市 IT 基础设施咨询的重要
15、组成部分。物联网卡能够实现设备间的互联,使得各类设施能够互相通信、共享数据,提升智慧城市的运维效率。对于物联网卡,咨询需要包括选择适合的类型(如 NB-IoT、LoRa 等)、正确的配置、有效的管理等方面。除此之外,咨询服务还应当介入计算设备、网络设备、存储设备等的选择和配置,确保它们能够满足智慧城市运维的需要。同时,还需要提供关于云计算平台、数据中心、服务器等的规划和优化建议。13在软件方面,咨询服务应当覆盖操作系统、数据库、中间件、应用软件等的选型、配置和优化,以及如何有效地进行软硬件之间的配合,实现最大的运维效率。(4)运维安全咨询在构建智慧城市相关系统时,安全是一个不可忽视的问题。运维
16、安全咨询服务可以提供全面的安全咨询,包括制定安全策略、评估系统安全性、解决安全漏洞、应对安全事件等。通过这些服务,可以有效保证智慧城市的数据和服务安全。(5)运维优化和自动化运维咨询服务可以帮助智慧城市相关项目改进运维流程,提高运维效率,降低运维成本。可以通过引入新的运维工具和技术,实现运维任务的自动化,提升服务质量和稳定性等。(6)成本评估提供运维成本评估咨询服务,通过分析智慧城市项目的运维成本结构、制定成本预算和优化成本策略等,帮助客户实现成本控制和优化,提高项目整体效益。(7)风险管理提供运维风险管理咨询服务,包括建立风险评估指标体系、制定风险应对策略和定期进行风险监测等,帮助客户有效预
17、防和应对潜在风险,确保智慧城市项目的稳定运行。143.1.2 运维建设智慧城市的运维建设,宗旨是保障智慧城市的各项服务和基础设施的平稳运行,智慧城市的运维建设是一个复杂的过程,需要多种专业知识和技能。但只有做好了这些工作,才能确保智慧城市的稳定运行,提供优质的服务,满足人们的需求。确定以网络安全、数据安全为底线,保障智慧城市业务系统稳定运行。首先制定运维管理制度、制定问题处理、资产管理、事件管理、问题管理等覆盖运维全生命周期的线上流程规范。其次根据 SLA 组建终端硬件服务网点、业务系统运维驻场团队、IT 基础运维团队、二线专家团队。最后在集中运维中心设立统一的运维服务台、运维监控、工单流程、
18、智能客服、资料管理、数据备份管理等运维辅助工具。关注运维阶段出现的问题,做到及时发现问题、解决问题,并同步实现风险防控。图 2 运维管理体系153.1.3 运维保障智慧城市的运维保障是一个全面、持久的过程,其目标是确保城市的信息化设施和服务能够稳定、安全、高效地运行。智慧城市的运维保障服务需要全方位、全时段、全过程地确保系统和服务的正常运行,为用户提供高效、质优、安全的服务,从而提升城市的智能化水平和居民的生活质量。主要通过以下三个方面进行运维保障。在技术方面,通过各种手段保障服务的可用性和稳定性,并且具备良好的技术创新和问题解决能力,能够及时应对系统故障、网络安全问题以及日常维护中出现的各种
19、挑战,确保系统的正常运行。同时具备良好的沟通能力,能够清楚、准确地向客户解释复杂的技术问题和方案,提供全面的用户支持服务,解答用户的问题,解决用户在使用服务中遇到的困难。例如使用负载均衡技术提高服务的处理能力,使用冗余和备份技术防止系统故障,采用先进的监控工具实时监控系统的运行状态,采用多层安全防护措施,以保护智慧城市系统和数据免受攻击。在设备维护保养方面,服务器等软硬件、配套类基础设施可采购原厂商或有资质的第三方服务商并约定 SLA,确保系统设施疑难问题和紧急问题快速定位解决,保障业务的安全稳定运行。在流程方面,首先建立快速响应机制,及时处理和恢复故障问题。其次,制定符合智慧城市特点的运维管
20、理制度规范、流程规范,对过程进行监督考核、持续改进;制定问题处理、资产管理、事件管理、问题管理等覆盖运维全生命周期的线上流程,这包括制定故障处理流16程、建立应急预案,以及提供 24 小时的技术支持服务等。最后建立完备的灾难恢复计划,并进行定期的演练,以确保在发生重大故障或灾害时能迅速恢复服务。实施主动维护,定期检查设备软硬件运行状态、配置是否符合规范要求。从技术力量、应急资源、调度机制等方面建立重大保障的服务体系,为客户提供重大节假日、重大事件、重大活动等重要时期的专项保障服务,确保重保期间业务稳定性、可用性及连续性。在资源方面,建设使用监控、工单、智能客服、资料管理和数据备份等运维管理工具
21、,提升运维效率,提升项目运维阶段信息化管控能力,组织开展基于运维数据的运维经营分析工作,持续优化项目运维能力。运维创新能力是指通过引入先进的管理方法及制度规范,优化运维工作流程,充分利用现有的运维辅助工具,不断探索新的运维技术,从而确保运维服务工作的高效性、稳定性、节约性及创新性。中国移动通过对自身运维咨询能力、运维建设能力、运维人员能力、运维培训能力等方面的充分整合及创新为智慧城市运维提供了技术保障基础;通过先进的管理、流程规范的建立使智慧城市运维服务执行有章可循,提高了运维工作效率和问题解决速度,为客户创造更大的商业价值;通过引入先进的运维辅助工具促进智慧城市运维的自动化、智能化,提高了运
22、维工作的可靠性,降低了运维的成本;通过17新技术与运维服务结合的不断探索研究确保了智慧城市运维服务的创新性、适应性。1804能力简介19中国移动积极推进网络运维的数智化转型升级,率先开启“三零三自”数智化运维转型之路,面向客户提供“零等待、零故障、零接触”的新型网络与 ICT 服务,面向一线运维打造“自配置、自修复、自优化”的数智化运维能力,积极融入国家科技创新体系布局,主动承担国家重大科技创新专项。统筹推进自智网络升级演进,攻关填补多项网络与 AI 融合的技术空白,积极分享中国移动自智网络的理论与实践创新成果。设立“移动信息产业链-自智网络子链”,充分争取政策支持,建设了“智慧网络国家新一代
23、人工智能开放创新平台”,汇聚产、学、研合作伙伴,打通理论、技术、标准、应用的创新全链条,打造跨领域、大协作的协同创新基地,进一步提升产业链的竞争力和服务能力。中国移动基于对智慧城市数字化运维转型诉求的洞察,以及在通信领域多年的经验积淀,运用基于服务化的架构、DevOps、AI 等先进的技术和理念,为客户提供全向能力匹配的运维系列产品及虚拟化运维转型服务,赋能客户在 5G 时代的数字化转型。中国移动基于服务化架构和 ITIL 标准的服务流程,为客户构建了面向 5G 网络的运维管理系统和管理流程。紧密围绕中华人民共和国国民经济和社会发展第十四个五年规划和 2035 年远景目标纲要政策指引,全面落实
24、“十四五”总体发展规划,形成“五位一体”的 IT 运维服务总体架构,如图 3 所示。20以“强大的运维保障工具、完备的运维管理制度、先进的运维服务理念、科学的运维组织架构和关键的 IT 运维技术”为主要组成部分的 IT 运维服务体系,构建起一座坚固的运维服务力量大厦,以确保各项业务的顺利展开。把做大做强做优 IT 运维作为振兴突破口,全面助力数智化转型发展。图 3 OneService 运维服务系统(1)强大的运维保障工具OneService 一体化运维平台,主机监控、业务监控、运维客服、资料管理、运维工单系统、报表管理、自动化运维中心等,以数据为基础、以 AI 为支撑、以业务为向导,应用先进
25、的实时大数据和机器学21习技术,IT 运维与业务经验深度结合,打通后端 IT 支撑系统与前端业务应用之间的信息断层和管理断层,提升业务与管理效能。建立 24 小时运维客服热线和值班制度,用户在使用中遇到的困难问题可以第一时间帮助解决,也可以不断进行自我完善,不断提高服务质量。(2)完备的运维管理制度为确保运维服务工作正常、有序、高效、协调地进行,根据国家、工业和信息化部颁布的相关政策、技术体制、业务规程、法规等的内容和要求制定一系列管理制度,覆盖各类运维模块,包括从组织实施到施工验收的各个方面,实现运行维护工作的标准化、规范化。(3)先进的运维服务理念在互联网化和移动化的背景下,传统的运维边界
26、变得越来越模糊。随着虚拟化和云计算等技术的出现,运维管理的复杂度和难度大大增加,传统的运维思维已经无法适应当前日新月异的运维服务,我们通过不断地学习、融合、创新,打造先进的运维服务理念,为客户提供全方位的运维服务。(4)科学的运维组织架构我们构建了科学全面的运维组织架构,在运维管理委员会的管理下,项目管理组、专业支撑组、现场保障组、后备资源组各司其职,对客户问题提供及时且高效的响应,保证客户问题及时有效解决。(5)关键的 IT 运维技术22我们一直秉承着开放、融合的运维理念,在多年运维经验基础上不断引进新的技术与能力,形成针对各类运维场景的技术与能力。(6)发挥标准引领作用中国移动作为 DIC
27、T 的领航者,结合自身优势与中国信通院、中国信标委等组织联合编制一体化政务云智能运维平台技术能力要求信息技术应用创新政务云平台性能要求信息技术云计算分布式云通用技术要求信息技术云计算云迁移工具技术要求等多项标准文件。(7)卓越的绿色节能运维能力中国移动致力于提供绿色节能的运维管理服务,紧跟“碳中和、碳达峰”战略目标,打造绿色节能运维管理机制,在保障系统设施安全稳定运行的基础上,采用卓越的绿色节能管理措施,优化系统能耗结构,实现绿色节能运维。4.1.1 全面的运维技术(1)运维咨询能力中国移动具备运维顶级咨询能力,主要涵盖了广泛的专业知识、技能和经验,它能够帮助城市从技术和管理等多个方面进行智慧
28、化改造。集合了多种专业知识和技能,能够为智慧城市的建设和发展提供强有力的支持。以下是一些重要的运维咨询能力:具备丰富的 IT 技术知识和实践经验,包括硬件、软件、网络、数据库、安全等各个方面。能够理解和分析复杂的技术问题,提出有效23的解决方案。能够进行数据清洗、挖掘、分析等工作,使用先进的工具和算法,从大量的数据中提取出有价值的信息和知识。了解各种安全风险和威胁,掌握防火墙、入侵检测、加密等技术,能够设计和实施全面的安全策略。掌握城市的业务需求和挑战,能够从业务角度思考问题,提出符合实际需要的解决方案。具备良好的沟通能力,能够清楚、准确地向客户解释复杂的技术问题和方案。除了技术和业务层面,还
29、具备战略思考的能力,能够从整体和长远的角度看待问题,帮助城市进行智慧化的战略规划。(2)运维建设能力中国移动围绕集团创世界一流企业及“做网络强国、数字中国、智慧社会主力军”的总体目标,建设新型智慧城市运营商。打造以智慧城市 OneCity 为核心的产品能力体系,以树立新理念、采用新技术、打造新平台、丰富新应用、构建新生态为宗旨,提供全面的 DICT 集成服务,助力智慧城市建设。图 4 DICT 集成能力体系24中国移动具备多项 IT 领域相关的专业公司资质及证书,如 ITSS信息技术服务标准符合性证书(运行维护方向),ITSS 信息技术服务标准符合性证书(云服务方向),信息安全管理体系认证证书
30、和信息技术服务管理体系认证证书,质量管理体系认证证书和信息安全服务资质认证证书等,这些资质和认证表明了公司在 IT 服务、信息安全、管理体系和云服务等方面的专业能力和成熟度。同时也可以提供系统化运维体系的建设和运维产品的建设,以提高城市运输、安防、公共服务等各方面的管理效率。运维体系的建设主要通过对硬件、软件和人员的管理,保证系统的稳定、安全、高效运行。运维产品则涉及各类高科技工具如 AI、大数据等,引领城市资源配置的智能化,以满足城市功能的多样化需求。强大的运维建设能力为客户提供了可靠的基础设施保障,为智慧城市的持续健康发展打下坚实的基础。4.1.2 完善的运维流程制定符合智慧城市特点的运维
31、管理制度规范、流程规范,同时对过程进行监督考核、持续改进;制定问题处理、资产管理、事件管理、问题管理等覆盖运维全生命周期的线上流程,确定智慧城市运维场景,梳理出智慧城市统一运维流程。中国移动编制建立了完善的管理体系和运维制度,常态化支撑制度的有效落实,检查各项制度的执行情况,并根据运维服务工作情况持续优化完善。25图 5 运维管理制度根据智慧城市运维需求,梳理定制统一的、可执行的、符合 ITIL标准的服务流程,规范运维服务,并注重服务流程监控和改进。图 6 运维服务管理流程建立明确的运维团队职责分工,从云资源、主机、数据库、业务系统等各方面做到事事有人负责,件件有人响应。26图 7 运维管理责
32、任分工建立覆盖全业务系统的工单管理体系,对各项日常运维工作进行统一报备和审批,做到全面纳管,定制符合现状的运维工单流程,满足各种类型流程需求。图 8 各类运维工单流程建立 4A 安全管控流程,对全量业务系统的主机进行纳管,运维人员通过 4A 平台政务外网或互联网客户端进行账号认证,双因子账号认27证通过后,发起资源操作申请,待运维、安全组审批通过后可通过 4A堡垒机登录主机,在进行主机、数据库高危操作时会触发金库审计功能,需再次提交金库申请方可可继续操作。图 9 主机访问流程针对公众侧、政府侧建立完善的问题处理流程,做到问题第一时间响应和处理。图 10 问题响应处理流程资源的申请、变更、回收全
33、生命周期进行流程化管控,在满足需求的基础上做到资源的高效利用。28图 11 资源管理流程定期组织开展数据备份恢复演练,验证备份数据的可用性和完整性,对演练流程进行详细精确的制定和把控,做到未练先演,心中有数。29图 12 数据备份恢复演练流程图4.1.3 专业的运维团队(1)运维人员能力运维人员作为智慧城市 IT 运行维护服务体系的建立者和践行者,30其在确保运维服务高质量完成中起着至关重要的作用,依托标准的人员组织架构划分原则作为指导,进行人员职责、层级、角色、权限的合理划分不仅可以保障运维服务的高效率、高质量的执行,也能提升智慧城市相关业务系统服务的可用性、便捷性,降低整体运维成本,进而体
34、现在居民对于城市运行管理和公共服务的信任及满意度的提升上。智慧城市运维必须具备过硬的人员素质,主要包括以下几个方面:1)专业知识和技能:智慧城市运维人员具备广泛的专业知识和技能,包括城市规划、信息技术、通信网络、安全管理、监控与预警技术、备份恢复、数据库、网络、云计算和虚拟化等领域的知识。掌握自动化运维技术,包括脚本的编写,服务自动化部署、配置管理,了解智慧城市系统的工作原理、各种设备的操作和维护方法,并熟悉相关的技术标准和规范。2)技术创新和问题解决能力:智慧城市运维人员具备良好的技术创新和问题解决能力。他们需要能够及时应对系统故障、网络安全问题以及日常维护中出现的各种挑战,并能够提出有效的
35、解决方案,确保系统的正常运行。3)团队合作和沟通能力:运维人员需要具备良好的团队合作和沟通能力,能够与不同的利益相关者进行有效的沟通和协调,共同推进智慧城市项目的运营和发展。4)风险意识和应急能力:智慧城市运维人员具备应对风险和应急情况的能力。具备快速反应和决策的能力,以及在紧急情况下保持冷31静和稳定的心态,并能够有效地组织应急响应工作,最大程度地减少潜在影响。5)持续学习和自我提升:智慧城市运维领域发展迅速,技术日新月异。为了保持运维能力的竞争力,运维人员具备持续学习和自我提升的意识。在日常,积极参加相关的培训和研讨活动,不断了解行业最新动态和技术趋势,并将其应用于实践中。中移系统集成有限
36、公司(雄研产业研究院)作为中国移动通信集团公司政企条线下新型智慧城市领域行业能力建设的专业公司,当前拥有人员总量 4000+,其中各类专业技术人员占比超过 90%。针对运维人员组建方面,公司以明确目标、职责分明、层级合理、资源优化等为人员组织架构划分原则组建了组织统一、职责明确、分工有序、协同高效、技术能力过硬的三级专家支撑团队,打造了智慧城市一体化运维组织。公司拥有经验丰富的各类智慧城市运维领域的专业人员,具备较强的 IT 运维领域的流程规划和方案设计能力,能够针对智慧城市的特性和需求,设计出完整、实用且高效的运维流程;确保各项工作的标准化和有序化;具备审计和评估现有运维流程的能力,根据审计
37、结果进行持续改进和优化,持续提升运维效率和质量;具备一定的指导能力,能够通过培训和示范,使其他人员(包括非专业的 IT 人员)理解并按照既定流程执行相应工作。(2)运维培训能力智慧城市运维培训是保障智慧城市相关业务系统安全稳定运行的32重要组成部分。通过培训,可以提高运维工程师的技术水平和能力,增强客户满意度,推动智慧城市的发展,智慧城市运维培训工作,包括对客户和运维工程师的培训。1)对客户的培训对客户的培训旨在提高客户对智慧城市相关业务系统的理解和操作能力,增强客户的使用体验和满意度,帮助客户更好地利用智慧城市相关业务系统解决实际问题。具体包括以下几个方面:解决方案培训:向客户介绍智慧城市相
38、关业务系统的架构、功能和优势,帮助客户了解智慧城市相关业务系统的整体解决方案,提高客户对系统的认知和理解。平台操作培训:指导客户如何使用智慧城市相关业务系统,包括系统的操作流程、数据分析和应用场景等,帮助客户熟练掌握系统的操作方法,提高客户的使用体验和效率。安全知识培训:向客户介绍智慧城市相关业务系统的安全机制和防范措施,增强客户在系统使用中的安全意识和防范能力,帮助客户保障个人信息和数据的安全。2)对运维工程师的培训对运维工程师的培训旨在提高运维工程师的技术水平和能力,提高运维的质量和稳定性,保障智慧城市相关业务系统的安全稳定运行。具体包括以下几个方面:技术架构培训:深入剖析智慧城市相关业务
39、系统的技术架构和设计理念,包括系统如何进行模块划分、如何实现高可用性设计、如何33保证数据一致性等。使运维工程师能够理解并掌握系统的核心设计思路,从而更好地进行后续的运维工作。系统部署和维护培训:指导运维工程师如何进行系统的部署、配置和维护等操作,提高运维工程师的系统运维能力和效率,保障系统的稳定性和可用性。安全培训:重点强调信息安全技术的重要性,包括如何防范网络攻击、保护数据安全和确保系统稳定性等。向运维工程师介绍智慧城市相关业务系统的安全机制和防范措施,增强运维工程师在系统运维中的安全意识和防范能力,保障智慧城市相关业务系统的安全稳定运行。技能提升:通过定期组织技术交流会、专题培训、参加行
40、业会议等方式,让运维工程师了解最新的技术动态和行业趋势。不断提升自身的技能和水平。4.1.4 先进的运维资源建设使用 4 类运维类工具和 4 类管理类工具,进一步提升智能化运维管理水平。34图 13 运维管理工具(1)智能运维管理平台智能运维管理平台是由一门户、四中心、一管理库组合而成的全栈式智能运维一体化平台。实现资源集中管理,在一个平台上对所有资源统一监控;实现运维操作自动化,运维管理流程化,构建智慧运维大脑,加速推进运维场景无人值守智能化。图 14 智能运维管理平台35(2)数据库运维管理系统从数据库基础资源分配、自动化安装部署、统一运维监控、数据库深度巡检、性能容量管理、高可用管理、S
41、QL 审核管理、备份恢复等功能。为客户实现标准化、自动化、智能化数据库的基础能力。图 15 数据库运维管理系统(3)灾备管理平台围绕容灾业务系统,实现容灾切换与回切、业务系统数据的备份和恢复,容灾环境数据回流,全局流量动态监控,当发生故障导致生产环境无法运行时,灾备管理平台可快速拉起容灾系统,持续提供服务,保障业务不中断。36图 16 灾备管理平台(4)智能客服系统智能客服系统提供以客户服务为核心,统一服务平台,统一服务资源,为客户提供全天候、多媒介、一站式、个性化和智能化服务。图 17 智能客服系统(5)智慧运维管家智慧运维驻场管家通过集中化运维、运营化运维,智能化运维打造高质量、高效率的“
42、管家式运维服务”。37图 18 智慧运维管家(6)4A 安全管控平台实现对主机和数据库的统一安全管控,加强安全管控流程和机制建设,提高信息系统安全防范能力,通过建立统一的管理平台,具备“可管理”“可控制”“可运维”“可管控”的能力。全面提升项目运维安全,杜绝运维人员违规及违法操作,避免数据泄漏。图 19 4A 安全管控平台38(7)能效管理平台能管平台打通数据中心动环系统、群控系统、运维管理之间的信息孤岛,实现精准和全面的能耗分析、能效分析、节能诊断等功能,以数据驱动节能运维工作的进行;引入冷源设备能耗模型和制冷系统参数寻优的 AI 手段,实现制冷系统节能的智能化和自动化。图 20 能效管理平
43、台4.24.2.1 运维技术的发展历程信息系统运维由来已久,运维技术的发展与业界的整个技术趋势发展是相辅相成的。其中在运维发展的过程中,最早出现的是手工运维阶段,所有的运维问题基本靠人工操作完成,系统管理员通常身兼多职;其次是脚本工具阶段,在各种自动化脚本产生后,大量重复繁琐的运维操作转化为脚本来实现,提高了运维效率;随着微服务、容器技术的兴起及 DevOps 的出现,运维脚本实现的各流程被有机地串39联了起来,运维技术迎来了流程与工具阶段;当前伴随着大数据、计算机算力、人工智能的发展运维技术发展到了智能运维阶段,智能运维技术利用监控、分析和自愈机制来预测和解决问题,使运维工作更加高效、可靠真
44、正实现了闭环的运维智能化。中国移动一直致力于探索人工智能新技术与运维服务的结合与创新,旨在优化运维服务的工作模式,提升运维服务的准确性及效率性。4.2.2 大型语言模型对运维服务的赋能大型语言模型,如 GPT-3.5,不仅具备卓越的自然语言处理能力,还具备广泛的应用潜力,其中之一就是对运维领域的赋能:辅助类的赋能:大型语言模型可以为运维团队提供强大的工具和资源,帮助他们更快速地解决问题。通过与模型交互,运维人员可以获取实时建议、诊断问题、制定解决方案。这种辅助类的赋能可以大大提高运维效率,减少系统故障对业务的影响。其次,大语言模型可以自动生成运维文档、操作手册和故障排除指南,减少了人工编写文档
45、的工作量,提升了文档的质量和准确性。颠覆类的赋能:大型语言模型不仅可以辅助运维,还可以颠覆运维领域的传统方式。它可以利用自然语言理解和生成能力,建立自动化的运维对话系统,使系统管理员和终端用户能够通过自然语言与系统进行交互,完成常见的运维任务。这种形式的运维赋能了非技术人员,降低了运维门槛,使更多人能够参与到运维工作中,提高了业务团队和技术团队之间的协作效率。同时作为他还能与传统的智能运维40平台相结合,用于分析海量的日志、监控数据和故障报告,发现潜在问题的模式,相比于智能运维在文本类问题的处理中有更高的准确性,有助于减少维护成本和提高系统的可用性。从目前情况来看,大型语言模型作为自然语言处理
46、领域的顶尖成果,虽然对文本处理效果极佳。但是在数理分析,调用链分析等领域仍然有待进步,也正因如此,在实际应用中,也更多地采用传统 AI 算法+大型语言模型共同赋能运维场景的方式,这也在越来越多的场景中被证明比采用单一方法有更好的效果。4.2.3 大型语言模型运维服务的应用场景目前,大型语言模型与运维领域的结合已经逐渐成为现实。这些强大的自然语言处理模型不仅在文本理解和生成方面表现出色,还在自动化运维、故障检测和决策支持等关键运维任务中发挥着越来越重要的作用。中国移动也正在积极探索如何将这些模型应用于实际运维工作中,以提高效率、减少故障时间,并更好地管理复杂的 IT 基础设施。41图 21 大模
47、型运维应用场景如图 21,主要展示传统的 AI 算法与大语言模型共同赋能运维场景,核心的 AI 算法平台以及大语言模型平台,在数据采集组件的支撑下,利用特征提取,微调等方法完成数据分析,并强化算法能力,让通用领域大模型具备运维领域的专业知识。并借助 prompt 管理等工程化方法向上支撑大语言能力中心,大语言模型中心作为能力中台支撑供各个业务场景调用。从而实现数据到模型再到业务应用的能力落地,使得大语言模型的能力在故障自愈、调用链路诊断分析、网络故障诊断、日志分析、告警分析等运维场景得以充分地利用。4.2.4 大型语言模型运维应用愿景大型语言模型在运维领域拥有令人兴奋的潜在价值。它们不仅能42
48、够提高运维效率,还可以在系统可靠性和用户体验方面取得显著突破。这些模型的融合将对未来运维技术带来深远影响,因为它们可以自动化故障检测、实现智能修复、优化资源管理,并提供更智能、响应迅速的用户支持。后续,中国移动将持续开展大语言模型在运维服务领域的探索及应用创新。这包括开发更高级的自动化故障诊断和修复系统,优化自动化运维流程,提高自然语言界面的智能水平,以及深化大型语言模型在文档生成和用户支持方面的应用。此外,大型语言模型的安全性和可解释性也需要得到更多关注,以确保它们在运维领域的广泛应用。展望未来,我们可以期待更强大的运维技术,更高效的系统管理,以及更出色的用户支持体验。大型语言模型将成为运维
49、领域的关键推动者,为企业和组织的数字化转型提供坚实支持。通过深化研究合作,我们将能够实现更多创新,将这些潜力变为现实,为未来的运维技术开辟新的前景。4305典型实践445.1.1 项目背景按照国家发改委颁布的新型智慧城市顶层设计指南提出的“公共服务便捷化、城市治理精细化、生活环境宜居化、网络安全长效化”等规划要求,此县通过新一代信息技术与城市建设深度融合、迭代演进,实现此县经济、产业、环境协调发展的新生态,奋力开创新时代全面建设经济、美丽、平安、智慧的新局面。此县智慧城市项目建设内容可概括为“1 朵云+1 中心+1 平台+1统一门户+N 应用”,1 个县级智慧城市管理运营指挥中心,包括指挥中心
50、装修、LED 大屏及 IT 基础设施;1 个县级智慧城市项目城市管理平台,包括城市物联网平台、数据平台、治理协同平台、综合展示应用平台;16 应用包含智慧停车、智慧园区、智慧社区、智慧城市项目APP、智慧环卫、智慧市容市貌、智慧工地、产业及招商服务、智慧执法、智慧政务、智慧应急、智慧消防、智慧党建、智慧发改、智慧环保、智慧河道等。5.1.2 维护内容针对项目运行过程中所涉及的组织机构、制度规范、IT 资产、信息安全、运行维护等进行管理,有效地融合组织、制度、流程和技术,制定和完善相应的管理制度,实施规范和专业化管理,落实运行维护费用,使运行维护管理体系成为日常工作的重要组成部分,并通过持45续
51、改进运维工作,为平台管理者提供平台运维监控、系统日志分析、平台服务状态监控等运维保障功能。完善运维过程中各个流程管理来确保系统健康运行,达到项目建设的预期目标。5.1.3 实现价值此智慧城市项目以新型智慧城市建设标准为基础,集应急管理中心、城市管理中心、智慧城市运营中心于一体,利用物联网、大数据、云计算等技术,建立一体化、智能化、开放性运行平台,提供对城市和系统平台的体征监测、状态监控、告警管理、设备预防、日志管理、统计分析、综合管理、集中展示、数据分析、融合服务、决策支持等服务,提高了系统管理的整体水平和服务效能。5.2.1 项目背景某省数字政府以“优化营商环境、利企便民、激发市场活力”为目
52、标,依托新一代数字技术,深化“放管服”改革推动政府服务质量和办事效率提升,构筑“低成本、高品质”营商环境。“十四五”期间,某省将立足技术制高点,建设全国一流、中西部领先的数字政府,形成协调推进有力、技术体系完备、安全管理有序、制度规范健全的现代政府新格局,形成共建共享共治共同富裕的数字某省。为进一步明确“十四五”期间某省数字政府改革建设的目标,指导全省各级政府推进数字政府建设任务和工程化项目落地,根据国家46相关部署和某省国民经济和社会发展第十四个五年规划和二 O 三五年远景目标纲要及某省数字政府建设总体规划和某省数字政府建设系统集成规划设计的要求,建设某省数字政府建设系统项目。5.2.2 建
53、设内容(1)“12345+N”总体架构坚持全省“一盘棋”工作机制,构建某省数字政府“12345+N”体系,即深化“放管服”改革优化营商环境 1 条主线,管理和技术 2个架构,一网通办、一网统管、一网协同 3 个关键链条,某省快办(一网通办)、某省政通(一网协同)、12345 热线、不来即享 4 个特色品牌,省、市、县、乡、村 5 级贯通的政务服务体系,N 个政务服务应用系统。(2)技术架构构建某省数字政府“1 网+1 云+1 基座+1 支撑+1 中心+1 平台+N 应用+1 入口”的技术架构,即全省政务一张网、一朵云、一个大数据基座、一个公共应用支撑平台、一个运营指挥中心、一个政务服务能力平台
54、、N 项应用、统一线上入口服务。(3)一体化运维以“业务不能断、数据不能丢”两条底线为根本出发点,打造“咨询规划、能力交付、产品部署、持续运维”四位一体的数字政府运维能力体系。基于 ITSS 标准化运维体系,从人员、过程、资源、技术等四方面推进数字政府一体化运维体系建设。统筹擘画一体运维架构,47构建统一运维模式,组建集中运维团队,制定标准化运维制度流程,强化业务运行监控、运维服务响应与支持、业务系统容灾、政务数据定时备份、突发事件应急处置、技术咨询等运维服务能力,结合数字政府项目运维实际需求,制定面向应用运维的系列运维管理办法和细则,配置 31 个线上化运维作业流程,编制 8 类 47 项运
55、维制度和办法;通过设立统一的运维服务台、建立集中运维中心、组建一线运维团队,拉通后端技术支撑团队,锻造数字政府运维组织保障能力;通过打造智慧运维监控平台、运维工单系统、智能客服系统、驻场运维管家系统、容灾备份系统、安全运维管控平台等六大运维信息化工具,打造数字政府工具支撑体系,进而实现智慧化、标准化、敏捷化的数字政府一体化运维模式。5.2.3 实现价值2021 年夯基垒台,对标先进省份,完善智慧城市标准规范体系,建成周密完备的数字政府基础设施体系,做优政务一张网、连接政务一片云、打造大数据基座,全省运营指挥中心初步与各系统对接,实现政务信息连通,初步提升某省一体化政务服务能力。2022 年成熟
56、定型,建立完善的组织保障体系,完成主要建设任务,初步实现政务服务一网通办、社会治理一网统管、政府运行一网协同,一体化政务服务新模式基本成熟定型。20232024 年巩固提升,深化政务信息系统整合,持续推进数据开放、共享、融合,实现政府数据与市场数据、社会数据深度互联共享。2025 年争先进位,打造全国闻名的某省智慧48城市服务品牌,形成完善的智慧城市标准规范体系、应用支撑体系、组织机制体系、法律法规体系、人才培养体系、安全保障体系、考核评价体系,建成“全国一流、中西部领先”的服务型智慧城市,有力引领智慧城市、数字经济、数字社会发展。打造智能化运维体系。某省项目通过采用一体化运维方式,组建省级运
57、维中心,设立全省统一的运维服务热线、组建集中化运维团队、开展全省集中运维监控、推进全省一体的本异地数据备份,实现政务云、政务网、政务系统、系统安全的一体化集中运维,按照项目实际情况,梳理制定智慧城市运维制度、手册,规划智慧城市运维流程,在运维监控、工单流程、数据备份、运维服务、系统容灾、安全管控等方面建设智慧化智慧城市运维工具,持续提升运维效率的同时,通过运维经营分析,持续提升政务云资源使用率,压降项目运维成本。其中自研的监控平台、工单系统、资料管理系统等在项目运维工作中深度应用,产品功能不断优化,运维场景不断丰富,实现运维能力和产品支撑能力同步提升。图 22 智能运维体系495.3.1 项目
58、背景东北某省数字政府项目以“数跑某省”为统领,采用大数据、人工智能、区块链等新型数字技术,全面打造企业和群众办事环节最简、材料最少、时限最短、费用最小、便利度最优、满意度最高的“六最”特色营商品牌。从重塑业务流、优化管理流、贯通数据流方面开展某省数字政府建设,构建省市县一体的某省数字政府总体框架,搭起数字政府的“四梁八柱”,其中建设全省一体化运维服务体系的目标是保障某省数字政府项目应用系统的安全、稳定、高效、持续运行。5.3.2 建设内容基于东北某省数字政府项目实际运维需求,从运维组织架构、运维管理平台、运维团队建设、运维制度流程等方面构建某省数字政府运维服务体系。(1)运维组织架构:建立省数
59、字政府运维组织架构,包括人员职责、管理层级、工作流程等,明确各级管理职责和运维流程。(2)运维管理平台:建立省数字政府运维管理平台,包括运维监控系统、工单管理系统、运维热线平台等,实现全面的运维监控和故障的全生命周期管理。50(3)运维团队建设:建立省数字政府运维团队,组建专业化的运维技术团队,包括技术支持、运维管理、安全保障等,提高运维能力和效率。(4)运维流程标准化:制定省数字政府运维流程标准,包括故障处理、变更管理、性能优化等,实现运维流程的标准化和规范化。(5)运维服务质量保障:建立省数字政府运维服务质量保障机制,包括运维服务评估、服务质量监控、服务反馈等,提高服务质量和用户满意度。(
60、6)运维知识管理:建立省数字政府运维知识管理体系,包括知识库、培训、技术沉淀等,提高运维人员的专业素养和技术能力。(7)运维合作机制:建立省数字政府运维合作机制,与相关厂商、服务商、院校等建立合作关系,共同推进数字政府运维体系建设。5.3.3 实现价值构建省数字政府运维服务体系,旨在为省级数字政府项目建立一套规范化、标准化、制度化的运维体系。实现对系统运行状态的全面监控和运行问题的及时处理,确保省数字政府项目业务系统能够持续稳定地提供服务。(1)专业化、精细化、运营化1)建立组织统一、职责明确的运维团队,具备专业化的技能和知识;512)对某省数字政府业务系统进行精细化的管理和维护,确保安全、稳
61、定、高效运行;3)对某省数字政府的应用和业务进行运营和管理,提高政府服务质量和效率。(2)标准化、可视化、可量化1)制定统一、规范的运维流程,确保运维工作的规划性和一致性;2)可视化的监控系统,实时了解系统运行状态,及时发现问题并进行预警;3)制定可量化的运维指标和绩效评估体系,为运维工作的持续改进提供有力支持。(3)自动化、数字化、智能化1)自动化的工具和流程,减少人工干预和操作,提高运维效率和准确性;2)通过对运维数据进行采集、存储和分析,提高运维可视化和可量化水平;3)智能化的工具和算法,对某省数字政府的运行状况进行预测、预警,提高服务响应速度。5.4.1 项目背景(1)项目概况北京某互
62、联网数据中心是其在华北地区的重要节点机房,位于北52京市大兴区,总建筑面积 3.8 万 m2,可容纳 1388 架整机柜(8.8kW/台的高功率密度机柜),已上电机柜 1380 架,装机率为 99.4%,目前 IT 负荷约 11000kW,负载率 90%左右,PUE 设计值为 1.3。项目承载其搜索、地图、钱包等核心业务,客户对安全性、可用性要求极高,同时互联网企业对新技术应用、降本增效也有业内最高要求。(2)运维需求本项目要求我方负责数据中心暖通、电气、弱电等基础设施自有资产(本项目为我方与其合作共建项目,基础设施资产为我方自有资产)的运行维护和维保工作,基础设施运营管理需通过 UPTIME
63、 M&O(管理和运行)认证,机房楼内的动力环境可用性不得低于 99.99%,即每月动力环境不可用时间小于 4.4 分钟。节能方面,在整个机楼合计年均 IT 负载达到 70%的条件下,年均 PUE 不超过 1.4,若年均 PUE值大于 1.4,我方承担超出部分电费的 10%,若年均 PUE 值小于 1.3,客户按照节省部分电费 10%的金额向我方支付奖金。5.4.2 建设内容项目构建起一套一体化运维管理体系,同时注重加强人才储备管理,以全面提升运维管理机制效率和运维管理服务能力,将运维对象的“质”(服务质量)与服务对象的“效”(应用成效)深度耦合,以质促效,如下:节能管理:建立系统调优参数表,精
64、细化管理,严格控制机房温度,加强设备维护,关注强烈影响能耗效率的蛀点;53预防性维护:建立维保设备清单,建立维护保养工作计划表,制定并实施主要设备的维保操作流程;运维分析:对整个运维态势进行分析、评估和总结,包括:整体评估、运行成效、当前问题、改进措施;计划管理:年度计划、季度计划、月度计划、周计划、暖通系统运维计划、电力系统运维计划、弱电系统运维计划、消防系统运维计划等;故障处理:遵循机房故障处理流程,并按照其中要求对故障进行分级、通报、处理和分析总结;标准操作:制定并实施数据中心设备常见操作的标准流程,对一些重要操作将做好预案并进行审核后方可执行;日常巡检:根据机房的实际情况建立巡检制度,
65、定义巡检设备的重点巡检关注内容,并做好质量控制、记录、保存;应急预案:根据要求制定数据中心应急预案,包括常见突发事件、单点故障及带病运行的隐患;应急演练:结合数据中心实际情况,制定每年的应急演练计划,做到定期组织,全员覆盖;工单管理:日常运维的常见操作都以工单的形式进行,所有的工单都有跟踪和记录,并存档备查;文档管理:编制文档管理目录,并建立文档管理系统,同时纸质文档集中放置,重要参考文档和资料有备份;容量管理:建立容量管理流程,包括空间、电力、制冷,且定期54输出容量报告,定义供电和暖通链路的容量短板;日志、报表:建立班次日志制度,每个班次都按规定填写日志;按规定制作周报、月报、季报和年报;
66、危害物资及场景识别:在危害物资存放地点或者危害场景地点设置显著的提醒标志,定期进行危害物资和场景的相关培训;设备轮换:根据机房的实际情况制定机房设备轮换计划,并按计划实施;专题问题优化:根据数据中心的实际情况,按需进行相关专题调研优化;关注行业重大运维事件,展开针对性学习分析;组织及岗位设定:根据业务需求和机房规模配置运维人员,建立明确的组织架构和岗位职责分工制度,建立专职人员配置及专业资质要求制度,建立人员个人信息及联系方式列表,建立关键人员备份制度;人员发展及培训:建立员工培训及考核管理制度(含新员工入职培训);供应商管理:建立完整的供应商及联系人列表,保证出现紧急情况有专业的咨询人可查;
67、机房 6S:整理(SEIRI)、整顿(SEITON)、清扫(SEISOU)、清洁(SEIKETSU)、素养(SHITSUKE)、安全(SAFETY)。5.4.3 实现价值为达成客户 SLA 要求,项目运维团队积极探索新技术、新方法,55依据 UPTIME M&O 管理体系和标准制定了一套运维体系,并通过最大化利用自然冷源和策略调优等手段保证 PUE 压降。主要手段有:维护操作规范化:针对性编制了维护操作流程(MOP)58 项、标准操作流程(SOP)46 项,应急操作流程(EOP)33 项;事件、问题、变更流程全面落实:通过 PDCA 循环提升事件处理效率,降低重大事件发生概率;自然冷源利用最大
68、化:通过提高供水温度、改善水系统换热效率等措施,最大化利用自然冷源,降低运行能耗;设备工况调整最优:通过调整水泵转速、冷塔串联、充分采取蓄冷罐等措施,改善水泵、冷却塔、冷水机组性能曲线,提高运行效率。2017 年,本数据中心以 90.5 分高分数通过 UPTIME M&O 认证,运维管理达到国际一流水平。PUE 连年下降,2022 年均 PUE 为 1.15,全年累计节省电量 1500 万 kWh,节省电费 900 余万元,减排二氧化碳 5111 吨,获得客户 PUE 奖励 90 万余元,节能水平业界领先。5.5.1 项目背景华北某省超大型数据中心,项目占地 1402 亩,总建筑面积 62.1
69、万平方米,基础设施总投资 150 亿元,计划建设 18 栋仓储式数据机房,提供 20.4 万标准机架(2.5kW)服务能力。目前共启用 8 栋机房楼,每个数据机房建筑面积 22000 平方米,共计 18000 左右机架、80000+业务设备。56该数据中心运维需求场景较多,需维护数据中心在用和在建所有机房,包括智能化、IDC 网络系统、云系统以及二枢纽 IDC 机房涉及的所有 IDC 业务设备、网络、系统软件等的 IT 设备和机房物理环境。专业涉及云计算、网络、安全、智能化、监控、传输等多个领域。5.5.2 建设内容现场由网络、安全、云平台维护、智能化、客户支撑、监控、移动云、专项服务组,共计
70、八个专业组 64 名一线人员进行现场维护工作,同时,由多位网络、安全等各领域专家组成二线支撑体系。此外,引入 OneService 运维方案,结合此数据中心运维现场庞杂的需求,将资源集中管理、监控融合分析、运维操作自动化、流程处理自动化等多种智慧运维手段引入运维工作中,构建智慧运维大脑,打造监管控一体化的新运维模式,加速推进此数据中心整体运维能力智慧化。5.5.3 实现价值项目涵盖了 IDC 全业务运维,我公司自承接后重建运维业务流程,在传统 IDC 运维基础上结合自有经验和定制化智能产品,引入OneService 运维方案,依托一、二线运维体系,融合了 IDC 综合运营支撑能力、IDC 基础
71、设施运维能力、智慧运维平台能力,通过运维工作,实现了此数据中心运维的“一体化、集中化、智能化、自动化”。575.6.1 项目背景西南某行业云数据中心总占地 118 亩,建筑面积 15.6 万平方米,总投资 29.4 亿元,含设备投资超过 160 亿元,震设防烈度为 8 度,建筑耐火等级 1 级,累计投产机架资源 17734 个,是该省最大规模最先进的数据中心,也是西南地区最大的数据中心之一。2019 年集团公司进行“云改”,加速打造云计算核心能力,优化全集团云网资源体系。面向外部客户需求,统一“移动云”品牌,提供公有云、私有云、混合云服务;面向公司自身内部需求,建立三朵云,即 IT 云、业务平
72、台云和网络云。5.6.2 维护内容平台整体定位为混合云架构,完善了本省云能力底座,与集团公有云形成能力互补。主要满足发改委、党政军、垂直行业等客户的业务需求。我公司负责维护行业云运维工作,服务能力主要包括售前(需求沟通、方案核对、资源测算、资源核对)、售中(实施沟通、产品开通交付、功能配置)、售后(资源变更、日常巡检、数据安全备份、故障处理、资源核查)、专项(平台建设、重点保障、日常培训、客户现场支持、工单系统支撑)等。585.6.3 实现价值行业云项目的运维工作,为该省政务单位用户提供安全可靠的资源平台。充分运用云计算、大数据等先进理念和技术,按照“集约高效、共享开放、安全可靠、按需服务”的
73、原则,以“云网合一、云数联动”为架构,实现政府各部门基础设施共建共用、信息系统整体部署、数据资源汇聚共享、业务应用有效协同的客户需求。开展政务大数据开发利用,为政府管理和公共服务提供有力支持,提供为民服务,提升政府现代治理能力,在有效降低重复建设资源、节能环保的基础上,提高基础设施资源的利用率,实现了该省信息化基础设施资源的统一规划、统一建设、按需调配、即需即用、有效共享。通过合理规划、小步快跑的方式,在实现建设集约化、信息共享化、效益最大化的同时,满足该省各政务部门、委办局 IT 基础设施的应用需求,为该省未来政务大数据产业奠定基础。5906生态合作60中国移动基于 OneService 运
74、维品牌,整合了丰富的生态资源。秉承 ITSS 的前瞻理念,在引进关键技术如 AI、5G 等元素的同时,形成了一套结构化、体系化的运维流程与制度。我们倾力确保业务连贯性和数据安全性,为广大用户提供专业、规范的运维服务,使运维工作得以有序、高效地推进。同时,我们从人员、过程、资源、技术四个维度着手,逐步打造智慧城市标准化运维服务体系。作为全球领先的电信运营商,中国移动积极投身于智慧城市的运维与运营工作。尤其是在业务系统、IT 基础设施和业务等各层面,我们深耕细作,涵盖了标准规范的制定、咨询、工具构建到运维保障等多个领域,旨在优化业务流程、提升运营与运维效率。我们明白,科技日新月异,5G、物联网、人
75、工智能等科技进步无疑将进一步推动智慧城市的发展。我们欣喜于眼前的机遇,同时也清醒地意识到将要面对的挑战。然而,中国移动坚信,完善的生态合作模式是我们做好智慧城市运维的关键。中国移动将通过开放的合作、高效的运维和创新的技术,构建一个更美好的智慧城市。我们期待与所有的合作伙伴一起探讨智慧城市的未来,共建生态共赢的智慧城市。面对未来,我们充满了期待;面对挑战,我们勇往直前。中国移动愿与所有合作伙伴一起,为智慧城市保驾护航,共创美好未来。61声明本白皮书在编制过程中引用了互联网公开信息资源并尽可能地对有明确来源的信息注明了出处,在此对各类信息资源的提供者表示感谢,所引用内容其著作权和版权归原作者、来源媒体、原网站所有。但是我们也知道,凡事总有可能挂万漏一,对本白皮书没有注明来源的内容提供者同样表示感谢。如果任何单位或个人认为本白皮书内容可能不规范使用,欢迎及时联系我们,我们将对相关内容进行处理。本白皮书的版权归中国移动所有,未经书面授权,任何单位或个人不得擅自使用(包括但不限于复制、传播、展示、镜像、上载、下载、转载、摘编)或许可他人使用本白皮书之部分或全部内容。中国移动保留依法追究其法律责任的权力。白皮书编制组联系方式:。