上海品茶

您的当前位置:上海品茶 > 报告分类 > PDF报告下载

2022年云计算白皮书(45页).pdf

编号:84796 PDF 45页 1.84MB 下载积分:VIP专享
下载报告请您先登录!

2022年云计算白皮书(45页).pdf

1、No.202210 中国信息通信研究院 2022年7月 云计算云计算白皮书白皮书 (20222022 年年)前前 言言 2021 年 3 月以来,我国先后发布了中华人民共和国国民经济和社会发展第十四个五年规划和 2035 年远景目标纲要、“十四五”软件和信息技术服务业发展规划、“十四五”数字经济发展规划等一系列政策文件。这些文件都将云计算列为数字经济重点产业,实施上云用云行动,促进数字技术与实体经济深度融合,赋能传统产业转型升级。云计算作为数字技术发展和服务模式创新的集中体现,仍将在未来数年内处于蓬勃发展的黄金时期,并为数字经济发展提供强有力的基础支撑。在此背景下,中国信息通信研究院继 云计算

2、白皮书(2012 年)之后第 8 次发布云计算白皮书。本白皮书聚焦过去一年多来云计算产业的新发展新变化,重点围绕技术、模式、应用、安全、管理等云计算领域热点话题以及云计算的发展趋势进行深入探讨,旨在帮助读者更好地把握云计算产业动向。目目 录录 一、全球云计算市场增速反弹,我国保持高速增长.1 二、我国云计算展现中国特色,产业呈现五大特点.4 三、云原生技术和能力不断成熟,加速企业 IT 要素变革.8(一)云原生技术生态渐完善,为企业 IT 要素提供技术保障.8(二)云原生能力模型渐丰富,为企业 IT 要素提供运维保障.9(三)云原生深度融合基础设施,促进企业 IT 要素全面升级.10 四、云服

3、务向算力服务演进,助力算力经济高质量发展.13(一)算力服务是云服务的升级,呈现“三化”特点.13(二)算力服务技术快速发展,全新体系雏形初现.15(三)算力服务成为算力经济高质量发展必经之路.18 五、云上系统稳定性面临挑战,技管结合助力能力提升.20(一)系统上云面临多重挑战,稳定性保障迫在眉睫.20(二)建设云上业务安全生产体系,完善流程管理机制.22(三)构筑全流程稳定性保障体系,提升技术保障能力.22 六、云安全聚焦应用新技术理念,构建上云全流程安全体系.25(一)云计算面临新的安全需求,云上安全机制亟待改进.25(二)上云前完善供应链入口管控机制,规避云计算引入风险.27(三)上云

4、中应用零信任理念构建安全体系,保障云上资源可信访问.28(四)上云后建立统一安全运营能力,充分释放安全资源价值.30 七、云成本优化治理势在必行,流程贯穿上云用云全生命周期.32(一)云资源浪费现象普遍,优化治理面临挑战.32(二)人员、工具和机制是云成本优化的关键要素.34(三)云成本优化流程贯穿上云用云全生命周期.37 八、发展展望.39 图图 目目 录录 图 1 全球云计算市场规模及增速.1 图 2 中国公有云市场规模及增速.2 图 3 中国私有云市场规模及增速.2 图 4 中国公有云细分市场规模及增速.3 图 5 2021 年中国公有云 IaaS 市场份额占比.4 图 6 企业 IT

5、建设目标、要素与云原生技术、能力关系示意图.11 图 7 算力服务技术体系.16 图 8 IaC 技术示意图.17 图 9 算力交易过程示意图.18 图 10 应用多活技术架构.24 图 11 上云全流程安全机制.26 图 12 零信任云上防护场景.29 图 13 企业云成本优化能力建设框架.34 表表 目目 录录 表 1 不同上云模式下软件供应链安全入口管控要求.28 表 2 SOC 与 XDR 优势对比.32 云计算白皮书(2022 年)1 一、全球云计算市场增速反弹,我国保持高速增长 全球云计算市场逐步回暖,增速实现触底反弹。随着经济回暖,全球云计算市场所受影响逐步减弱,至 2021 年

6、已基本恢复到疫情前增长水平。根据 Gartner 统计1,2021 年以 IaaS、PaaS、SaaS 为代表的全球公有云市场规模达到 3,307 亿美元,增速 32.5%。来源:Gartner,2022 年 4 月 图 1 全球云计算市场规模及增速 我国云计算市场持续高速增长。2021 年中国云计算总体处于快速发展阶段,市场规模达 3,229 亿元,较 2020 年增长 54.4%。其中,公有云市场继续高歌猛进,规模增长 70.8%至 2,181 亿元,有望成为未来几年中国云计算市场增长的主要动力;与此同时,私有云市场突破千亿元大关,同比增长 28.7%至 1,048 亿元。1 Foreca

7、st:Public Cloud Services,Worldwide,4Q21,Gartner,2022 年 4 月 云计算白皮书(2022 年)2 来源:中国信息通信研究院 图 2 中国公有云市场规模及增速 来源:中国信息通信研究院 图 3 中国私有云市场规模及增速 我国公有云 IaaS 及 PaaS 保持高速增长,SaaS 稳步发展。2021年,公有云 IaaS 市场规模达 1,614.7 亿元,增速 80.4%,占总体规模的比例接近四分之三;PaaS 依然保持着各细分市场中最高的增长速云计算白皮书(2022 年)3 度,同比增长 90.7%至 196 亿元;SaaS 市场继续稳步发展,规

8、模达到370.4 亿元,增速略微滑落至 32.9%,预计在企业上云等相关政策推动下,有望在未来数年内随着数字化转型重启增长态势。来源:中国信息通信研究院 图 4 中国公有云细分市场规模及增速 厂商份额方面。据中国信息通信研究院调查统计2,阿里云、天翼云、腾讯云、华为云、移动云占据中国公有云 IaaS 市场份额前五3;公有云 PaaS 方面,阿里云、华为云、腾讯云、百度云处于领先地位。2 市场规模为 2021 年全年数据统计,主要依据企业财报,人员访谈,可信云评估,历史数据等得出。对于市场数据不明确的领域,只发布头部企业整体情况,不做具体排名。3 因为 IaaS 和 CDN 是两种业态,需要分别

9、获得互联网资源协作服务业务牌照和内容分发网络业务牌照,所有 IaaS 不包括 CDN 收入,只统计计算、存储、网络等基础资源服务收入。云计算白皮书(2022 年)4 来源:中国信息通信研究院 图 5 2021 年中国公有云 IaaS 市场份额占比 二、我国云计算展现中国特色,产业呈现五大特点 云计算作为信息技术发展和服务模式创新的集中体现,已成为企业及产业实施数字化转型的重要基础。近年来,我国高度重视云计算产业发展,并在政策标准、产业布局、部署模式、行业应用等方面形成一些中国特色:一是政策指引转向深度上云用云,标准建设拓展至新技术应用。政策层面,国务院、工信部发布多项政策促进企业深度上云用云。

10、2021年的 中华人民共和国国民经济和社会发展第十四个五年规划和2035年愿景目标纲要和“十四五”数字经济发展规划提出,实施上云用云行动,促进数字技术与实体经济深度融合,赋能传统产业转型升级。2022 年 4 月,工信部启动企业上云用云实施指南(2022)编制工作,持续深化企业上云行动,进一步提升应用云计算的能力和效果,推动企业高质量上云用云。标准层面,经过多年发展,云计算标云计算白皮书(2022 年)5 准体系不断完善,涵盖了云计算框架和术语、技术和架构、软件和服务、安全和开源、运维和运营等多个领域。同时,云计算相关国家标准、行业标准和团体标准制定工作有序推进。一方面,云计算标准不断向云原生

11、、云网融合、云边协同、高性能计算、算力服务、软件工程、数字化、开源等技术方向拓展,促进云计算产业持续创新发展。另一方面,政务、金融、工业、交通、医疗等行业应用标准数量显著增加,在规范各行业云计算平台和应用建设的同时,推动云计算向行业深度应用落地。二是产业集聚效应明显,布局发展从东部向中西部逐步扩散。当前,我国云计算产业已形成京津冀、长三角、大湾区三大热点区域。这一特征和我国经济区域分布高度重合,经济发展水平与云计算产业活跃程度彼此促进、相辅相成。根据腾讯研究院统计,2021 年一季度全国用云量同比增长率呈现中部最高、西部次之的特征,这从侧面反映出云计算产业正在由东部向中西部加速扩散的特点。另外

12、,随着2022 年 2 月“东数西算”工程正式启动,云计算将成为“东数西算”中算力的关键载体与主要服务形式。在多重因素刺激下,中西部正在加大云计算领域的投入,云计算产业加速“下沉”,区域间的“数字鸿沟”预计将会进一步缩小。三是市场需求持续更迭,多种部署模式并存发展。随着企业上云程度持续加深,用户在服务形态、平台性能、数据安全、建设成本等方面的需求层出不穷。由此,在原有公有云、私有云、混合云的基础云计算白皮书(2022 年)6 上,市场又催生出分布式云、专有云、托管云等新型部署模式。1)分布式云,企业可依托分布式云,按需租用不同物理位置的云服务,将近场应用部署于边缘云,资源消耗较大的主应用和管理

13、平台部署于中心云,即满足边缘节点应用和数据采集需求,又能满足大规模计算要求,获取无处不在的算力服务。2)专有云,企业可采用专有云,通过兼具物理资源独享和弹性按需的云服务,满足企业业务资源灵活性的需求以及更高的数据安全要求,同时降低企业信息化建设运维成本。3)托管云,企业可采用托管云,将部分应用、业务的运维和运营托管给云服务商,满足企业对近地存储计算和系统安全的需求,实现企业轻资产上云、低成本用云。四是行业应用水平参差不齐,阶梯状发展特点明显。我国云计算应用已从互联网拓展至政务、金融、工业、医疗、交通等传统行业,但各行业应用水平参差不齐,应用深度呈现阶梯状分布。位于第一梯级的互联网和信息服务业已

14、基本实现云计算的深化应用。这些行业基于自身具备 IT 属性的先天优势,充分将人工智能、大数据、区块链等新兴技术与云原生能力融合,提升企业业务智能化水平。位于第二梯级的金融、政务、交通等行业云化改造能力持续加深。以金融行业为例,普遍采用容器、微服务、中间件等云原生技术进行底层架构的云化升级,构建敏捷高效的研发运维体系,加大云原生应用重构能力的力度。位于第三梯级的能源、医疗、工业等行业的核心系统云化改造程度有待提升。上述行业云化改造主要针对非核心系统开展。如医云计算白皮书(2022 年)7 疗行业的云化改造主要针对信息及门户系统、档案及医事服务等系统,通常采用专有云或混合云部署;能源行业的生产环境

15、大多处于边远地区,对分布式云的应用尚不足,仍需运用云边协同进行边缘侧云化改造。与此同时,过去一年我国云计算产业在技术、模式、应用、安全、管理等方面呈现出新的发展特点,具体表现在:一是技术方面,云原生持续加速企业 IT 要素变革。云原生技术在企业侧的应用持续深化,正在加速企业信息系统由烟囱状、重装置和低效率的架构向分布式、小型化和自动化的新一代软件架构的转变。云原生改进了企业 IT 技术和基础设施,也深刻改变着组织和流程、软件架构和设计的发展走向,成为企业用云的新范式。二是模式方面,算力服务助力构建全新算力经济范式。算力服务以云服务为基础,推动云网边端融合协同,实现算力的普惠化、泛在化和标准化。

16、算力服务将在赋能传统行业的同时加速新型算力产业化的进程,成为推动算力经济发展的重要引擎。三是应用方面,稳保能力有效降低云上系统故障影响。随着上云业务量的持续提升,企业系统面临着容量管理难、服务关系调用复杂等问题,对稳定性带来了巨大挑战。稳定性保障能力通过事前规划、事中检测、事后管理形成的流程闭环,将信息化手段与传统方式相融合,能够有效保障业务系统的稳定性和连续性。四是安全方面,全流程安全体系积极应对云上新型威胁。面对各云计算白皮书(2022 年)8 类新技术应用带来的云计算新威胁,云上安全机制亟待改进。上云企业利用新理念、新技术,不断优化安全机制,以软件供应链安全、零信任、统一安全运营等为切入

17、点,构建上云全流程安全体系。五是管理方面,云优化治理助力企业成本长效管理。企业用云程度不断加深的同时也带来了资源浪费的问题,围绕成本因素开展优化治理成为企业当前的重要课题。以人、工具和运作机制为核心构建的云成本优化体系将贯穿企业战略规划、资源采购、上云路径、用云管控、持续运营等多个环节,助力企业降本增效。三、云原生技术和能力不断成熟,加速企业 IT 要素变革(一)云原生技术生态渐完善,为企业(一)云原生技术生态渐完善,为企业 IT 要素提供技术保障要素提供技术保障 云原生技术生态日趋完善,细分技术项目不断涌现。相较于早期云原生技术主要集中在容器、微服务、DevOps 等领域,现如今其技术生态已

18、扩展至底层技术(如服务器无感知技术 Serverless)、编排及管理技术(如基础设施即代码 IaC)、安全技术、监测分析技术(如扩展包过滤器 eBPF)以及场景化应用等众多方面,形成了完整的支撑应用云原生化构建的全生命周期技术链。同时,细分领域的技术也趋于多元化发展,如在容器技术领域,从通用场景的容器技术逐渐演进出安全容器、边缘容器、裸金属容器等多种技术形态。这之中,Serverless、IaC 技术与云原生的理念高度契合,在简化运维、加速软件功能解耦方面发挥了重要作用。云计算白皮书(2022 年)9 IaC 能够简化运维,显著提升部署的敏捷性。为了满足业务应用敏捷迭代和稳定运行的要求,Ia

19、C 基础设施即代码作为云原生声明式操作思想的具体实践,可以帮助基础设施环境具备极致弹性、自动化配置、一致性部署等特性,简化整个应用程序生命周期的操作,减少开发人员的工作量,降低基础设施管理的成本,并提升部署的敏捷性。Serverless 能够实现业务和基础设施分离,提升用户业务创新能力。为了保障软件架构微服务拆分后的功能解耦,通过采用多种服务器无感知技术,将基础设施抽象成各种开箱即用的服务,以 API 接口的方式提供给用户按需调用,真正做到按需伸缩、按使用量收费。这种架构可以消除传统业务中持续在线服务的海量计算资源的需求,降低开发和运维的复杂性,减少运营成本并缩短业务系统的交付周期。(二)云原

20、生能力模型渐丰富,为企业(二)云原生能力模型渐丰富,为企业 IT 要素提供运维保障要素提供运维保障 基础设施管理方面,云原生构建统一的调度、管理和运行维护能力。通过统一资源管理和统一集群调度,实现中心云、边缘云和数据中心的统一管理调度,全面覆盖边缘自治、混合多云、云边一体的典型资源使用场景。通过统一流量治理,实现东西流量、南北流量的统一治理策略管理,支持跨云、跨集群的拓扑监控能力。通过统一运行维护,实现多中心的不同集群的完整运维能力协同,将云上监控、日志、审计能力延伸至混合多云架构。云计算白皮书(2022 年)10 应用管理方面,云原生构建统一的治理和分发能力。通过统一应用治理,实现独立灵活的

21、策略和应用配置,保障了应用的一次构建多次部署运行,同时可根据资源利用情况实现多集群间的弹性部署。通过统一数据治理,实现一站式高度标准化数据基础资源设施,获得高资源利用率、弹性伸缩、动态扩展与高密度部署的能力,增强数据服务的易用性。通过统一生态管理,实现平台的非自有能力组件的快速上架、发布、订阅、部署、运维等全生命周期管理,实现跨云的部署和分发。通过统一应用分发,实现应用负载、对外发布、环境差异和数据存储等特性的应用抽象描述,基于统一的分发机制,在不同数据中心间获得一致的发布运行体验。运维管理方面,云原生构建统一的安全防护和优化能力。通过统一安全治理,可将云端的微隔离、漏洞治理、威胁情报处理、云

22、原生应用保护平台等安全能力下放至分布式节点,实现安全的统一能力纳管、统一攻击防护、统一响应和统一运营,快速提升分布式接入节点的安全能力。通过统一成本治理,并结合资源预测、智能弹性和混合部署等技术能力,可实现资源使用情况的自动巡检,根据历史情况进行智能化的弹性预测,最大限度地提升全域资源的利用率。(三)云原生深度融合基础设施,促进企业(三)云原生深度融合基础设施,促进企业 IT 要素全面升级要素全面升级 云原生理念最早是在 2013 年被提出的,它是先进架构技术和管理方法的思想集合,致力于帮助企业实现降低开发维护成本、降低高云计算白皮书(2022 年)11 频部署引发的运行风险、加速业务市场增长

23、的目标。过去几年,企业对云原生的应用多局限于技术和基础设施能力的改进,而忽略了架构和设计、组织和流程等其他 IT 要素的考量。一方面是因为用户对云原生的理解认知趋于片面,没有考虑技术与业务的融合联动;另一方面是因为云原生核心技术的发展尚未成熟,无法提供满足业务发展的技术能力支撑。随着云原生技术和能力不断完善,其将驱动企业组织和流程、架构和设计、技术和基础设施等 IT 要素的全面升级。来源:中国信息通信研究院 图 6 企业 IT 建设目标、要素与云原生技术、能力关系示意图 云原生促进组织和流程向团队自治、流程敏捷自动化发展。为了实现云原生的业务价值,团队需要在业务和 IT 之间快速协调,以更自动

24、化的方式将更改部分提交到生产环境,并对所交付的内容负责。这需要业务团队采用敏捷的协作方法,即采用 DevOps 原则和流程自云计算白皮书(2022 年)12 动化工具,并赋予团队一定程度的自治权。敏捷方法使去中心化的自治团队能够缩短变更周期,更紧密地结合业务需求,从而具备迭代周期缩短和数据驱动反馈等特点。这些特点的实现依赖于代码生命周期自动化的程度,即通过持续集成、持续交付部署和持续采用三个关键流程的建设优化,实现自动化的效率提升。在敏捷和自动化的基础上,需要持续提升团队自治能力,来加速创新能力和生产力的提升,这包括了所有权去中心化、技术自由和自助配置等。云原生促进架构和设计向分布式、微服务化

25、发展。云原生将传统的、烟囱式的、有状态的粗粒度应用程序组件拆分解耦,以分布式的形态部署到基于容器的云基础设施上。为了更好的发挥云原生的优势,需要考虑软件架构的设计原则,使其能够充分利用底层云基础设施,同时兼顾灰度发布的能力以保障更新部署的稳定性。首先需要将应用架构微服务化,解耦成细粒度组件,以获得可单独变更的灵活性、组件级独立伸缩的能力,使充分解耦下的独立运行单元互不干扰。这需要细粒度组件适当的解耦、组件间具备清晰的所有者边界、规范化的接口定义和持久化存储能力。基于不可变部署,实现解耦组件统一部署和管理,极大的简化运维,这保证了代码始终与其所有依赖的配置一起部署,提高了测试可信度,更加简单快速

26、地重建环境。云原生促进技术和基础设施向灵活弹性、自动化发展。云基础设施将底层硬件抽象出来,使业务应用能够快速地自助配置和扩展,这需要云基础设施能够使用相同的操作技能管理不同的语言和产品运云计算白皮书(2022 年)13 行时,促进操作自动化,并提供一个可观测性的框架。管理基础设施的平台需要提供一种通用的机制,屏蔽部署过程中的非功能性问题,同时具备弹性资源管理能力、不可知部署操作和默认安全设置的特性。要实现操作敏捷性,需要相关组件尽可能简单和轻量,这需要引入轻量级的运行时,来保证组件的快速启停和部署。基于云原生容器镜像的部署方式,保障了代码及其运行时的统一,借助 IaC 等技术可实现通过编写代码

27、的方式部署、扩展和维护业务应用,大幅提升操作的自动化程度。四、云服务向算力服务演进,助力算力经济高质量发展(一)算力服务是云服务的升级,呈现“三化”特点(一)算力服务是云服务的升级,呈现“三化”特点 当前,云服务作为通用算力已成为赋能企业业务单元转型的关键,但随着企业数字化程度不断加深和数字应用日益多样,用户对算力种类数量、有效感知、高效利用等提出了更高的要求,云服务也逐渐向算力服务演进。算力服务指的是以多样性算力为基础,以算力网络为连接,通过云计算技术将异构算力统一输出,并与大数据、人工智能、区块链等技术交叉融合,将算力、存储、网络等资源统一封装,以服务形式(如API)进行交付的模式。一方面

28、,算力服务以云服务为基础,体现出“泛在化”、“普惠化”、“标准化”的特点。一是云计算整合异构算力促进算力服务普惠化。云计算能够屏蔽不同硬件架构(CPU、GPU、FPGA)的差异,输出不云计算白皮书(2022 年)14 同类型的服务(常规计算、智能计算、边缘计算),实现大规模异构计算资源的统一输出,更加普适性地满足不同量级或不同硬件架构下的算力需求,实现算力的普惠化。二是云计算覆盖多层级算力促进算力服务泛在化。云计算正从单一集中式部署模式向分布式、多层级部署的新模式演进。云网边一体化可以统筹网络的状态、用户的位置、数据的流动等要素,满足不同时延不同场景的需要,扩大算力服务的覆盖范围,全面提升算力

29、服务的调度能力,实现算力服务的泛在化。三是云计算统一算力输出标准促进算力服务标准化。云计算能够实现资源标准化,是算力时代各类软件应用的“插座”。一方面,云计算所具备的硬件解耦、标准化封装部署等自身特性实现了算力能力的标准化输出;另一方面,云计算促使异构算力应用建立统一输出标准,避免软件被固定形式的算力需求所捆绑,实现算力应用的标准化落地。另一方面,算力服务呈现出与云服务不同的业态模式。一是算力服务内涵更加丰富,涵盖云边端全部算力。云服务多以虚拟化提供的x86 架构的通用计算为主,而算力服务除通用计算外,还包括智算、超算、量子计算、个人电脑和移动终端的算力,满足企业不同场景下多种算力融合使用的需

30、求。二是算力服务供给更加全面,以用户为中心提供服务。云服务通常为集中式计算供给,尚未实现不同云平台间的互联互通,用户往往只能选择一到两个云服务商,先确定选用什么样的云服务,然后再来选择适配的网络资源。而算力服务能够将一个个独立的算力节点联结起来,通过对用户位置、资源分布、成本控制云计算白皮书(2022 年)15 等多维度需求进行统筹分析,提供多元的、不同归属的算力服务,是一种更为全面的服务供给方式。三是算力服务应用场景更加多样,有利于传统行业转型升级。云服务主要面向“通用”计算场景,更适用于数字原生企业,面对传统企业数字化转型通常缺乏有效的行业解决方案,而算力服务从信息获取和信息处理两方面,对

31、基础设施化入手,通过物联网+泛在算力的方式实现行业普惠性的多样应用。四是算力服务构筑全新产业链条,更符合算力经济发展要求。算力经济并不过分关注云计算、人工智能等单一数字技术产业的发展程度,更强调从算力生产者、算力调度者、算力服务商以及算力消费者在内的算力产业链出发去衡量数字经济发展程度,是一种全新的经济范式,算力经济的核心产业将更依赖算力服务发展水平。未来,云服务商、区块链厂商等以计算能力为基础的服务商都可能升级为算力服务商,融入算力经济新生态。(二)算力服务技术快速发展,全新体系雏形初现(二)算力服务技术快速发展,全新体系雏形初现 近年来,我国在芯片、服务器硬件、云原生、云边协同和算网融合等

32、算力关键技术方面发展快速。为应对市场对算力服务的全新诉求,算力服务技术已形成初步体系。云计算白皮书(2022 年)16 来源:中国信息通信研究院 图 7 算力服务技术体系 网络控制与转发方面,SRv6(Segment Routing IPv6,基于 IPv6转发平面的段路由)、确定性网络等技术打破算力与网络的边界。用户通过云边端三级架构中的任一网关接入网络,设备节点根据应用服务的需求,综合考虑网络和计算资源的实时状态,将不同的应用调度到合适的计算节点上进行处理,通过 SRv6、确定性网络等全新网络技术,解决当前网络难以感知业务需求、算力和服务难以良好匹配的问题。同时引入定制化转发设备和可编程芯

33、片等技术,降低组网成本,保证业务体验。算力管理方面,IaC(基础设施即代码)正在成为构建算力“插座”的重要技术。IaC 可以通过代码而不是手动流程来管理和配置基础架云计算白皮书(2022 年)17 构,它将算力服务管理从数据中心内的物理硬件过渡到虚拟化、容器和云计算,实现了多样性算力资源的标准化抽象,为超大规模算力服务的转化、分配和应用部署提供了基础,实现算力服务的自动化,解决市场对多样性算力难以整合的问题。来源:中国信息通信研究院 图 8 IaC 技术示意图 算力服务与运营方面,算力交易平台重要性凸显。与云服务一对一租赁模式不同,算力服务通常采用“算力供给-算力交易平台-算力需求”的三方供给

34、模式。算力交易平台以云平台为基础,融合人工智能、区块链等技术,起到算力的收集、调度、规范的作用,是算力服务交付过程的全新角色。该模式下算力交易链条将会涉及更多的角色,算力的供给方与提供方除了是企业与服务商外,个人也可能变为是重要的参与者,彻底重塑信息产业格局。云计算白皮书(2022 年)18 来源:公开资料整理 图 9 算力交易过程示意图(三)算力服务成为算力经济高质量发展必经之路(三)算力服务成为算力经济高质量发展必经之路 算力经济成为衡量数字经济活力的关键指标。根据中国信通院统计4,算力发展指数每提高 1 个点,GDP 增长约 1293 亿元(约占全国GDP 的 1.3),随着算力发展指数

35、分值的增加,对 GDP 的拉动倍数也将提高,这种通过算力发展拉动数字经济发展的全新经济形态被称作算力经济。作为数字经济的重要组成部分,算力经济主要以数据为关键生产要素、以算力为核心生产力,从两方面促进数字经济发展。一是算力经济赋能传统行业,助力数字经济发展。算力经济带来的资本与技术投入不仅为制造、交通、零售等多个传统行业带来产值增长,还伴随着生产效率提升、商业模式创新、用户体验优化等延伸 4中国算力发展指数白皮书,中国信息通信研究院,2021 年 9 月 云计算白皮书(2022 年)19 性效益,对数字经济增长的拉动作用愈加凸显。以制造业领域为例,以云计算、边缘计算、智能计算为代表的算力投入和

36、规模应用可以从研发、采购、生产、营销、售后等产业链环显著提升生产效率。二是算力经济形成算力新产业,刺激数字经济迸发新活力。算力服务的发展使得市场上出现了包括算力交易、算力管理等众多全新类型算力服务商,对芯片、操作系统、网络、云计算等信息技术产业进行重塑与整合,带来全新的算力产业,让算力经济在数字经济发展中发挥更大的作用,从而刺激数字经济迸发全新活力。当前,我国算力经济发展也遭遇了一些挑战,例如算力作为生产力,资源配置不合理且调用效率低,致使算力经济生产配置失调;同时算力应用的各个行业丰富度欠缺,经济产业结构单一等等。针对以上问题,发展算力服务将成为推动算力经济发展的重要引擎。一方面,算力服务可

37、以有效盘活社会闲置算力,协调算力经济发展。当前,全球存在较多企业自行建立算力资源的情况,导致过度建设,利用率较低的现象。据 Gartner 统计5,全球约 40%的企业或组织的算力基础设施建设规模是实际算力需求的两倍,截止 2021 年底,闲置算力资源浪费达到 210 亿美元。算力服务通过对算力资源的服务化交付(如 API、公、私有模式部署),同时引入算力交易的机制与算力并网技术,实现社会闲散算力、多样化算力的吸纳,完成全网算力 5https:/ 年 11 月 云计算白皮书(2022 年)20 注册、管理与高效调跨区域调度,解决了算力资源作为生产力的生产配置问题,从而有效协调算力经济发展。另一

38、方面,算力服务可以加速算力应用的产业渗透,丰富算力经济产业结构。随着算力服务化进程的加快,算力市场也逐步迈向跨地域、跨运营主体算力资源交易,存量算力得以盘活,单位算力使用成本和门槛降低,使其不断向更广、更宽的方向发展,丰富了算力经济的产业结构。从第三产业内部来看算力经济的中心逐步从科学计算领域和互联网行业走向政府、服务业、金融、教育、制造、运输等行业。从其他产业的角度看,算力经济的产业结构也逐步覆盖第二产业和第一产业的工业、建筑业和农业等,算力经济的产业结构不断得以完善。五、云上系统稳定性面临挑战,技管结合助力能力提升(一)系统上云面临多重挑战,稳定性保障迫在眉睫(一)系统上云面临多重挑战,稳

39、定性保障迫在眉睫 当前,我国云计算市场快速发展,企业应用和系统上云已经成为趋势。然而,云计算在为应用的开发测试、发布变更、容量管理、服务治理等环节带来效率提升的同时,其复杂的技术架构也给系统稳定性带来了新的挑战,具体表现在:一是云上系统复杂度提升。云上系统深度应用微服务等云原生技术架构,应用之间存在错综复杂的依赖关系,服务性能瓶颈难以分析,故障影响范围难以评估,故障根因难以定位,为技术人员带来了诸多困难;云上系统的故障率会随设备的增加而呈指数级增长,单一节点问题可能会被无限放大,日常运行过程中不可避免的伴随异常发生;云计算白皮书(2022 年)21 云上系统节点分布范围更广、数量更多,高度依赖

40、网络质量,给日常运维过程中的日志采集、变更升级等都带来了新的挑战。二是新旧系统的共存和过渡带来的潜在风险。受益于 DevOps、Kubernetes、微服务、服务网格等云原生技术红利,应用的上线下线、发布变更、容量管理、服务治理等运营效率获得了极大提升。但是从传统系统迁移至云上不是一蹴而就的,相当长时间内会存在多种系统云上云下共存的局面,因此如何做好新旧系统共存状态下的稳定性保障成为重要命题。三是核心业务上云进程加速,故障影响范围更广、后果更严重。在全面数字化背景以及云计算技术优势的吸引下,企业核心业务加速上云。核心业务系统作为支撑用户服务的关键,往往具备业务连续性要求高、并发请求量大、业务激

41、增随机性强的特点,一旦发生故障,其影响范围更大,后果更严重。在此背景下,云服务商及企业亟需对云上系统稳定性有所认知,可以从管理与技术两方面协同发力,构建安全生产和稳定性保障双体系,推动云上系统的稳定性持续提升。流程管理方面,企业应以云上业务系统安全生产为核心目标,从组织、人员、制定、规范、流程、预防、监控和应急等多个维度构建完整的体系化方法论,覆盖组织管控、事前、事中和事后全过程;技术建设方面,企业应以故障的视角分析,从故障发生前、中、后三个阶段开展稳定性保障能力建设。云计算白皮书(2022 年)22(二)建设云上业务安全生产体系,完善流程管理机制(二)建设云上业务安全生产体系,完善流程管理机

42、制 信息系统故障来源复杂,云上业务安全生产保障易被忽视。当信息系统遭遇操作变更、代码缺陷、平台故障、外部环境变化等引起的故障或不可用影响时,往往会导致系统崩溃、业务受损、经济受损,甚至对国计民生造成巨大影响。企业应对信息系统故障带来的影响,通常会采取多种措施手段进行故障预防、规避,比如提前配置峰值流量所需资源、多机房多云分布式部署、制定数据冗余与备份等方案。但是业务系统故障往往存在不可预测、不可控、复杂性高等特点,相关故障预防、规避措施不但无法根本消除所有故障,而且成本高昂,甚至还会造成更多未知风险。制定体系化、系统化的云上业务安全生产保障方案,有助于规范故障处理流程,健全应急保障机制,为云上

43、业务系统持续稳定的运行保驾护航。体系化构建安全生产机制,规范化处理系统故障。一是事前的主动防御,通过完备的故障分析、风险检测、全局管控等事前风险防护治理手段,变被动为主动,尽量减少故障风险发生的概率;二是事中的全局监控,通过深度应用大数据、人工智能等技术,对信息系统进行全局监测和预警,实现实时风险态势感知;三是事后的应急保障,将信息化手段与传统方式相融合,多种应急方式,最大程度降低业务系统故障导致的损失和影响,有效保障业务系统的稳定性和连续性。(三)构筑全流程稳定性保障体系,提升技术保障能力(三)构筑全流程稳定性保障体系,提升技术保障能力 稳定性保障工作贯穿软件生命周期的全过程,主要目标是降低

44、故云计算白皮书(2022 年)23 障发生的概率、减轻故障发生后带来的影响。以故障的视角分析,可从故障发生前、中、后三个阶段开展稳定性保障能力建设。事前做好规划工作,设计高度韧性系统。在软件设计阶段,重点关注系统架构和容量规划的设计,同时配合混沌工程实验持续保持、提升系统韧性。从系统架构设计角度来看,规避系统单点问题,包括但不限于硬件单点、网络单点、存储单点和机房单点;优化系统依赖设计,高等级服务不允许强依赖于低等级的服务或资源(内部服务、外部服务、数据库、基础技术组件等等);完善数据保护,数据保护的主要目的是提升数据安全性,核心目标是尽可能缩短数据恢复时间,避免数据丢失。从容量规划角度来看,

45、需要利用多种手段进行容量决策、资源调度,确保容量可满足业务需求。规避流量洪峰带来的潜在风险,通过容量画像、容量风险管理,可以预测并探知业务流量洪峰,提前做好资源扩容准备,规避大流量场景下系统资源不足等潜在稳定性风险;探明全链路节点容量边界,应用全链路压测技术保障高压场景下系统性能,通过探明系统中的流量瓶颈,提前进行优化与改善,提高软件系统在高压场景下的稳定性。应用混沌工程技术探测系统稳定短板性,通过开展混沌工程实验,模拟随机的基础设施层、业务层等各个层面的故障,联合观测系统表现验证分布式系统的稳定性和可靠性,尽早发现系统潜在的问题,为提高分布式系统稳定性提供参考和建议。云计算白皮书(2022

46、年)24 来源:中国信息通信研究院 图 10 应用多活技术架构 事中全方位检测,提高系统故障逃逸能力。可观测性技术助力及时发现故障、辅助解决故障。通过采集多样的监控数据,可观测性平台可以在第一时间发现系统运行中的异常状态,并及时向运维人员发出告警,有效提高故障发生时的应对速度。通过对链路中各环节运行数据的整合及联动,在故障发生时帮助运维人员迅速定位故障原因,最大化利用系统的观测数据辅助进行根因分析,实现高效的故障修缮与恢复。应用多活成为保障业务连续性的关键抓手。“应用多活”是“应用容灾”技术的一种高级形态,通过在同城或异地机房建立一套与本地生产系统部分或全部对应的生产系统,所有机房内的应用同时

47、对外提供服务,当灾难(含基础设施故障)发生时,多活系统在分钟级内实现业务流量切换,有效保障业务系统持续稳定运行,提升系统故障逃逸能力。目前,中国信息通信研究院已牵头编写应用多活架构能力要求标准,该标准旨在促进应用多活技术在产业生态环境中云计算白皮书(2022 年)25 标准化、规范化、持续化发展。事后构建故障闭环,降低故障复现率。完善故障管理机制,故障管理机制包括规范管理故障响应流程、故障升级机制、故障复盘机制,规范技术人员在应对突发故障时的操作流程,明确职责边界,提升沟通效率,推动故障解决,提升故障处理效率。构建并持续维护故障库,以业务线为单位维护故障库,持续将测试及生产环境中发现的典型故障

48、加入故障库,同时配合使用混沌工程工具将已发生过的故障作为演练场景反馈到软件开发、测试、运维阶段,降低故障复现率,持续提升系统稳定性水平。六、云安全聚焦应用新技术理念,构建上云全流程安全体系(一)云计算面临新的安全需求,云上安全机制亟待改进(一)云计算面临新的安全需求,云上安全机制亟待改进 云环境面临多样化攻击手段。一是利用云计算新技术的漏洞发起攻击,容器、微服务等技术的应用导致企业资源暴露面增加,成为攻击主要目标,如 2020 年 Azure 用户因 Kubeflow(基于 Kubernetes 的组件)未授权访问漏洞被部署恶意容器。二是通过云计算的软件供应链进行攻击,2021 年 Docke

49、r Hub 上的部分容器镜像被内置挖矿程序,下载总数超 2000 万次;同年 5 月云供应商 Everis 被入侵,导致北约云平台相关数据泄露。政策标准向云安全聚焦,合规要求更加清晰。一是部分应用较为成熟的安全标准修订增加了云安全内容,2022 年 3 月 ISO/IEC 云计算白皮书(2022 年)26 27002:2022 完成修订并发布,将使用云服务的信息安全作为新增控制项之一。二是政策指南积极引导关注云安全新问题、新手段,2021 年5 月,美国总统拜登签署的关于改善国家网络安全的行政命令要求美国联邦政府向云迁移时采用零信任架构,以提升云安全防御能力;同年 10 月,美国国家安全局、网

50、络安全和基础设施安全局发布5G云基础设施安全指南:确保云基础设施完整性为 5G 云安全建设提供指导。优化上云全流程安全机制已成当务之急。面对日益多样化的威胁攻击,在政策标准要求指导下,上云企业应利用新理念、新技术,不断优化安全机制,构建上云全流程安全体系。一是软件供应链入口的安全管控,在上云前通过安全措施降低云计算引入的风险;二是零信任、统一安全运营等理念、技术的应用,在上云中同步规划,上云后进行持续保障。来源:中国信息通信研究院 图 11 上云全流程安全机制 云计算白皮书(2022 年)27(二)上云前完善供应链入口管控机制,规避云计算引入风险(二)上云前完善供应链入口管控机制,规避云计算引

51、入风险 企业上云通常分为三种方式:购买公有云服务、采购私有云软件或基于开源软件自研。无论采取何种方式,都会增加企业软件供应链的安全风险。因此,需要通过增加软件供应链入口安全管控机制,来规避引入云计算的风险。应用云计算带来三大软件供应链安全挑战。一是开源风险突出。无论是云服务商还是上云企业,开源都已成为行业的主流开发模式,在加快研发效率的同时也将安全问题引入到软件供应链当中。二是云服务商成攻击突破口,木桶效应明显。相较于传统针对软件自身漏洞的攻击,云服务商作为软件供应链上游,其编码过程、开发工具、设备等均是供应链受攻击面,攻击者只需突破一个点,即可撕开上云企业的整套防御体系。三是不安全的分发渠道

52、影响大。通过网络进行私有云软件交付、开源软件分发以及补丁下发已成为常态,分发渠道作为软件供应链中较为脆弱的一环,其安全影响重大。软件供应链入口管控保障云计算安全应用。针对企业上云的三种模式,可从五大关键要素构建软件供应链入口安全管控体系,降低引入云计算的风险。一是对软件或服务(下文统称为软件)来源进行评审管理,确保来源安全可信;二是对软件自身的安全合规进行管控,确保不存在安全及合规风险;三是对软件供应链清单、软件及源代码版本、漏洞等信息进行统一管理;四是具备软件服务支云计算白皮书(2022 年)28 持,包括文档材料、服务水平协议以及安全服务协议等;五是具有明确的软件供应链安全事件应急响应人员

53、及流程机制,确保安全事件处理的及时性、有效性。此外,不同上云模式下,软件供应链安全管控的各个要素要求也不同,具体如表 1 所示。表 1 不同上云模式下软件供应链安全入口管控要求 关键要素关键要素 公有云公有云 服务服务 私有云私有云 软件软件 基于开源软件基于开源软件自研自研 来源 供应商资质 开源软件来源 安全 合规 软件物料清单 软件安全要求 软件合规要求 安全测试及评审报告 安全监控防护 资产 管理 供应链清单管理 版本管理 漏洞管理 服务 支持 产品及用户文档 服务水平协议 信息安全服务协议 安全应急响应 应急预案 应急响应团队 来源:中国信息通信研究院(三)上云中应用零信任理念构建安

54、全体系,保障云上资源可信访问(三)上云中应用零信任理念构建安全体系,保障云上资源可信访问 云计算白皮书(2022 年)29 随着上云程度持续加深,企业的安全需求日益复杂。基于零信任理念构建的安全体系能够实现不同上云场景的有效安全保障,已成为企业选择的趋势。零信任实现多云/混合云的统一访问管控。多云、混合云已成为企业上云主要模式,其边界变化为企业带来了新的安全挑战:一是边界模糊,传统边界访问控制列表(ACL)的访问控制模式与边界安全防护遭遇瓶颈;二是大量分散用户访问云上与数据中心的业务时,需具备统一权限控制策略。零信任以身份而非网络为中心,一方面,通过强身份验证与授权对所有访问主体进行管控,在建

55、立信任前,不进行任何数据传输操作;另一方面,通过统一接入、统一访问控制和统一资源纳管体系,为用户提供一致的访问体验,保护分布式的关键数据和业务,让企业充分体验多云、混合云优势的同时免去安全顾虑。来源:中国信息通信研究院 图 12 零信任云上防护场景 云计算白皮书(2022 年)30 零信任细化防护粒度,防微杜渐守护云工作负载安全。云环境下涉及大量容器化部署的微服务应用,应用组件间交互与变化频繁,带来了新的安全挑战:一是企业纳管资源粒度不断细化,安全防护策略也需要随之变化,为不同类型、不同级别的业务提供统一的访问控制能力;二是微服务架构下服务间频繁通信和交互,数据中心内部流量大幅增加,边界防护无

56、法应对威胁横向移动。零信任通过技术手段能够在威胁暴露之初就加以制止,一方面,在工作负载构建后即可标定资产身份、角色、访问需求等,自动生成对应的安全策略,该策略将伴随工作负载全生命周期以应对潜在的威胁;另一方面,通过微隔离等技术进行不同层级的安全隔离,实现每个微分段中工作负载的安全防护。(四)上云后建立统一安全运营能力,充分释放安全资源价值(四)上云后建立统一安全运营能力,充分释放安全资源价值 云安全运营建设复杂,资源浪费、效率低等问题突出。一是过多的管理平台增加运营复杂度。2021 云安全报告数据显示,66%的云用户需要通过 3-6 个管理平台进行安全运维,超过 11%的云用户使用 9 个以上

57、管理平台,安全团队需要频繁切换操作界面,安全事件处置效率低,MTTR(平均响应)为 6 天,严重超出安全事件 72 小时的黄金窗口时间。二是各安全组件独立运作存在数据孤岛。不同安全域与不同类型的安全组件通常独立部署,安全数据仅着眼于局部,缺乏互通,导致安全运营难以从全局着手,难以对愈加复杂的高级攻击手云计算白皮书(2022 年)31 段进行全面的攻击链分析。统一安全运营体系打破兼容性壁垒,全面提升安全运营效率。统一安全运营强调安全数据和安全组件的整合协同,实现资源的物尽其用。一是汇总多源安全数据使安全分析全局化,统一安全运营体系可以将来自不同安全组件、不同安全域的安全数据进行汇总,提升对孤岛数

58、据的破冰能力,使安全分析从宏观视角出发,有效提高告警的准确性与高级攻击链的溯源能力。二是提高安全组件联动能力使安全响应迅速精准,通过剧本编排将安全组件相连接,使安全运营在一定程度上实现自动化响应,在实现秒级响应的同时,排除人为干扰因素,保证安全运营质量。目前实现统一安全运营主要通过两种方式,分别是安全运营中心(Security Operation Center,简称 SOC)和扩展的检测与响应(Extended Detection and Response,简称 XDR),两者目标相同但技术实现存在差异,各有优劣。SOC 建立面向各安全组件的开放统一架构,在数据汇总与分析方面,通过端口接收多供

59、应商的各类安全组件数据,对原始数据进行归一化处理、安全分析,探寻多源安全数据的内在联系;在集中运维方面,安全运营中心提供统一的任务下发、策略配置与剧本编排功能,使安全人员无需切换至相应工具界面便可实现运维操作。XDR 聚焦单供应商的安全组件整合,是以 SaaS 为主的可演进式集成工具,在数据汇总与分析方面,聚焦单供应商使安全团队无需手动设置归一化策略便可以得到规范化数据,大数据分析模型云计算白皮书(2022 年)32 也可更充分理解安全数据产生的底层逻辑,深度挖掘数据价值,提升安全分析的准确性;在集中运维方面,聚焦单供应商使组件间协同联动能力增加,在提供统一的安全管控界面的同时,极大简化了剧本

60、编排的操作难度,降低了自动化响应的编排技术门槛。表 2 SOC 与 XDR 优势对比 要素特性要素特性 安全运营中心安全运营中心 SOC 扩展的检测与响应扩展的检测与响应XDR 建设模式 部署模式 私有化为主,可 SaaS 服务 SaaS 为主,可私有化部署 端口自由度 高 低 组件可择性 高 较低 开放性 高 较低 供应商依赖 低 高 建设成本 较高,多供应商兼容工作多 较低 维护成本 较高 较低 适配场景 已有一定安全建设与安全 团队基础 尚未建立完善安全架构体系或希望精简供应商 来源:中国信息通信研究院 七、云成本优化治理势在必行,流程贯穿上云用云全生命周期(一)云资源浪费现象普遍,优化

61、治理面临挑战(一)云资源浪费现象普遍,优化治理面临挑战 云资源浪费成为企业用云普遍现象。一方面,企业上云用云如火如荼,云计算业务在快速发展的同时催生了对云资源的巨大需求,常常导致企业云资源盲目采购、过度申请,缺乏对云资源容量合理有效的规划。另一方面,企业在云资源的分配、使用和管理过程中缺少约束和规范,导致云资源浪费问题日益严重。根据 Flexera 2022 调查数云计算白皮书(2022 年)33 据6,企业用云费用支出平均被浪费了 32%。云资源即买即用的收费模式,导致企业从传统数据中心成本短期支出变为云资源成本长期运营。在云资源大量浪费的情况下,企业云成本管控面临巨大挑战。企业云成本优化治

62、理面临诸多难题。云计算重塑企业 IT 消费模型,基础设施采购方式从原来的集中式变为分布式,决策模式从原来的短期决策变为长期运营,成本类型由原来的固定成本变为可变成本,成本管理从原来的前置评估变为后置监控,成本责任由原来的集中管控变为责任分散。这些变化导致企业云成本优化治理面临诸多困难:一是资源浪费难以识别,有效资源优化手段匮乏。企业对已购资源使用情况了解不足,欠缺对云资源使用效率方面的度量体系,资源使用指标评判依据和评判标准不完善,难以识别资源浪费。同时,企业缺乏关闭未使用资源、资源降配、调整产品类型等优化手段。二是云账单数据庞大繁杂,缺乏专业工具支撑。面对云平台提供以产品、月度为维度的汇总数

63、据和以资源为维度的明细数据,企业缺乏专业的工具完成数据可视化、数据挖掘分析等。三是混合云加大优化难度,云产品计费模式复杂多变。随着混合云不断普及,多云平台的使用导致企业成本管理复杂程度和工作量的提升,企业云成本优化难度加大。同时,产品选型、付费模式等均需要企业进行多平台多产品多模式的评估和衡量。四是优化流程管理不健全,团队协作效率不佳。当前,绝 6 2022 State of the Cloud Report,Flexera,2022 年 3 月 云计算白皮书(2022 年)34 大多数企业云成本优化成员分散在技术组、财务组、业务组等多个部门,且并未建立云成本统一监管组织对成本进行细致监控和合

64、理规划。此外,权威专业流程管理制度的缺乏,也导致现有云成本优化团队工作效率较低。来源:中国信息通信研究院 图 13 企业云成本优化能力建设框架 企业需要打通内部流程与资源,建立企业上云用云持续优化能力体系。企业云成本优化能力建设并非是通过一系列动作后得出的一个终态恒定值,而是一个持续迭代和优化的过程,很多企业做云成本优化都是项目制,可能某个项目效果显著,但是并没有形成长效机制。企业需要各角色团队长期协作、辅以工具和运作机制,建立覆盖企业上云、用云和持续运营全流程的长期优化体系。(二)人员、工具和机制是云成本优化的关键要素(二)人员、工具和机制是云成本优化的关键要素 1.人员是基础,业务、财务和

65、技术须同频运作 云成本优化团队是企业实施云成本优化的基础。云成本优化不是云计算白皮书(2022 年)35 某一个角色或某一个团队做的事情,而是需要多个角色共同参与,打破原有各管一段,各自为战的传统 IT 管理方式,各角色长期协作共同努力以达到成本长期治理的目标。云成本优化团队需要宣传云成本优化意识和文化,推动云成本优化最佳实践,确定企业云成本优化的方向,协调企业各部门开展成本优化工作。比如,可以定期举行成本优化会议,回顾和复盘成本管理中遇到的一些问题,从而推动云成本优化工作持续改进。企业组建云成本优化团队需要从三个方面考虑。一是人员构成需要跨职能,将云解决方案架构师、业务架构师、运维人员、财务

66、人员、采购人员都纳入到成本管理和长期优化的干系人中来,成本优化团队应由企业各个部门组成,如财务部门、IT 部门、运营部门和业务部门等。二是人员知识体系须完备,成本优化团队需要具有多学科方法,具备项目管理、数据科学、财务分析和软件/基础设施开发等能力,可以对照成本优化目标(例如资源利用率)来衡量各部门的执行和交付能力。三是管理层须认可与支持。支持者即成本优化理念的倡导者,他们会为团队提供支持,确保按组织确定的优先级开展成本优化活动。优化团队及其支持者会共同确保企业在有效利用云资源的同时创造业务价值。2.工具是抓手,监控、分析与调优是必备能力 云成本优化工具是企业洞察与优化成本的抓手。云成本优化是

67、一个复杂而耗时的过程,需要将各项能力沉淀到工具。一方面,云成本云计算白皮书(2022 年)36 优化策略需要基于大量运营分析数据,由于云成本的可变性和多云环境的复杂性,并非所有分析都适合人工完成,企业通过工具或平台进行分析,以提升云成本管理水平。另一方面,成本优化往往是以项目方式实施,由项目制驱动转为体系化的日常自助,需要工具沉淀部分优化策略模型。因此,企业需要借助工具构建可度量的成本指标,驱动各相关组织自主降本。云成本优化工具通常需要具备三方面能力。一是可以明确资源使用情况并进行调整,了解资源的使用情况是云成本优化的前提,若无可视化工具支撑,企业很难捕捉各业务的实际使用情况,无法有效进行动态

68、调整。二是可以关联资源与费用并进行可视化。费用可视是成本优化的基础,只有看清花费才能针对性的成本优化。成本优化工具需要整合企业各环节云费用支出,支持按组织、部门、业务或产品等维度进行成本展示。三是工具可以综合分析企业数据与云服务产品并进行优化建议。基于成本优化算法,通过对已购买、未购买的付费模式进行综合对比测算,给出节省计划、计费方式等付费模式的优化建议,并具备执行能力。3.机制是保障,成本意识和奖罚机制双轮驱动 云成本优化制度是提高企业云成本优化工作成效的保障。云成本优化相应的长效运营机制在云成本管控中起到关键作用,面对云成本特殊的支出模式和账单结构,企业需要更新一套更加合适的云成本优化流程

69、制度确保优化工作能够在企业内部精确、高效运转。云成本优云计算白皮书(2022 年)37 化流程制度包含三个方面,一是对企业内部云成本进行权限管控,包含支出采购、分配修改等;二是对企业云资源各采购账号进行体系管理,包含账单核算、托管代付等;三是对企业各类资源或成本进行统一的配额管理,包含资源开通、支出审批等。企业可以通过提高成本意识和建立奖惩制度来落实云成本优化制度。企业内部云成本日常运维的主要动力和保障来源于云成本优化制度,一是云成本优化团队需要宣传云成本优化意识和文化,推动云成本优化最佳实践,确定企业云成本优化的方向,协调企业各部门开展成本优化工作。二是建立 KPI 奖惩制度,云成本优化作为

70、绩效考核的项目覆盖所有相关部门,根据实际情况合理设置优化目标,如资源闲置率、成本节省额度等,对各部门资源使用进行统一价值量化,按照周期内优化成果进行适当奖惩措施。(三)云成本优化流程贯穿上云用云全生命周期(三)云成本优化流程贯穿上云用云全生命周期 企业上云用云是一个循序渐进的过程,提高用云效能也是一个需要反复迭代和优化的过程,需要定期分析、持续优化,最终实现最佳运营效果。从企业上云用云历程看,通常可以分为规划、采购、上云、用云、运营等阶段,优化与治理应贯穿各个阶段,每个阶段的关注点各有侧重。企业云成本优化可从上云阶段、用云阶段和持续运营阶段制定相应技术和管理策略方法,实现成本节约。上云阶段,企

71、业要精细规划上云方案,包括技术选型、权限规划和采购模型等。技术选型方面,企业需要明确用公有云或是自建 IDC云计算白皮书(2022 年)38 路线,但评估时除了成本外更需要考虑云上技术红利,包括 IaaS 层的更新换代带来的性价比提升,PaaS 层带来的稳定性、性能、研发效率的提升。权限规划方面,需要结合企业业务和组织情况提前规划企业云上 IT 治理结构,规划好云上账号、资源、成本、权限、审计等方面的管理体系,通过治理优先的方式来规划云上的财物权等各关键要素。采购模型方面,企业已确定上云后要解决如何采购云资源,由于资源类型和计费方式种类复杂,根据业务特性选择适合的资源和付费方式是成本优化最直接

72、的方式。用云阶段,通过一定的规则和工具识别低效率资源,采取针对性优化措施。企业云计算环境下 IT 资源种类多,且有些资源较隐蔽,容易产生闲置和低效率的情况,此阶段需要关注云资源的使用管控。根据持续一段时间周期内的监控数据,分析出存在优化空间的资源单元,评估可优化的费用空间。例如,监控各业务使用云资源配额的情况,若出现配额闲置,管理员应当减少该租户部门的容量配额,将配额优先分配给处于瓶颈的业务,减少云平台配额的浪费。在监控的基础上,企业可以分析以往数据,有效预测云平台容量未来变化,提前预警提醒企业运维人员。此外,对于存在忙时、闲时流量具有显著差异的场景,企业还可灵活组合多种计费方式资源以节省成本

73、。持续运营阶段,企业应关注云计算成本的长效运作机制。分析成本与资源的健康度并定期复盘归因,基于历史数据和智能算法对成本预算进行优化变更,使云成本可以持续优化。具体可以通过成本运营目云计算白皮书(2022 年)39 标制定、策略实施和复盘优化等步骤来建立企业的成本优化实施体系:一是制定成本运营目标。成本优化运营,涉及业务、开发、运维、架构、财务和采购等多团队协作,组织者需要制定成本运营目标,各角色参与者需要明确团队目标和角色职责。二是制定技术与管理协同优化方案。成本优化通常分为管理降本和技术降本。在具体的优化过程中,管理降本和技术降本相互补足,双轮驱动,管理降本过程中碰到的一些难点或通用问题,需

74、要发起专项的技术降本攻克;可复制的技术降本方案,成功经验由点到面放大,需要管理降本持续跟进落地。三是定期召开成本会议改进优化策略。按业务、环境、责任人等维度标记资源,便于日常成本追踪。定期和成本相关方(例如财务、研发等团队)评审预算执行情况,评估优化成果,改进优化策略,建立云成本管理和优化的意识。八、发展展望 云计算作为数字经济的重点产业,将在未来数年内扮演越来越重要的角色,为各领域创新发展注入新的活力,具体表现为:云原生架构应用将更加普及。企业业务模块规模增大、部署环境增多、分布式复杂性增强,加速了软件构建的复杂性,也在无形之中提升了对开发人员的技能要求。相比较传统架构,云原生架构从业务代码

75、中剥离了大量非功能性特性到云计算基础设施中,使得业务开发人员不再关注基础设施的运营维护,转而聚焦业务逻辑的开发,大大云计算白皮书(2022 年)40 降低了企业用云的心智负担。云原生架构的价值正在被更多的企业接受,未来的应用将会更加普及。算力服务技术体系将更加完善。作为支撑数字经济持续纵深发展的新动能,算力服务将持续赋能企业数字化转型。当前,算力服务发展已进入快车道,但仍存在服务程度不够、应用渗透能力差、供给效率偏低等问题。未来,算力服务技术体系将不断完善和发展,探索创新应用,算力交易平台将提高算力供给效率,为用户提供更加普惠化、泛在化、标准化的算力服务。云上系统稳定性将更加优先。在全面上云的

76、背景下,各行业的正常运转高度依赖云上系统,系统稳定性已经成为重要的生产力。分布式云原生等技术提升了系统的复杂程度,应用场景的爆发增长为稳定性保障带来各种全新挑战,用户对产品故障越来越低的容忍度加剧产品间的稳定性“内卷”。云系统的稳定性已经成为支撑企业数字化转型发展、保障产品和服务质量、提升客户满意度、控制风险的重要影响因子。未来,企业与组织机构需要建立稳定性优先(Stability First)的战略,直面不确定性挑战,借助有效的稳定性能力建设路径指引从事前、事中、事后三方面全方位规划企业系统稳定性保障能力。云安全建设工具将更加便捷。在安全态势、合规要求和业务需求驱动下,云安全建设由“从无到有

77、”向“从有到优”转变,用户将逐渐关注安全工具便捷性,以提升防护效率,一是统一安全管理,通过零信任、SOC、XDR 等安全模型和工具实现对已有安全工具的整合,云计算白皮书(2022 年)41 减少碎片化和重复的安全工作;二是新工具涌现助力管理机制落地,软件物料清单等安全管理手段将通过自动化工具高效落地。云优化治理内涵将更加广泛。一方面,随着上云进程的多元化发展,用户在解决单云场景挑战的同时还需要进行多云混合的统一管理,并协调资源在多种云环境中的调度以达到性价比最优。另一方面,企业上云后需要稳固基础架构、业务安全和平台安全,并优化云资源与业务的适配、提升云资源效益。为实现这些目标,企业需要善于使用云平台成熟的 PaaS 能力、多云运营分析类工具以及云优化相关专业服务来促进企业云业务的优化创新。

友情提示

1、下载报告失败解决办法
2、PDF文件下载后,可能会被浏览器默认打开,此种情况可以点击浏览器菜单,保存网页到桌面,就可以正常下载了。
3、本站不支持迅雷下载,请使用电脑自带的IE浏览器,或者360浏览器、谷歌浏览器下载即可。
4、本站报告下载后的文档和图纸-无水印,预览文档经过压缩,下载后原文更清晰。

本文(2022年云计算白皮书(45页).pdf)为本站 (沧海一笑) 主动上传,三个皮匠报告文库仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。 若此文所含内容侵犯了您的版权或隐私,请立即通知三个皮匠报告文库(点击联系客服),我们立即给予删除!

温馨提示:如果因为网速或其他原因下载失败请重新下载,重复下载不扣分。
会员购买
客服

专属顾问

商务合作

机构入驻、侵权投诉、商务合作

服务号

三个皮匠报告官方公众号

回到顶部