上海品茶

百度智能云&长江云:2024面向AIGC的数智广电新质生产力构建白皮书(82页).pdf

编号:163102 PDF 82页 16.52MB 下载积分:VIP专享
下载报告请您先登录!

百度智能云&长江云:2024面向AIGC的数智广电新质生产力构建白皮书(82页).pdf

1、面向AIGC的数智广电新质生产力构建白皮书长江云“云智一体”专有云平台建设及IPTV业务快速上云实践2024前言近年来,AI 技术对广电科技创新产生着深远的影响,推动了广电内容生产创新、用户体验优化、智慧广电建设和商业模式创新等多个方面的发展。湖北长江云新媒体集团以湖北广电传媒新基地建设为契机,通过规划云智一体的专有云平台来构建一个更完善的 IT 技术架构,并创新提出了“四步走”实施路径:第一步 云智融合 一体规划:结合“云”的弹性与灵活以及“智”的融合与创新,基于全国产化硬件和软件构建长江云“云智一体”专有云平台,在保障基础硬件、基础软件、应用软件、网络和信息安全领域全面自主可控的同时,以人

2、工智能为引擎,为各业务场景提供全面的 AI 算子服务能力,提供集约化管理、高效率生产、统筹化升级等多方面的价值,加速长江云智能化战略落地;第二步 快速上云 高效迁移:面对 IPTV 自身业务以及关联软件、接口依赖的高复杂度,在 3 个月内实现了 30 多个 IPTV核心应用的“0”改造和不中断业务迁移上云,主要涉及网络组网“0”改造,IP 地址“0”改造,防火墙安全策略“0”改造等,相当于“开着飞机换引擎”,在保证业务连续性的同时更换了底层运行平台,在大规模核心业务迁移效率方面处于业界先进水平;第三步 数智并进 产品创新:基于长江云“云智一体”专有云平台充沛的 IaaS 算力和易用的 PaaS

3、 产品,逐步完善 AI 中台和数据中台的技术调优并实现 AIGC 相关工具的高效自主研发,打造长江云极致性价比的异构算力和高效的 AI 开发运行能力,不仅可以实现更高效的数据处理和分析能力,还能提供更为精准、智能的决策支持,加速集团“上云”、“用数”到“赋智”转型;第四步 聚焦场景 产业融合:面向媒体、政府、文旅、教育和健康等多个垂直领域拓展新场景和新应用的深度融合研发,充分发挥云平台的“数智价值”,深入产业,聚焦场景,通过打造跨行业的标杆应用,助力集团业务实现破圈发展,不仅在传统领域巩固地位,更在新兴领域中拓展市场份额,为集团的长期发展奠定坚实基础。长江云“云智一体”专有云平台建设不仅可以支

4、撑长江云数字化和智能化战略更好落地和新质生产力的高质量发展,同时为广电单位平台上云提供可复制、可推广的技术方案和典型案例,从而持续推动 AI 技术在广电行业的应用与发展。目录CONTENTSAIGC浪潮下的广电行业01长江云的智能化战略06122.1 智能化战略四个阶段2.2 智能化战略落地策略02前期-战略规划3.1 规划阶段 3.2 选型阶段03中期-设计和验证4.1 设计阶段4.2 验证阶段4后期-云平台运维和应用开发 485253566105项目管理6.1 制定项目计划 6.2 项目实施和质量管理6.3 风险管理6667690608附录未来展望075.2 云平台运

5、营5.3 智能运维5.4 基于云平台的AIGC应用5.5 基于云平台的行业应用5.1 云平台运维AIGC浪潮下的广电行业0101 AIGC 浪潮下的广电行业0101 AIGC 浪潮下的广电行业近年来,AIGC(Artificial Intelligence Generated Content,人工智能生成内容)技术发展突飞猛进,已经实现了从实验室 DEMO 到商用的跨越。从文生文、文生图,到文生视频、图生视频和视频生视频,这些炫酷的技术除了吸引眼球,还创造了巨大的市场和商业想象空间。如何能抓住这一波技术浪潮,将新技术应用到现有的行业中让企业产生新的增长动能,是企业家和经理人需要重点思考的战略问

6、题。将 AIGC 技术落地到垂直行业并在行业中生根、发芽和结果并不是一件一蹴而就的事,需要在数据、算力、模型和市场需求的理解等多个层面都有深厚的储备和积累才能打造出受市场和客户欢迎的AIGC 应用。市场数据模型算力图 1.AIGC 应用成功要素综合来看,广电行业在 AIGC 应用落地和商业化闭环的一头一尾具备先天优势。首先,广电行业是以内容为核心的行业,具备海量的有版权的音视频数据,而高质量的数据是落地 AIGC 战略的基础与核心,从这个角度看广电行业在数据资产层面具备明显的竞争优势;此外,广电行业有海量的终端用户包括大量的 C 端客户群和 B 端行业客群,构建出 AIGC 应用后,可以在存量

7、客群中应用来提升客单价或开拓新的客户提升营收,因此,在市场和客户层面,广电行业已经积累了足够的势能和优势。另一方面,在 GPU 算力和大模型方面,广电行业自身的优势还不明显。在算力方面,广电行业除了已储备的算力资源不是太充分外,还面临现有云平台技术架构不够先进的现状。由于 AIGC 类应用对算力消耗较大,尤其是高分辨率视频模型的训练和推理算力消耗巨大,面向传统应用架构的云平台已经无法承载 AIGC 类的应用;在模型方面,当前业界已有比较成熟的基础模型。大模型的一个特点是具备微调和迭代训练的能力,基于广电的海量数据构建广电行业大模型在技术层面是可行的。整体上看,广电行业在算力和模型层面的短板并不

8、是卡脖子的问题,算力和模型层面的能力可以通过引入业界优秀合作伙伴来解决。长江云的智能化战略0202 长江云的智能化战略0302 长江云的智能化战略智能化战略是湖北长江云新媒体集团(简称“长江云”)的关键战略,通过积极拥抱和利用 AIGC 技术来实现长江云的新发展和新突破。长江云的优势是拥有海量有版权的音视频数据和对行业和市场的深刻理解,短板是现有的数据中心无法高效支撑 AIGC 类应用的训练和推理,包括底层算力资源储备和上层行业模型构建。为了补齐以上短板,集团制定了新建云平台的关键规划。为实现资源集约和充分利用的目的,新建云平台需要充分利旧老数据中心的服务器与网络安全等硬件设备,不仅要承接集团

9、的智能化战略,还需要将老数据中心的应用全部迁移到新云平台上。2.1 智能化战略四个阶段 长江云将智能化战略分为四个阶段,分别是云平台的选型和部署,IPTV应用迁移,基于云平台构建基础AIGC应用,以及面向媒体、政务、文旅、教育等立体化场景的深度融合开发,发挥云平台的优势价值。阶段周期搭建面向AIGC应用的云平台6个月3个月持续0改造迁移传统应用到云平台新云平台上构建基础AIGC应用面向垂直行业场景构建AIGC应用阶段一阶段二阶段三阶段四图 2.智能化战略落地策略建设面向 AIGC 应用的新云平台新云平台是云智一体的平台,结合了“云”的弹性与灵活以及“智”的融合和创新,以云计算为基础,支撑长江云

10、数字化战略,以人工智能为引擎,加速长江云智能化战略落地。长江云建设的云智一体专有云平台不仅适合跑 AI 应用,而且自身也具备原生大模型和 AI 中台能力。另外,云平台的底座基于全国产化硬件和软件构建,满足关键设施在基础硬件、基础软件、应用软件、网络和信息安全领域的全面自主可控的要求,保障核心数字产业持续稳定的发展和信息安全。整体上,长江云通过规划云智一体的专有云平台来构建一个更完善的 IT 技术架构,支撑集团数字化和智能化战略更好的落地和业务更高质量的发展。迁移核心 IPTV 应用IPTV 业务是长江云的核心业务,也是集团营收的重要来源,其重要性不言而喻。迁移过程中要求业务持续对外提供服务,不

11、能中断或出问题。迁移的时间也有硬性要求,不能超过三个月。熟悉 IPTV 业务的专家都清楚,满足这两点要求的技术04难度巨大,普通的“割接”方案是无法满足 3 个月内业务不中断上云的要求的。一方面是因为 IPTV 应用程序自身的复杂度很高,涉及很多周边软件和接口的依赖;另外一方面是因为 IPTV 应用还涉及和外部运营商和生态伙伴的交互。在这种背景下做 IPTV 核心应用不中断业务上云是十分有挑战的工作。对此,长江云采取的策略是让 30 多个应用在网络层面和软件层面不做任何改造,将应用零改动平移上云。最终实现了 30 多个 IPTV 核心应用在三个月时间内完成了“0”改造和不中断业务迁移上云,这是

12、特别有亮点的工程和技术实践,相当于是开着飞机换引擎。在保证业务连续性的同时更换了底层运行的平台,而且工程效率很高,在大规模核心业务迁移效率方面处于业界先进水平。构建基础 AIGC 应用当前长江云已经进入智能化战略的第三个阶段,即基于云智一体和自主可控的云平台构建自己的 AIGC 基础应用。长江云通过云平台 AI 中台的智能拆条、智能内容审核、媒体内容分析和多模态媒资检索能力和云平台数据中台“采、存、管、用”一体化技术构建广电行业的基础应用,提升了内容智能化生产、内容安全智能审核、多模态检索和 IPTV 智能化内容推荐等核心业务领域的生产效率。构建面向垂直场景的 AIGC 应用未来,长江云可以基

13、于云平台充沛的 IaaS 算力和易用的 PaaS 产品,以及完善的 AI 中台和数据中台工具,高效率的构建面向媒体、政府、文旅、教育和健康等多个垂直领域的应用。充分发挥云平台的优势与价值,助力集团业务的快速发展。长江云云智一体专有云平台不仅实现了广电行业 IPTV 核心应用的全面上云,而且还构建了自主可控的云智一体云平台,是广电行业数字化和智能化战略落地的先行者。本白皮书将详细介绍长江云在智能化战略下的云智一体专有云平台建设和 IPTV 应用“0”改造迁移上云的实践经验,期望为广电行业的兄弟单位提供参考。02 长江云的智能化战略05图 3.云平台建设策略实施和验收阶段云上运维和应用开发前期中期

14、后期战略规划阶段评估和选型阶段设计和验证阶段应用维度实施迁移方案建立新云平台可观测指标需求和痛点分析供应商的技术和方案满足度评估云平台应用部署架构设计应用维度验收迁移方案新云平台运维流程和标准建设投资收益分析供应商的商务满足度评估平滑迁移到新云平台迁移方案设计老平台资源释放AIGC应用开发项目立项并启动云化战略确定供应商迁移方案可行性验证2.2 智能化战略落地策略 要承接上层的智能化战略,底层的基础设施和云平台要足够的先进和智能。云平台需要具备构建 AIGC 应用的能力,要适合跑 AIGC 应用,同时云平台自身也必须是智能化和可演进、可发展的。云平台除了要面向未来,还要能够脚踏实地的承接和运行

15、已有的传统应用。其中难点在于业务的“0”改造和不中断。长江云的传统数据中心承载了广电行业核心应用 IPTV 播控平台。IPTV 播控平台是长江云的重要生产工具,有 30 多套业务系统,传统数据中心的业务运行在 VMware 平台上。将这 30 多个核心业务在三个月的时间内以系统“0”改造,业务零中断的方式迁移到新建云平台是一件十分有挑战的复杂工程。长江云将核心工作详细拆解和梳理,按时间线分解为前期(战略规划和评估选型),中期(方案设计和实施),后期(AIGC 应用开发),并制订了详细的工作和任务流程。03 项目前期0703 项目前期3.1 规划阶段传统应用的数字化和智能化转型是众多企业提升生产

16、效率的一个清晰明确的战略,在国家的战略规划层面也有具体的指导和要求。中共中央办公厅国务院办公厅在 2022 年印发了关于推进实施国家文化数字化战略的意见(下称意见),意见明确,到“十四五”时期末,基本建成文化数字化基础设施和服务平台,形成线上线下融合互动、立体覆盖的文化服务供给体系。意见将“文化数字化”上升到国家战略高度,并提到广电行业要夯实文化数字化基础设施建设。广电总局也对广电行业的创新和智慧化发展给出了指导意见。在广电总局印发的关于促进智慧广电发展的指导意见中,明确提出要以深化广播电视与新一代信息技术融合创新为重点,推动广播电视从数字化、网络化向智慧化发展,从功能业务型向创新服务型转变。

17、近年来,AI 技术对广电科技创新产生着深远的影响,推动了广电内容生产创新、用户体验优化、智慧广电建设和商业模式创新等多个方面的发展。近日,中央广播电视总台、上海广播电视台、成都市广播电视台纷纷举行人工智能工作室揭牌仪式,持续推动AI技术在广电领域的应用与发展。基于国家层面战略指导和集团公司的规划以及行业发展趋势,长江云明确了面向未来的智能化战略。智能化战略规划阶段的核心输入是集团和公司的战略、需求痛点分析和投资收益分析。输入输出战略规划阶段需求和痛点分析业务和需求分析投资收益分析项目立项申请报告项目可行性报告项目预算金额对供应商的技术和方案需求项目规划方案图 4.规划阶段的输入和输出实施智能化

18、战略和打造 AIGC 应用的第一步是推进云平台的建设,并完成传统应用云化和智能化改造。除了明确对新云平台的技术要求外,还需要对当前老数据中心业务做详细梳理,以便完成传统数据中心应用到云平台的迁移。公司技术负责人在该阶段启动了当前业务应用系统的现状的详细分析,梳理应用间的依赖和调用关系,应用和外部生态伙伴的调用关系,并统计和量化应用对底层硬件资源的详细需求。该阶段完成后,核心输出是项目立项申请报告、项目规划方案和项目可行性报告,产出项目的整体投资预算以及对供应商的具体的技术和方案需求。3.1.1 现有 IPTV 业务架构梳理长江云现有 IPTV 播控平台中包含 30 余套业务子系统,上下游链路多

19、,业务依赖关系和接口调用逻辑复杂。08CP/SPFTP各地市电视台和CP直播系统媒资中心长江云APP运营商(电信、联通、移动)CDN机顶盒开机广告平台EPG服务AAA服务CDN播控NAS内容汇聚平台内容汇聚平台3A智能推荐数据中台注入请求【C2】手动上传媒资直播收录补齐媒资信息二次认证与鉴权C2推荐数据订购数据同步注入请求【C2】C2注入视频素材拉取媒资反馈注入成功反馈拉取成功分发请求【C2】拉取媒资流媒体服务广告下发C1图 5.IPTV 业务架构图IPTV 业务是广电行业最重要的业务之一,也是公司营业收入的重要来源。长江云作为湖北 IPTV 集成播控分平台运营方,负责将中央集成播控总平台传来

20、的节目信号与源自本省的节目信号集成在一起,规范地接入到本省 IPTV 传输系统,再由作为 IPTV 传输系统运营方的湖北地区电信运营商将 IPTV 节目信号传输给终端用户。IPTV 集成播控分平台与全国优质内容平台之间建立北向的内容导入接口,并通过专网分发给 IPTV 终端用户。湖北 IPTV 集成播控分平台通过 C 系列接口向分发系统分发内容、产品、EPG(Electronic Program Guide)信息,并收集分发系统的运营数据。C 系列接口为 IPTV 播控平台的标准接口,C 系列接口包含有 C1、C2、C3 三个接口。C1 接口C1 接口是指播控总平台和省播控分平台之间、省播控分

21、平台和分发系统之间的 EPG 模板管理接口。EPG 模板为 EPG 菜单呈现方式的单个或多个文件的文件组,包含有 HTML 文件和必须的图像文件。EPG 服务器通常部署在省市分平台,为了实现对 EPG 管理,播控平台制作好 EPG 模板后,把 EPG 模板的文件或压缩包放置在播控平台的管理服务器上,通过 C1 接口分发给集成播控分平台的 EPG 服务器或分发系统侧的 EPG 服务器,替换旧 EPG 模板文件,从而完成 EPG 模板的下发和管理。03 项目前期09图 6.C1 接口EPG制作、管理 CI接口EPG服务器播控平台分发系统C2 接口C2 接口是播控分平台与 CDN 分发系统间的内容、

22、分类、内容包的分发接口。播控分平台向 CDN 分发系统分发内容、内容编排、内容打包、产品定价等信息。图 7.C2 接口内容管理平台C2接口CDN平台播控分平台分发系统C3 接口C3 接口主要作用为内容运营管理,统计分析用户订购记录、观看记录、浏览记录、开机记录等。图 8.C3 接口观看数据订购数据用户数据内容运营管理C3接口业务运行管理播控分平台分发系统103.1.2 网络架构整体规划整个网络分为网络出口域、业务核心域、办公域。网络出口域包含与外部网络的互联链路,保证数据中心资源池内部网络高速访问外部网络,主要包括公网业务区、专网业务发布区、上游信源等出口对接,承载不同用户的业务访问。业务核心

23、域采用双核心调度路由器架构,用于调度融合直播平台、融媒生产云平台、专网发布、信源接收、办公运维等区域互联互通业务。办公域采用汇聚层和接入层两层网络架构,用于办公人员访问公网和使用云平台提供的云服务。图 9.云平台网络架构业务专网传统数据中心IDC其他可用区和Region业务资源区云平台功能区NFV网关区运维管理区第三方硬件网关区专网接入区公网接入区骨干接入区混合云接入区RDMA核心交换区核心交换区办公区公网分光器GPU节点安全设备CPU节点3.1.3 安全架构整体规划网络安全建设方案按照等保三级和关键信息基础设施安全保护条例的要求进行设计,遵循分级分域的原则进行网络区域的划分。整体分为三个主要

24、区,分别为网络出口区、业务核心区、办公区。1103 项目前期网络出口区网络出口区细分为运营商区、内容提供方区和公网区。运营商区主要覆盖融合直播平台与运营商之间的网络链路。运营商区的边界使用高性能的融合直播边界防火墙来进行隔离。防火墙具备 7 层防护功能。内容提供方区主要覆盖融合直播平台与内容提供方之间的网络链路。内容提供方区的边界使用高性能信源边界防火墙进行隔离,防火墙具备 7 层防护功能。公网区主要覆盖办公终端和服务器公网业务的出口链路。公网域的边界使用公网出口防火墙进行隔离,防火墙具备 7 层防护功能。业务核心区业务核心区细分为播出区、生产区。播出区主要由直播相关的专业设备组成。生产区承载

25、融合直播相关的业务系统,整体采用云平台的架构。云平台满足等保三级、国密的要求,使用云原生安全保障云平台网络安全。云原生安全主要包括东西向防火墙、主机安全防护、态势感知、日志审计、数据库审计、漏洞扫描、堡垒机等。云平台根据业务系统的等保级别采用不同的安全防护等级。核心生产区部署等保三级的业务系统,普通生产区部署等保二级的业务系统。除生产区外,云平台内通过 VPC 划分出逻辑 DMZ 区和研发区。办公区办公区主要包含运维、编辑、普通办公三类人员的办公终端。普通办公人员只需要访问互联网,运维和编辑人员均需要访问互联网和业务内网。首先通过安全准入设备验证接入终端的身份,然后分配对应的网络访问权限。通过

26、文件摆渡设备保障办公区文件安全传输。云平台及网络安全运维人员的终端配置国密浏览器和国密设施配套的智能密码钥匙。3.1.4 数据安全管理整体规划数据安全管理以数据为中心,以风险为导向,遵守数据安全法和网络安全法等法律法规,确保在推动业务发展的同时,也能充分保护数据的安全和合规的使用。确保数据来源合法如果数据涉及个人或企业的敏感信息,应确保已获得相关主体的明确同意,并遵守隐私保护和数据保护的相关法律法规。数据分类分级 根据数据的性质、重要性和敏感程度对数据进行分类和分级。并制定适当的安全措施和访问控制,以确保数据的安全性和合规性。12 基于数据的来源、内容、监管要求等因素进行分类,根据数据的价值、

27、敏感程度、司法影响范围等标准来进行分级。重要数据识别和记录 识别出对决策或分析具有重要意义的数据,这些数据通常具有较高的重要性和敏感性。建立详细的数据记录,包括数据的来源、采集方式、采集频率、原始数据来源及精确程度等信息,便于追溯数据的来源和验证数据的准确性。建立稳定的数据存储系统 建立稳定可靠的数据存储系统,确保数据的一致性和完整性。采用适当的安全措施,如加密、访问控制、数据备份和恢复等,以保护数据免受未经授权的访问、篡改或破坏。定期对数据存储系统进行安全审计和监控,及时发现和解决潜在的安全风险。确保数据存储系统具有良好的扩展性和灵活性,以适应数据规模和流量的不断增长。遵守合规性和监管要求

28、遵守相关法律法规和监管要求,包括数据保护法、隐私政策等。确保数据的收集、存储和使用符合法律的规定和目的。与第三方服务提供商合作时,应要求其遵守相同的数据安全和隐私保护标准。3.1.5 对供应商的技术要求基于已有的应用和业务架构,长江云总结出了每个产品方向对供应商的技术要求,作为供应商选型阶段的重要输入。对网络产品的技术要求 网络采用软件 SDN 架构,底层物理网络和上层云网络无强耦合关系。具备 VPC、专线网关、二层网关、负载均衡、NAT 网关、组播网关、高可用虚拟 IP 和 IPv6 等产品能力。其中,负载均衡支持 FTP 和组播是 IPTV 上云所需的关键产品能力,二层网关是 IP 地址不

29、变迁移上云的关键产品。对计算产品的技术要求 采用一云多芯架构,云底座基于国产化芯片构建。计算资源池支持 x86、ARM 架构,包括但不限于 Intel x86、海光c86 和鲲鹏 ARM。支持裸金属和虚机形态和 GPU 类型的计算产品。支持镜像和快照,具备自定义镜像产品能力。1303 项目前期对存储产品的技术要求 支持分布式纠删码或多副本冗余架构。提供块存储、对象存储、文件存储和并行文件存储产品。对数据库产品的技术要求 基于集群架构并具备完善的高可用能力。提供 MySQL、Redis 云数据库和数据库管理工具。对云安全产品的技术要求 提供成熟的云安全管理平台和具备技术前瞻性的安全架构,覆盖云平

30、台安全、云租户安全、安全运维和安全运营等主要场景。提供东西向防火墙、主机安全防护、数据库审计、漏洞扫描、日志审计、态势感知和堡垒机产品。对 AI 中台的技术要求 提供包括视频、语音、图像和 NLP 等方面的 AI 算子能力。通过开放平台门户提供自助式的 AI 服务接入能力,提供高效和便捷的 AI 中台服务。对数据中台的技术要求基于湖仓一体架构提供包括数据采集,数据集成,数据治理,数据分析和数据可视化等完整的产品能力。3.2 选型阶段选型阶段要根据规划阶段对供应商的技术和方案需求进行 POC 测试。POC 测试的过程中除了基础的功能测试外,还需要对供应商提供的整体的迁移方案的进行测试,以及对性能

31、规格和稳定性进行测试。1504 项目中期04 项目中期中期主要工作是方案设计和迁移实施与验证。首先要设计云平台的应用部署架构,然后设计将老数据中心的应用平滑无损的迁移到新云平台上的迁移方案,并在已部署的平台上验证应用迁移方案的可行性。在迁移方案可行性验证完成的基础上将应用逐步实施迁移,并对迁移完成后的应用系统做评估和验收。4.1 设计阶段长江云云智一体专有云平台项目除了新云平台建设外,还涉及 IPTV 核心应用的迁移上云。针对传统 IDC 应用迁移上云,项目组制定了应用迁移的 3R 方案,即 Rehosting、Replatforming 和 Refactor。分别代表迁移上云的三种上云策略,

32、三种上云策略的改造成本逐步提升,但云化程度也越来越高。具体选取那种迁移上云方案,要结合企业具体的实际情况来确定。图 10.迁移上云策略迁移上云方案描述特点云平台改造上云(Rehosting)中间件云原生改造上云(Replatforming)应用云原生改造上云(Refactor)仅云平台改造云平台+容器平台和中间件改造云平台+容器平台和中间件+应用需要改造改造代价最小,中间件层和应用无需改动应用架构需要进行较大的调整基于云原生的重构应用程序,改动代价最高 Rehosting 策略:仅改造云平台,充分利用云平台的可扩展性和弹性能力。Replatforming 策略:改造云平台+容器平台和中间件,除

33、了利用云平台的优势外,还充分利用容器平台灵活性的和云上中间件的能力。Refactor 策略:将应用层面进行全面的云原生化改造。基于前期的技术架构梳理,发现长江云应用系统较多,且已完成了微服务架构改造,服务间的调用关系较复杂。当前的重点是优化和提升云平台底座的能力和性能,在这个背景下不建议对微服务中间件和上层应用做改造。长江云云智一体专有云平台项目中采用了 Rehosting 迁移策略。迁移的关键点之一,是让中间件及上层应用在“0”改造的情况下迁移到新的云平台。在完成第一阶段的存量业务迁移后,第二阶段在新平台的基础上再部署 AI 中台并开发 AIGC 新应用。确定了整体的迁移策略之后,下一步是要

34、考虑如何将迁移策略实施和落地。16图 11.应用架构变化应用IPTV播控平台EPG营销平台数据库MySQLRedisOracleMongoDBMariaDB安全安全策略态势感知数据库审计主机安全漏洞扫描网络VLAN隔离VRRP高可靠专线路由器LVS+Ngnix组播HadoopHive大数据平台IBM 硬件存储NetApp 硬件存储存储虚拟机物理机计算VMWare云平台云平台IDC基础设施基础设施KafkaPrometheusKong网关中间件老数据中心架构应用IPTV播控平台EPG营销平台数据库RDSSCSOracleMongoDBMariaDB安全安全策略态势感知数据库审计主机安全漏洞扫描网

35、络VPC隔离HAVIP专线网关BLB负载均衡组播HadoopHive大数据平台块存储CDS对象存储BOS高性能文件存储PFS存储BCC虚拟机BBC裸金属HPC GPU服务器计算ABC Stack云平台云平台云平台基础设施基础设施KafkaPrometheusKong网关中间件ABC Stack云平台架构4.1.1 成立联合设计团队虽然 Rehosting 的方案对应用改造最小,但由于当前的 IPTV 应用系统较复杂,传统应用迁移到新云平台仍然是一项大工程,涉及多个业务团队且项目复杂度高、工程量大,需要有专门的团队来支撑项目的顺利落地。从实际项目经验来看,至少要成立一个三层组织的虚拟团队才能保障

36、项目快速和顺利的落地。而且这个虚拟组织最好是广电侧的专家和云平台的专家联合组成的。比如双方的架构师临时组成一个虚拟的架构师小组,共同负责设计应用迁移方案。图 12.联合设计团队项目负责人(CTO、CEO)架构师负责人运维和实施负责人业务方负责人质量保障负责人项目管理负责人网络计算存储安全1704 项目中期4.1.2 云平台的目标架构以长江云云智一体专有云平台为例,新云平台的整体架构从下至上主要分为基础设施、能力中台、业务平台、应用前台和应用场景。图 13.云平台的目标架构家庭娱乐美丽乡村教育酒店医疗健康文旅智慧社区党建政企其他应用场景IPTV业务OTT业务政企业务APP业务其他业务应用前台数据

37、库容器中间件大数据PaaS云服务器云存储云网络云安全IaaS服务器存储网络安全硬件IPTV播控平台综合运营平台直播平台安全管理平台媒资管理平台监控运维平台业务平台人脸识别图像识别语音识别NLP敏感词识别OCRAI剪辑AI视频增强视频DNA智能标签AI中台数据采集数据存储加工/计算算法模型指标监控标签建模BI报表数据座舱智能推荐用户画像数据中台18云平台 IaaS 层部分包括计算、存储、网络、安全等基础硬件资源。硬件向上抽象成对应的资源池,提供云计算、云网络、云存储、云安全、云数据库、云桌面等服务。在 PaaS 层具备大数据、中间件、容器、应用管理等服务能力。AI 中台和数据中台提供 AI 通用

38、能力和大数据处理和建模能力。整体架构具备全方位的安全防护能力,通过防火墙、负载均衡、堡垒机、日志审计、漏洞扫描、终端准入、主机防御、数据库审计、态势感知等安全防护模块保障云平台及主机安全,通过边界防火墙保障各网络边界安全。系统基于“一个中心、三重防护”安全建设的核心思想,整体满足国家安全等级保护三级的部署要求。上述模块按照统筹规划、统一纳管的原则设计,建成后可为新媒体业务提供服务,也可以赋能家庭娱乐、教育、医疗健康、智慧社区、政企、美丽乡村、酒店、文旅和党建等业务。网络架构云平台采用多 VPC 网络架构,不同的 VPC 承载不同的业务系统,实现业务层面的逻辑隔离。图 14.云平台网络架构业务专

39、网专线新云平台用户/机顶盒/CDNIDC机房/分支/合作伙伴DNS云安全防护VPC-1接入层业务接入层负载均衡BLB专线接入层二层/三层专线网关VPC间接入层对等互联/云智能网容器平台CCE/CCR容器层虚机BCC/裸金属BBC/专属服务器DCC/GPU实例应用层Kafka/RabbitMQ/API网关中间件层RDS/SCS/MongoDB数据库块存储CDS/对象存储BOS/文件存储CFS/高性能并行文件存储PFS存储VPC-2接入层业务接入层负载均衡BLB专线接入层二层/三层专线网关VPC间接入层对等互联/云智能网容器平台CCE/CCR容器层虚机BCC/裸金属BBC/专属服务器DCC/GPU

40、实例应用层Kafka/RabbitMQ/API网关中间件层RDS/SCS/MongoDB数据库块存储CDS/对象存储BOS/文件存储CFS/高性能并行文件存储PFS存储1904 项目中期负载均衡支持 FTP根据广电行业的 IPTV 标准规范,IPTV 业务中最关键的节目下载和分发要使用 FTP 协议。在老数据中心中,后端有多组 FTP 服务器集群,每个集群中有多台 FTP 服务器。通过 LVS(Linux Virtual Server)的方式实现 FTP 流量的分发。由于视频文件一般比较大,对 FTP 拉取的数据需要让服务器直接回复给客户端,不再经过负载均衡设备的转发,来降低负载均衡设备的转发

41、压力,进而保障整个业务系统的稳定运行。图 15.云平台负载均衡支持 FTPLVSFTP服务器FTP服务器FTP服务器FTP服务器FTP服务器组-1FTP服务器FTP服务器FTP服务器FTP服务器FTP服务器组-NFTP响应FTP请求FTP响应IPTV/地市电视台/合作伙伴/CDN老数据中心BLBFTP服务器FTP服务器FTP服务器FTP服务器FTP服务器组-1FTP服务器FTP服务器FTP服务器FTP服务器FTP服务器组-NIPTV/地市电视台/合作伙伴/CDNFTP响应FTP请求FTP响应新云平台FTP 协议中,控制通道和数据通道是独立的。数据通道的建立方式分为主动模式和被动模式两种,在大部

42、分场景下使用的是被动模式。被动模式需要 FTP 服务器侧开启一个对外提供服务的端口范围,在广电 IPTV 场景中,由于客户端数据较多,FTP 服务器的端口范围一般不小于 2 万。通过负载均衡为 IPTV 业务提供接入层访问服务。在专线接入层通过三层专线网关为云上 VPC 和线下 IDC、分支机构和合作伙伴提供专线互通能力。通过对等互联、云智能网产品提供同地域和不同地域间的多租户多 VPC 互联方案。后端的应用承载在容器平台和服务器上。通过中间件产品实现应用间和应用和数据库间的互通。通过云平台的存储产品实现数据的持久化存储和读取。20图 16.FTP 的主动和被动模式FTP协议协议通道建立方式数

43、据通道建立方式主动模式(PORT)被动模式(PSAV)服务器通过21端口和客户端建立连接服务器通过21端口和客户端建立连接服务器主动连接到客户端开放的端口服务器端开放端口后等待客户端连接特点客户端需主动开启对外可被服务器连接的数据端口FTP服务器需要开放主动对外访问权限不推荐使用主动模式对客户端侧无特殊要求推荐使用被动模式云平台的负载均衡产品 BLB 在支持 FTP 的同时还支持 DR 模式(Direct Routing 直接路由模式)转发,很好的解决了IPTV 业务中最关键的 FTP 服务器集群迁移上云的需求。高性能的专线网关广电行业普遍通过物理专线连接上下游系统,由于业务特点,专线上不仅连

44、接数量多,而且承载的流量也比较大。在云平台的方案中,专线流量是通过专线网关接入到 VPC 的,所以专线网关的稳定性及处理性能十分关键。为提升专线网关的稳定性,一般考虑将专线网关作为独立的集群进行部署,即该硬件集群只用来承载专线流量。在提升专线网关稳定性前提下,还需要保证网关的处理性能。提升网关处理性能的一个思路是水平扩展硬件资源,另外一个思路是通过软硬件一体化来提升网关处理性能。在长江云云智一体专有云平台的项目设计方案中,高性能专线网关作为独立和专用的网关角色存在。即高性能专线网关部署在独立的集群中,并只处理专线流量。这在一定程度上提升了整个云平台的稳定性,并将专线业务流量的故障域进行了隔离和

45、区分。图 17.高性能专线网关流量路径专线接入路由器专线接入区核心交换区业务资源模块-A区租户资源区服务器云功能模块-B区VPC网关高性能专线网关IDC/地市电视台/合作伙伴2104 项目中期此外还采用了软硬件一体化的思路来提升专线网关的处理性能。当前在长江云云智一体专有云平台部署的软硬一体的专线网关具备水平扩展能力和丰富的软件功能,如支持专线 NAT 和专线 FlowLog 等功能,可以从容应对超大规模的专线流量并满足专线场景下多种多样的软件功能需求。图 18.高性能硬件可编程网关实物图如果不采用软硬一体化方式的专线网关,可以通过普通的通用服务器的方式来构建专线网关集群。一般一台通用服务器的

46、流量处理性能约 50Gbps,如果要处理有 400Gbps 的专线流量,在考虑高可靠的情况下需要 16 台通用服务器,这将产生上百万的硬件成本。此外,通用服务器在处理“大象流”时存在稳定性风险,大于 5Gbps 的大象流量会导致通用服务器的 CPU 出现单核打爆的问题。综合来看,软硬一体的硬件可编程专线网关在大流量场景下的性价比和可靠性都很高,是比较好的选择。在长江云云智一体专有云平台项目中,软硬一体的硬件可编程专线网关已经承载核心业务流量并持续稳定运行。在专有云领域,长江云在软硬一体可编程网关新技术实践方面走在了业界前列。组播在 IPTV 场景下,组播是视频流传输的关键技术。比如将一个频道的

47、视频流通过组播的方式从播控中心分发到电信、移动和联通的 RP(Rendezvous Point)点,RP 再将收到的视频流复制给自己的多个组播成员。在这种场景下,由于组播复制发生在运营商内部的 RP 点侧,从播控中心到运营商的 RP 点只需要占用一份视频流带宽,从而实现了高效视频流的传输和分发。22 图 19.IPTV 组播组播成员(IPTV机顶盒)组播成员(IPTV机顶盒)组播路由器组播成员(IPTV机顶盒)组播成员(IPTV机顶盒)组播路由器组播路由器RP电信/联通/移动运营商网络服务器服务器服务器服务器组播源组播路由器广电IPTV播控平台专线在云平台上也需要支持组播技术来实现组播源通过组

48、播协议把视频流分发给运营商的 RP 节点。云平台通过 VPC 内的组播网关产品来实现组播流量的复制。在组播网关上,通过添加 IP 地址的方式,添加组播源和组播成员。在接收组播源的流量后,将组播流量复制和分发给组播成员。组播成员可以在 VPC 内也可以在 VPC 外。比如 IPTV 场景下,RP 作为组播成员,在运营商的网络内,组播流量通过专线网关发送到 VPC 外的组播成员。图 20.VPC 组播网关实现组播流量分发专线网关组播网关(224.0.0.8)组播源VPCRP组播成员组播成员组播成员运营商网络物理专线122304 项目中期高可用虚拟 IP(HAVIP)广电行业的应用类型较多,部分应用

49、在老数据中心中通过 VRRP 等技术方案提供的虚拟 IP 地址和虚拟 MAC 地址来构建应用的高可用能力,如自建 Ngnix 和自建数据库等应用。要实现将应用平滑的迁移到云上,需要在云上提供高可用虚拟 IP。云平台提供了产品化的高可用虚拟 IP 的能力,配合服务器上已有的 Keepalived 实现应用的高可靠架构。HAVIP 承载在 BVR(Baidu Virtual Router)网关上,HAVIP 和虚机关联后,BVR 会对虚机做 ARP 探测。图 21.HAVIP 实现机制物理机1VM1(主)VM1-IPBVS物理机2VM2(备)VM2-IPBVSBVRHAVIPkeepalivedA

50、RP响应ARP探测ARP探测在发生主备切换后,ARP 更新信息,通过组播方式在云平台的网关间进行快速同步。在云平台上,HAVIP 自身能实现200ms 以内的切换性能,保障核心应用的高可用,进而保障应用迁移到云上之后的 SLA 服务标准不降级。IPv6IPv6 是国家“十四五”规划中的一项重要工作。国家在 2021 年发布了 关于加快推进互联网协议第六版(IPv6)规模部署和应用工作的通知。通知中的主要里程碑包括,2023 年末基本完成 IPv6 改造工作,主要的应用实现从 IPv4 到IPv4+IPv6 的双栈的改造;2025 年末,新增的应用需要支持 IPv6 单栈;在 2030 年左右,

51、完成向 IPv6 单栈的演进过渡。图 22.国家十四五 IPv6 规模部署目标网络、平台、应用、终端及各行业全面支持IPv6,新增网站及应用、网络及应用基础设施规模部署IPv6单栈,形成创新引领、高效协同的自驱性发展态势。2023年末2025年末国内主要内容分发网络、数据中心、云服务平台、域名解析系统基本完成IPv6改造。24对于广电行业,通知中还重点提出:全面深刻把握“十四五”时期广电领域 IPv6 的工作要求,聚焦广播电视和网络视听制作系统、播出平台、传输网络、接收终端、监测监管等环节 IPv6 端到端贯通,不断拓展 IPv6 部署应用的广度深度。工信部和广电总局也联合发布了关于推进互联网

52、电视业务 IPv6 改造的通知,在网络基础设施 IPv6 升级改造,应用基础设施 IPv6 承载能力,接收设备 IPv6 支持能力方面制定了明确的目标和规划。云平台需要对全产品支持 IPv6,包括网络、计算、存储、数据库和容器平台等产品。对于通过互联网提供服务的业务,通过专线提供服务的业务,以及数据中心内部多 VPC 互联的业务都需要支持 IPv6。此外,云平台 VPC 的 IPv6 的网段需要支持用户自定义,用户可以使用 ULA(Unique Local Address)类型的 IPv6 地址,也可以使用 GUA(Global Unicast Address)类型的地址。在使用 ULA 类型

53、的地址的场景中,还需要通过 IPv6 EIP 能力提供互联网访问能力。图 23.全场景 IPv6新云平台-ABC StackBCC/BBC-IPv6对等连接网关-IPv6VPC-2对等连接网关-IPv6LB-IPv6IPv6网关IPv6 EIP专线网关-IPv6BCC/BBC-IPv6VPC-13412互联网老数据中心服务器如上图所示,除了所有云产品支持 IPv6 外,在 IPv6 的互联互通场景中,云平台也提供了完善的产品化解决方案。图 24.云平台 IPv6 支持情况场景云平台应用通过IPv6公网IP对外提供服务老数据中心的应用通过云平台的IPv6公网对外提供服务关键功能IPv6网关:应用

54、使用 GUA地址时,通过IPv6网关对外提供IPv6类型的公网服务IPv6 EIP:应用使用ULA地址时,通过IPv6 EIP 对外提供IPv6类型的公网服务IPv6 EIP和专线网关:将IPv6 EIP 和老数据中心应用进行关联,实现老数据中心应用使用新云平台的IPv6公网对外提供服务对等连接网关:通过支持IPv6的对等连接网关来实现两个VPC内的IPv6应用的互通专线网关:通过支持IPv6的专线网关来实现云平台和老数据中心的应用通过IPv6互通云平台的两个VPC中的应用通过IPv6互通云平台的应用和老数据中心的应用通过IPv6互通2504 项目中期计算架构更适合跑 AI 的计算架构在 AI

55、GC 场景下,单台 GPU 服务器往往无法实现复杂的模型训练和推理任务。云平台支持通过 Infiniband 和 RoCE 网络构建产品化的弹性高性能计算集群 EHC(Elastic high performance cluster)。通过 EHC 产品将多台 GPU 实例构建成AI-POD,可以更好的支持大型 AIGC 应用的训练和推理任务。通过 EHC 产品不仅可以实现 AI 算力的大幅提升,还能够根据实际需求灵活扩展或缩减资源,真正实现了弹性的 AI 算力。图 25.EHC 产品方案主机内部GPU间高速网络主机间高速RDMA网络主机间VPC网络云账号VPCAEHC集群A专有RDMAVPC

56、BEHC集群B专有RDMA更好的国产化云和自主可控能力广电行业作为国家文化传播的重要渠道,涉及国家文化主权和文化安全。广电关键基础设施的自主可控是十分关键和重要的能力,对广电行业减少对不可控的外部技术和供应链的依赖十分有帮助,能够更好地掌握核心技术和资源,顺利推动产业升级和转型。长江云云智一体专有云平台基于国产化海光 c86 芯片构建,支持多种芯片类型资源池,让算力供应实现了多元化。通过一云多芯资源池,可以灵活适配国产化的 CPU 和 GPU,将不同类型的 CPU 和 GPU 划分为不同计算资源池对外提供服务。在国产化的硬件资源池上运行国产化操作系统和国产化的 PaaS 和 SaaS 应用。云

57、平台上从底层硬件,到云平台软件,再到上层云服务和应用均实现了国产化,具备全面的硬件和软件的自主可控能力。综合来看,云平台在关键基础设施自主可控和供应链安全方面都达到了业界先进水平。26图 26.国产化云平台和一云多芯资源池鲲鹏底座x86资源池PaaS应用:DRDS、MongoDB等CCE海光资源池PaaS应用:DRDS、MongoDB等CCE鲲鹏资源池PaaS应用:DRDS、MongoDB等CCE底座资源池应用海光底座更友好的生态开放平台在完成了业务从原有数据中心迁移到新云平台后,将释放出大量硬件服务器设备。这部分硬件服务器需要能在新云平台继续利旧使用。此外,原数据中心还存在集中式 SAN 存

58、储系统,也需要无缝集成到云平台。云平台支持 BYOH(Bring Your Own Hardware)的方式来构建计算和存储资源池。支持利旧硬件服务器,支持将 SAN 存储作为数据盘和系统盘挂载到虚机,以达到更好的保护已有投资的目的。存储架构云平台的存储基于分布式架构构建,通过水平扩展构建低成本、大容量和高性能的存储系统。云平台提供块存储、对象存储和文件存储能力,还提供面向 AIGC 应用的高性能并行文件存储 PFS(Parallel Filesystem Service)。在广电行业的 AIGC 和视频渲染场景中,经常存在数百 GB 乃至数 TB 的热点数据访问,需要文件系统提供极高的存储吞

59、吐能力和并发访问能力。针对这种场景,并行文件存储服务产品可以提供特别好的解决方案。并行文件存储服务 PFS 针对高性能计算场景可提供小于 300us 的访问时延,上百万 IOPS 的读写能力,以及百 GB/s 的吞吐性能;此外并行文件存储服务 PFS 还可以打破传统存储系统存在的 I/O 性能瓶颈,提升 AI 训练场景中小文件的读取速度,收敛业务模型的训练迭代周期;通过并行文件存储 PFS 提供的数据生命周期策略,进行数据的冷热分级存储帮助客户降低存储成本,配合调度策略实现数据的预热,进一步减少计算 I/O 等待时间并加速数据处理。图 27.PFS 产品Windows 客户端Linux 客户端

60、MPI-IOKubenetes 集成PFSMSMDSStorage组件主备副本高可用RDMA客户端缓存I/O 并行高性能Bucket LinkQoS生命周期配额监控功能2704 项目中期PFS 还支持和对象存储通过 Bucket Link 打通,通过并行文件存储实现高速存储缓存的功能。PFS 实例通过按需加载对象存储中的热数据并进行并行文件读写处理,支持按需将数据结果写入到对象存储中。长江云云智一体专有云平台项目中已经落地并行文件存储服务并和对象存储配合实现数据热加载的高性能读取。数据库架构云平台除了提供基础的关系型数据库 RDS,非结构化内存数据库 Redis 等产品外,还提供面向 AI 应

61、用的向量数据库产品。在 AIGC 场景下,向量数据库用来满足大模型的记忆存储问题,并实现高维大数据的快速响应。向量数据库首先通过 Embedding 将非结构化数据进行向量化处理。查找数据时通过输入对应的向量在数据库中进行相似度检索。向量数据库的核心能力就是支持向量数据存储,以及支持不同的查找算法和索引实现相识度查找。典型的场景是将文本和图片数据集经过向量化处理后导入向量数据库,用户对向量数据库执行图片和文本的检索操作,向量数据库反馈给用户最相近和相似的文本和图片内容。图 28.向量数据库EmbeddingEmbedding文本图片数据集返回Topk结果向量数据库检索图片/文字导入用户探索向量

62、数据库云平台的向量数据库支持百亿级向量数据规模,可支持百万级 QPS 并发查询和毫秒级响应。通过多副本提升系统的高可用能力和容灾能力,在节点故障等异常场景下能正常运行。云安全架构云平台的安全架构的设计原则是坚持安全发展,适应和应对新技术、新应用、新业态和新服务可能带来的安全风险和隐患,应用新技术防范新风险,确保技术、数据和应用可管可控,确保平台安全。安全系统整体基于等保 2.0 标准中第三级的标准,针对安全管理中心和计算环境安全、区域边界安全、通信网络安全的合规进行方案设计,建立以计算环境安全为基础,以区域边界和通信网络安全为保障,以安全管理中心为核心的信息安全整体保障体系。通过安全资源池提供

63、多元化的安全服务能力,提供云平台基础安全服务和用户的云安全服务。从主动性安全防御能力(边界、主机、平台)、安全管理体系、安全运营体系等三个方面进行云安全保障体系建设。按照国家发布的信28息系统密码应用第三级基本要求,从物理和环境安全、网络和通信安全、设备和计算安全等多方面开展云密码安全的建设。在落地层面,通过防火墙、负载均衡、堡垒机、日志审计、漏洞扫描、终端准入、主机防御、数据库审计、态势感知等安全防护模块保障云平台及主机安全,通过边界防火墙保障各网络边界的安全。图 29.云平台的安全架构融媒生产云安全体系框架网络安全法组织架构管理关基条例安全管理制度等保2.0安全运维管理密码法安全管理流程恶

64、意代码访问控制Web攻击防护入侵防御南北向安全日志审计访问控制恶意代码入侵防御东西向安全边界安全计算资源网络资源存储资源分布式操作系统/虚拟机监视器虚拟资源安全物理环境安全基础硬件与网络安全物理资源安全云平台安全病毒防护入侵防护补丁管理异常监测主机安全风险评估安全培训渗透测试应急响应安全服务态势感知威胁情报威胁分析安全处置安全运营运营体系安全标准体系安全管理体系云服务安全安全管理中心安全管理中心实现针对系统、产品、设备、策略、信息安全事件和操作流程等的统一管理,实现从被动安全防护变为主动安全防护。云安全管理平台云安全管理平台用于云平台的整体安全运营管理,围绕安全运营中心构建云环境风险预测发现、

65、防御控制、检测分析和响应管理的闭环安全运营体系。态势感知平台态势感知模块通过解析云平台中主机流量和网络流量,检测出各种威胁、攻击、访问等异常行为,并与其他云原生安全防护产品实现联动防护。云平台外部署有独立的态势感知探针,对云外网络边界安全设备或网络设备流量进行镜像,将流量镜像发送至分流交换机。2904 项目中期分流交换机按需将指定的业务流量发送到态势感知平台,进行安全监控分析。平台会对网络流量进行逐包检测分析和网络攻击检测分析,并且记录网络流量日志。计算环境安全主机安全防护主机安全防护服务软件用于对主机的 Windows、Linux 系统终端进行防病毒防护。通过日志监控、文件分析、特征扫描等手

66、段,为虚拟机提供漏洞管理、基线检查、入侵检测和资产管理等安全防护措施。客户端安装在虚拟机上配合服务器端,监测针对主机系统层和应用层的攻击行为及漏洞信息,实时对主机进行防护。数据库审计数据库审计服务为数据库运维和安全管理人员提供安全、诊断与维护能力为一体的安全管理工具。数据库审计服务可对访问云内、云外数据库行为进行全面精确的审计,并具备风险状况、运行状况、性能状况、语句分布的实时监控能力。漏洞扫描漏洞扫描服务主要是为云用户的云底座、云主机、云外资产提供全方位的漏洞扫描检测以及资产发现和管理服务。区域边界安全南北向防火墙南北向防火墙主要用于互联网出口边界,融合直播边界和信源边界防火墙,除防火墙基础

67、安全策略功能外还支持应用识别、入侵防御、防病毒等功能实现边界的精细化安全管控。东西向防火墙东西向防火墙用于对云平台中 VPC 内部业务进行区域划分和网络隔离,同时东西向防火墙具备入侵防御的功能,对东西向业务流量进行深度安全防护。堡垒机堡垒机基于国产密码体系为云平台底座、云主机、云外资源的运维提供完整的审计回放和权限控制服务。基于账号(Account)、认证(Authentication)、授权(Authorization)和审计(Audit)的 AAAA 统一管理方案,通过身份管理、授权管理、双因子认证、实时会话监控与切断、审计录像回放和高危指令查询等功能,增强运维管理的安全性。通信网络安全国

68、密 VPN 网关国密 VPN 网关通过采用国产密码算法提供安全远程接入服务,以及为各分支机构内网之间数据安全传输和安全访问服务,实现网络层身份鉴别及对数据传输过程的机密性、完整性保护。30国密浏览器国密浏览器支持国密 SSL 协议和加密证书,在 Windows 和国产等操作系统上运行。云服务器密码机和密码钥匙采用国家密码管理局批准的硬件芯片实现各类密码算法,满足应用系统数据签名/验证、加密/解密的要求,保证传输信息的机密性、完整性和有效性。同时提供安全、完善的密钥管理机制,自身具备较强的安全防护能力。安全资源池基于等保三级中的“一个中心、三重防护、三个体系”为核心指导思想,云平台的安全资源池解

69、决方案是集防护、检测、响应和恢复于一体的全面的安全保障体系。通过云安全管理平台提供对安全业务的统一管理管控,为主动防护、主动检测、主动响应和快速恢复提供数据支撑和统一的管理入口。安全资源池提供丰富和完整的安全产品来实现计算环境安全,区域边界安全,通信网络安全。图 30.云平台安全资源池安全态势漏洞管理日志管理资产清点关联分析威胁情报云安全管理平台态势感知日志审计数据库审计漏洞扫描堡垒机主机安全安全资源池云租户1云租户2云租户3安全防护安全防护策略管理日志上报安全防护4.1.3 云平台 AIGC 应用开发框架为了能够高效的开发、部署和发布 AIGC 应用,需要在云平台中支持对 AI 基础设施的调

70、优,并在 PaaS 层提供一站式应用开发和发布平台,进而实现真正“云智一体”。百度智能云百舸 AI 异构计算平台为 AIGC 应用提供全方位的 AI 基础设施调优服务。百度智能云千帆大模型平台作为生成式 AI 大模型开发及 AI 应用发布平台,为 AIGC 应用的开发加速提效。3104 项目中期百舸 AI 异构计算平台百度百舸异构计算平台(AI Heterogeneous Compute,简称 AIHC)在网络、计算和存储层面实现全面的参数调优,提升 AIGC 应用的训练和推理效率。百舸异构计算平台可以为用户更好的管理 GPU 资源,在实现 AI 任务加速的同时,更高效的利用珍贵的 GPU 资

71、源。图 31.AIHC 产品能力网络链路优化机架位拓扑感知调度通信库拓扑感知高性能通信库BCCL3层无收敛RDMA网络存储和I/O优化秒级checkpoint加速大镜像加载优化分布式缓存加速高性能并行存储模型和框架优化开源模型适配高性能算子高效显存利用高效并行策略高性能训推框架全链路软硬件优化,大幅提升训推效率千帆大模型平台,打造大模型服务超级工厂垂直行业的大模型,可以在基础大模型的基础上,通过导入行业数据进行训练来生成。生成垂直行业大模型的技术包括Fine-tuning,有监督的精调(SFT)提示词工程微调(P-tuning)和基于人类反馈的强化学习(RLHF)等方法的训练。为了更好的帮助用

72、户对大语言模型进行开发和管理,千帆大模型平台提供了先进的生成式人工智能全流程工具链,包括数据管理、模型训练、推理、部署和集成等模块。千帆大模型不仅支持百度自研的文心大模型,也支持对第三方开源大模型的精调并在此基础上开发应用,从多角度全方位助力广电行业 AIGC 应用的快速开发部署和发布。在模型开发层面,千帆 ModelBuilder 采用飞桨深度学习框架作为底层支撑,并内置大模型技术。用户通过少量数据调整可轻松获得高精度和高性能的大模型。在应用构建层面,千帆 AppBuilder 提供一站式服务,涵盖数据集管理、模型训练、服务发布与监管。通过可视化界面实现模型全生命周期管理,简化从数据到服务的

73、大模型实施过程,易于上手与理解。32图 32.千帆大模型平台文心大模型 轻量级大模型垂直场景模型第三方大模型数据管理模型训练评估&优化预测服务部署Prompt工程模型广场百度智能云千帆大模型工具链智能客服客悦数字人曦灵Comate百度文库GBI百度网盘智能创作一念百度搜索知识管理甄知百度百舸AI异构计算平台Agent自主任务规划工作流编排组件工具大模型组件AI能力组件基础云组件场景化组件第三方API 代码态|零代码开源SDK应用分发示例应用三步创建应用千帆AppBuilderAI原生应用开发平台千帆ModelBuilder大模型开发平台AI原生应用4.1.4 云平台 AI 中台能力AI 中台是

74、数字化、智能化改革的重要技术底座,为广电各业务场景提供全面的 AI 算子服务能力,提供集约化管理、高效率生产、统筹化升级等多方面的价值,驱动智能化业务创新。智能中台提供包括视频、语音、图像和 NLP 等多个方面几十项的 AI 算子能力,通过开放平台门户提供便捷、自助的 AI 服务接入与应用,在内容的智能化生产、内容的全生命周期智能管理、内容安全智能审核和多模态检索等核心业务环节提供强有力的技术支撑。通过提供开放、统一和标准化的第三方集成能力,将核心功能接入已有的产品矩阵,具备和主流平台对接的能力。为面向快速变化的市场需求和用户需求做出敏捷的业务反应,为媒体深度融合发展提供必要的技术支撑进而促进

75、智能化转型。智能拆条在广电行业中,智能拆条技术被广泛应用于新闻报道、体育赛事、电视剧和电影的制作和传播等领域。例如,在新闻报道中,智能拆条技术可以将现场拍摄的视频流自动拆分成多个短视频片段,然后将其中的关键片段提取出来进行编辑和播放,以便更快速、准确地传递新闻信息。在体育赛事中,智能拆条技术可以将比赛中的精彩瞬间自动拆分成短视频片段,然后将其中的精彩片段提取出来进行编辑和播放,以吸引更多的观众。在电视剧中,自动对直播收录视频流进行实时分析,完成视频流中广告的检测、关键帧和字幕提取、镜头检测等工作。此外,智能拆条技术还可以用于自动剪辑和编辑,将不同的镜头和场景组合在一起,形成连贯的故事情节,是

76、AIGC 场景下关键的技术。3304 项目中期图 33.智能拆条对象存储(BOS/Ceph)MySQL健康拆条新闻拆条广告拆条API/SDK任务调度平台DAG解析任务管理超时管理算子平台K8S视频预处理提取元数据抽帧生成雪碧图转码推音频OCR结构化新闻拆条通用拆条(镜头、人脸、语音识别)语音识别足球动作识别篮球动作识别排球回合识别人脸识别足球沸点识别乒乓球回合识别羽毛球回合识别存储拆条片段结果存储任务数据发送任务消息消费任务消息ESRedisKafka媒体内容分析广电行业有海量的音视频文件,在 AIGC 场景下需要将这些视频文件打上对应的标签,便于后续的模型训练等工作。给视频文件附上匹配的标签

77、需要 AI 中台有对应的媒体内容分析产品来理解音视频的内容。媒体内容分析产品从场景、公众人物、实体、公共商品 LOGO、关键词、地标等多个维度进行内容理解,对音视频文件进行自动识别和标注,进而推进 AIGC 的战略落地。图 34.媒体内容分析数据源视频文件(BOS/VOD/URL)图片文件音频文件文本内容数据后处理标签去重过滤封面质量分析用户人脸/LOGO库数据预处理音频图片文本结果输出标签结果封面结果高光片段模型分析场景分类实体分类人脸识别关键词提取基于ASR/OCR智能封面LOGO识别知识图谱镜头语言识别34多模态媒资检索对海量音视频数据进行了识别和标注后,还需要提供高效搜索和检索的能力,

78、才能充分盘活这些音视频文件资源。这需要AI 中台提供以图搜图、以图搜视频、以视频搜视频、以音频搜音频、人脸检索和语义检索等功能。通过跨模态搜索的方式,可提升音视频的检索效率。图 35.多模态媒资检索客户客户媒资库文本音轨媒资入库检索请求画面知识图谱NLP言语处理内容标签提取图像特征提取人像特征提取内容标签提取智能抽帧图片视频语音视频帧特征提取人像帧特征提取内容标签提取ASR音转字音频特征提取声纹特征提取内容标签提取指纹特征match内容库查重找相关媒体文件库内容标签库图像特征库声频特征库人脸特征库声纹特征库指纹库人物库内容标签search人物IDsearch智能内容审核广电行业作为国家重要的宣

79、传渠道,承担着传播社会主义核心价值观、引导社会舆论、弘扬中华优秀文化的使命。因此,内容的合规对广电行业十分重要。通过内容审核可以确保宣传的内容符合国家法律法规和政策要求,避免违规内容的播出,维护社会稳定和公共利益。面对海量的内容,AI 中台可以提供全面完善的内容审核产品来提高媒资内容审核的效率,降低人工审核漏审风险。3504 项目中期图 36.智能内容审核直播视频流文本图片视频语音数据源百度官方黑库自定义审核模板自定义黑/白库审核规则配置视频帧语音转化文字识别声纹数据预处理涉黄识别涉政识别涉恐识别违禁识别广告识别公众人物识别娇喘识别logo识别系统放行显示违规项可进行人工复审显示违规项可进行人

80、工复审机审通过疑似违规确认违规结果返回数据预处理4.1.5 云平台数据中台能力数据是构建广电行业大模型和 AIGC 应用的核心要素。数据中台对数据进行全生命周期管理,构建采、存、管、用一体化能力。通过数据中台可以实现对数据的高效管理和使用,提升 IPTV 智能推荐系统的用户满意度,提升大模型和 AIGC 应用的开发效率,还可以通过数据洞察帮助长江云做关键市场决策,进而更好的把握行业发展趋势并驱动业务增长。图 37.云平台数据中台结构化半结构化非结构化LOG/WEB/IoT语音、图像可视化BI交互式分析批处理流式计算机器学习数据湖数据集成数据治理36湖仓一体技术架构在数据量指数增长、数据类型繁杂

81、多样、数据应用场景多变、数据分析实时性要求越来越高的多重挑战下,单一的数据仓库或者数据湖解决方案满足不了用户对数据挖掘和使用的需求。湖仓一体架构成为 AIGC 浪潮下数据架构演变的必然趋势。云平台的湖仓一体架构融合了数仓和数据湖的优势,通过将数仓构建在数据湖上,用数据湖的低成本存储方案实现数据仓库类似的功能。此外还采用了存算分离的架构,减少计算对存储的依赖,提高集群的弹性,以便获得更高的性价比,降低运营的成本。图 38.湖仓一体技术架构原始数据入湖建明细表和汇总表湖仓规划批量入湖实时入湖数据入湖湖仓查询湖仓分析和开发湖仓计算元数据加速数据面缓存数据加速物理表映射表统一元数据服务数据湖存储存算分

82、离算存 一站式数据治理和开发平台AIGC 场景下的海量数据导致了数据治理管理难、开发效率较低和数据分析技术门槛高的困境。云平台通过数据中台一站式数据湖管理与分析平台 EasyDAP(Easy-Data Lake Management and Analysis Platform,简称 EDAP)解决上述难题。一站式数据湖管理与分析平台以数据为核心,可以一站式完成数据集成、数据治理、数据开发、数据分析和数据服务,并提供方便易用的可视化开发操作界面,降低数据使用门槛,提高应用开发效率。3704 项目中期图 39.一站式数据湖管理与分析平台非结构化数据SDK埋点Kafka日志文件HDFSOracleM

83、ySQL结构化数据OracleHiveMySQLETLTSDBMongo数据集成实时作业spark/flinkUDFCEPSQL作业追溯回溯补救血缘分析离线作业mr/spark/hivePythonShellSQLUDFDAG依赖资源管理时间基准可视化监控告警任务运维全局调度数据开发运维数据湖分析HivePresto元数据行列权限脱敏REST APIJDBC权限管理API流控应用管理数据服务报表大屏APP网站服务数据应用数据标准数据目录数据质量数据标签数据地图数据资产数据治理 一站式数据湖管理与分析平台的关键能力如下。0 代码数据集成:提供多源异构数据的分布式集成工具,包括 Oracle/Sq

84、lServer/MySQL 等关系型数据库,NoSQL数据库,文件等常见数据源。可视化数据开发:通过可视化拖拽式插件式开发流水线作业。支持 Hive/Spark/Flink/JDBC/Python 等常见作业类型,支持对接下游机器学习训练任务。作业运维:支持配置复杂作业调度,作业间图状依赖关系和月级天级等周期依赖关系,支持一键重跑修数等运维操作。交互式分析:支持 PB 级数据高并发实时查询分析。开放 API:支持用户开发定制化的上层数据应用,支持用户对作业进行高效运维管理。数据可视化能力数据可视化是数据中台关键的能力之一。通过数据可视化平台提供的界面美观、交互友好的报表和大屏,帮助长江云更高效

85、的进行数据分析和业务决策。38图 40.数据可视化平台用户数据源账号系统空间隔离角色管理用户管理权限控制大屏链接1大屏链接2大屏分享收藏报表收藏大屏用户个人中心日期多选单选过滤组件(10+种)表格饼图折线可视化组件(30+种)报表1可视化编辑器报表2大屏1大屏2报表空间SQL建模API静态录入数据可视化平台支持直连 Excel/CSV、MySQL、SQL Server、PostgreSQL、Oracle、GreenPlum、Kylin、Hive、Spark SQL、Impala、Presto、Vertica 等多种数据源,还可以通过 API、静态 JSON 方式导入数据。数据可视化平台提供图表

86、、指标、地图、表格、文字、媒体等不同类型报表组件。支持设置复杂的下钻、联动,在多个图表之间进行数据联动跳转。数据可视化平台还支持精细的权限控制,包括配置组织、空间、角色、用户等维度的访问控制策略。4.1.6 云平台研发支撑能力数据治理和数据标准化云平台能够高效地采集来自不同源的数据,包括结构化数据、非结构化数据以及流数据等。并提供强大的数据治理工具,能够将多源数据进行清洗、转换和合并,为客户画像和精准营销提供高质量的数据支撑。进而提高推荐系统的客户满意度和营销转化率,提升运营推广效率。高效的数据计算与分析云平台支持各种大数据计算框架,能够进行批处理、实时流处理和图计算等多种计算模式。通过这些计

87、算框架,用户可以高效地进行数据分析和挖掘,发现数据中的价值。比如 IPTV 平台可以根据 IPTV 用户的点击率、评分和评论信息进行实时聚合分析与查询,生成按节目类别分类的排行榜。用户可以通过排行榜查看最受欢迎的节目,并选择自己感兴趣的节目进行观看。数据可视化与交互云平台提供丰富的数据可视化工具,能够将复杂的数据分析结果以直观、易理解的方式展示出来。同时还支持交互式查询和分析,使用户能够根据自己的需求灵活地探索数据。不同业务线和部门可以定制业务报表和大屏,帮助业务部门深入掌握业务运营情况,更高效的进行业务决策。3904 项目中期模型训练与调优云平台提供模型训练和调优一站式解决方案。业务部门可以

88、基于自有的数据集和基础大模型训练广电行业专属的大模型。通过模型训练和调优,大幅降低使用和学习成本,快速、低成本的训练出符合自身业务特点的大模型。模型部署与管理云平台提供模型部署和管理的完整解决方案。用户可以将训练好的模型快速地部署到生产环境中,并进行实时的性能监控和调优。此外还支持模型的版本控制和回滚功能,确保模型的稳定性和可靠性。人工智能应用集成云平台能够将人工智能技术以服务化的方式与其他业务应用无缝集成,如智能客服、推荐系统、图像识别等。这种集成能力使得用户能够快速地实现业务的智能化转型。4.1.7 迁移方案设计广电行业的应用特点是上下游对接的业务方较多,业务切换的时间窗口很短,所以在新平

89、台搭建业务系统时,应最大程度上减少应用改造工作,实现应用的平滑迁移。图 41.第一阶段应用和数据迁移二层VXLAN隧道CPEEVR应7应8应5应6应9应10应11应35专线网关二层网关VPC-1对等互联网关应1应2专线网关二层网关VPC-2对等互联网关应3应4专线网关二层网关VPC-N对等互联网关ABC Stack新云平台老数据中心40图 42.第二阶段网络出口迁移二层VXLAN隧道CPEEVR应34应35专线网关二层网关VPC-1对等互联网关专线网关VPC-1对等互联网关应1应2专线网关二层网关VPC-2对等互联网关应3应4应32应33专线网关二层网关VPC-N对等互联网关ABC Stack

90、新云平台老数据中心整体的方案是通过将老数据中心和新云平台通过物理专线互联,在业务系统 IP 和配置不变的前提下,完成业务的迁移,并确保在迁移过程中业务系统仍可正常提供服务。迁移分为两个大的阶段。第一阶段进行应用和数据的迁移。第二阶段进行公网和专线网络出口的迁移。第一个和第二阶段都具备快速回退的能力。数据链路高可靠设计老数据中心和新云平台一般处于不同机房。以长江云为例,老机房在经视大厦机房,新机房在光谷园区机房。两个机房通过物理专线进行连接。由于老数据中心和新云平台不仅在迁移的过程中有数据交互,在迁移完成后仍然存在未上云的应用和已上云的应用间的数据交互,所以老数据中心和新云平台的高可靠的数据连接

91、十分重要。IP 地址 0 改动迁移上云广电行业的应用中存在 IP 地址在程序中硬编码和写死的现状。在这个背景下,要实现最低成本的迁移上云,需要提供让IP 地址保持不变的方案。通过二层专线网关将老数据中心的 VLAN 扩展到新云平台是 IP 地址不变上云的关键。应用程序和数据 0 改动上云百度智能云提供完整的应用和数据的平滑迁移上云的服务和方案。整体方案分为准备、数据同步和业务切换三步。4104 项目中期图 43.应用程序和数据迁移上云制作系统盘镜像,云上主机通过自定义镜像启动。在源主机和目的主机上安装迁移Agent。通过迁移中心实现源主机和目的主机间的文件迁移和数据同步。源主机停机,目的主机修

92、改IP地址为源主机IP,卸载迁移Agent。1231.迁移准备首先在迁移平台的镜像制作中心制作基于源主机的操作系统的镜像,并通过镜像在云平台上创建目标主机(虚拟机)。然后在源主机和目的主机上安装迁移 Agent 软件。迁移 Agent 软件会和云平台的迁移中心通过控制通道建立控制连接,并接收和处理迁移中心下发的各种迁移操作的指令。2.数据同步迁移中心的下发迁移任务,将源主机数据同步到目标主机。在源端主机和目的主机的数据同步完成后,校验目的主机上的数据和应用,校验通过后,目的主机才可以承接业务流量。3.业务切换关停源主机,将目的主机的 IP 地址修改为源主机的 IP 地址,启动目的主机,开始承接

93、业务。此时观察应用运行情况是否符合预期。如不符合预期,则执行快速回滚方案,即关停目的主机,重启源主机。如符合预期,则迁移任务完成。图 44.迁移准备源主机迁移中心目的主机数据连接控制连接控制连接迁移Agent迁移Agent42安全策略 0 改动上云老数据中心实现了应用级别的安全管控策略,安全规则较多且有一定的复杂度。将这些安全策略的平滑上云也是一个难点。流量编排能力利旧硬件防火墙老数据中心网络边界防护的安全策略在硬件防火墙上。通过云平台提供的流量编排能力可以利旧原硬件防火墙,在应用 IP地址不变的前提下实现安全策略的 0 改动上云。此外,云平台的目标应用架构采用了通用的多 VPC 方案,VPC

94、 间涉及互通互访。在安全等保的要求下,需要对 VPC 边界做安全防护。通过流量编排方案把 VPC 间的流量导流到之前的硬件防火墙,既能满足等保合规的要求又能实现已采购的硬件防火墙的利旧。百度智能云提供了两个核心能力,在满足云平台东西向流量安全防护的同时,还可以充分保护已有的硬件防火墙的投资。1.支持纳管硬件防火墙。纳管后从用户使用角度看,硬件防火墙是云平台的一部分。2.产品化支持流量编排能力(SFC:Service Function Chain)。支持按需将 VPC 间、VPC 到专线网关的东西向流量按需引流到硬件防火墙,且支持一键 Bypass 硬件防火墙的能力。图 39.数据可视化平台VP

95、C1VM1VPC2VM2VPC网关云平台防火墙(SFC)硬件防火墙云防火墙165432图 45.流量编排 SFCVPC1VM1VPC2VM2VPC网关云平台防火墙(SFC)硬件防火墙云防火墙6124354304 项目中期通过安全资源池提供完整的云安全产品对于数据库审计、日志审计、漏洞扫描、态势感知等安全策略,云平台通过安全资源池提供 1:1 的云安全产品来承接对应的安全功能和安全策略。云平台的安全资源池产品可以提供一系列的云上安全服务,包括安全管理中心、数据库审计、日志审计、堡垒机、漏洞扫描、主机安全、态势感知等产品。通过把老数据中心安全产品的安全策略导入到云上安全产品的方式,实现安全策略的迁

96、移上云。图 46.安全资源池用户信息单点登录资产信息云端防护威胁情报用户、资产订单流程计量计费生命周期管理API授权管理报表策略管理监控告警日志采集检测事件分析数据源云端联动赋能监测平台云平台单点登录、策略管理、日志收集、授权管理本地防护组件防火墙WAF堡垒机主机安全数据库审计防篡改综合漏扫日志审计态势感知第三方入侵监测云安全管理平台应用迁移优先级设计从以下几个维度评估应用的迁移优先级。应用重要程度重要程度低的先迁移,重要程度高的应用后迁移。44 首先迁移一般应用,如实时性要求不高的离线大数据分析平台。其次是不涉及行业用户的重要应用,如双屏互动平台 之后是涉及行业用户的重要应用,如行业平台 最

97、后是 IPTV 最核心的应用,如播控平台应用的架构复杂度和周边耦合度 架构简单,周边依赖少的应用先迁移,如上下游依赖较少的内容汇聚平台。架构复杂,周边依赖多的应用最后迁移,如 3A 平台、行业平台和播控平台。说明:周边依赖包括对外部网络和运营的依赖,以及内部系统间的依赖。数据量和服务器数量 数据量少、服务器数量少的应用先迁移。数量量大、服务器数量多的应用后迁移。4.2 验证阶段在软件开发和部署过程中,验证是一个至关重要的环节。验证的目的是确保软件的质量、安全性和可靠性,防止潜在的问题和风险。缺乏验证可能导致各种问题,包括生产环境中的错误、安全漏洞和不好的用户体验。对于迁移上云项目,验证也是应用

98、迁移过程中必须执行的重要步骤。在长江云云智一体专有云平台迁移上云的项目中,我们将验证分为两个阶段。一个是云平台搭架完成后的验证,一个是在云平台上部署完应用并承载业务后的验证。图 47.验证方案应用迁移前验证应用迁移后验证新云平台的功能验证新云平台的迁移方案验证新云平台的性能验证应用承载业务前的功能验证应用承载业务后的功能验证应用承载业务前的性能验证4504 项目中期4.2.1 应用迁移前的验证云平台搭架完成后,要对云平台上核心产品的功能、性能和可靠性进行验证,还需要对迁移方案做充分验证。图 48.验证流程确定测试目标制定测试计划准备测试环境执行测试用例清空测试环境撰写测试报告功能、性能和稳定性

99、验证功能测试重点关注 SOW 中的功能是否已支持。性能测试要和当前系统的性能要求结合在一起看,如果性能测试的结果低于已有系统的性能要求,需要进行性能调优,避免因为性能问题导致应用迁移到云平台后产生业务降级和业务影响。整体的测试流程包括确定测试目标、制定测试计划、准备测试环境、执行测试用例、清空测试环境并撰写测试报告几个阶段。1.确定测试目标 确保 SOW 中的基础和核心功能在云平台都已支持 完成和业务稳定运行强相关的云平台安全和云平台高可靠功能的验证 基于当前的硬件环境产出云产品的性能基线2.创建测试计划 根据测试目标生成对应的测试用例 根据测试用例明确所需的测试环境资源 根据测试用例制定出对

100、应的测试工作时间表3.准备测试环境 申请测试账号 创建测试资源,如 VPC 和虚机等4.执行测试用例 按照测试计划执行测试用例 记录测试结果和发现的问题 对发现的问题进行跟踪管理 确保开发团队及时修复并重新测试 对修复后的功能进行再次测试,并做历史功能回归测试,确保问题已解决且没有引入新的问题465.清空测试环境 将测试账号下所有的资源全部释放 清除和测试相关的配置 注销测试账号6.撰写测试报告 汇总测试过程中发现和解决的问题 给出是否符合 SOW 的结论 给出云产品的核心性能基线,如磁盘的 IOPS 给出云平台网关类和基础服务类的稳定性验证报告 给出云平台安全相关的测试结论,如云平台漏洞扫描

101、报告 给出核心产品在高并发下的压力测试报告迁移方案可行性验证迁移方案测试流程和功能、性能和稳定性测试类似,不同的地方在于测试环境。对于云平台的功能与性能验证,测试环境只涉及云平台。迁移方案的测试还涉及在传统数据中心分配对应的测试资源,并且需要将新云平台和老数据中心通过专线进行打通。迁移方案可行性验证需要关注的重点是:在传统数据中心中分配的测试资源务必和现有业务是隔离的,避免测试流量影响现有业务。需要对迁移过程中的回滚方案做验证,确保在迁移场景出问题后回滚方案能快速和有效的执行。迁移方案验证中不仅要覆盖同子网互访的场景,还要覆盖跨子网互访的场景。4.2.2 应用迁移后的验证在对云平台的功能、性能

102、、可靠性和迁移方案进行充分验证后,可以启动应用迁移。针对应用迁移的两个阶段分别设计对应的验证方案和验证计划。应用和数据的迁移:在该阶段新云平台上的节点在应用和数据层面和老数据中心完成了同步,但并未实际承载业务。实际业务流量的迁移:此时云平台的计算节点将承载实际的业务流量。整体的验证流程和应用迁移前的验证阶段一致,包括确定测试目标、制定测试计划、准备测试环境、执行测试用例、清空测试环境并撰写测试报告几个阶段。4704 项目中期应用承载实际业务前的验证在未承载实际的业务前,首先要验证应用的基本功能是否符合预期,其次验证性能指标在云平台上是否符合预期,比如应用的调用时延、吞吐量、QPS 等指标。如不

103、满足需求,分析对应的性能瓶颈点并做对应的性能优化。可以针对应用的功能和性能制定一个验证 checklist,针对 checklist 中每个待验证的点进行逐一验证。应用承载实际业务后的验证应用承载实际的业务流量后,重点验证应用的基础功能是否正常,应用间的调用是否正常。如发现问题,需要及时启动迁移回滚方案。4905 项目后期05 项目后期后期主要工作是新云平台的运维运营以及基于云平台开发基础 AIGC 应用和面向具体垂直场景的 AIGC 应用。5.1 云平台运维新云平台除了提供完善的租户侧自运维的产品能力外,还提供了后端平台侧运维产品 NoahEE。云平台的运维产品NoahEE 面向专有云平台侧

104、运维人员提供覆盖平台基础设施(物理机、网络设备等)、平台管控服务(计算服务、网络服务等)和云资源(虚机、云磁盘等)的资源管理、监控和运维的一站式运维产品,集成了管理、监控、运维服务能力。图 49.云平台运维产品管控运服统一纳管平台底层物理设备、应用程序、租户侧云资源统一纳管全局视图。统一监控提供底层物理设备、操作系统、数据库中间件、应用程序到网络质量的全面监控和告警能力。智能化运维物理机、网络设备和云资源日常运维操作产品化,自动化和智能化。智能化服务基于ITIL标准提供服务单、变更单、事件单、审批单+知识库能力,实现流程管理和运维知识沉淀。5.1.1 管理云平台的运维产品可以统一纳管底层硬件,

105、管理上层应用及租户侧的资源。硬件管理:通过硬件资源管理功能,将物理服务器、物理交换机等硬件设备统一纳管到云平台,实现统一的配置管理和资产管理。云产品管理:管理租户在云平台上创建的云产品实例,提供对云产品实例的查询和启停等操作功能。库存管理:提供硬件资源和云产品实例资源的使用量和使用趋势查询。505.1.2 监控云平台的运维产品可以对底层物理设备、操作系统、数据库中间件、应用程序到网络质量进行全面监控和告警。监控系统监控系统使用 Agent、SNMP、Telemetry 等方式采集数据,对数据进行清洗、汇总、聚合等运算,生成可供上层应用使用和展示的监控数据。监控的范围既能覆盖云平台的硬件基础设施

106、,包括物理服务器和物理交换机等硬件类型的设备,也能覆盖云产品实例,包括虚机、VPC、对象存储等相关的云产品。图 50.云平台监控PaaSIaaS汇聚计算派生计算数据的计算进程、日志、自定义、端口SNMP、IPMI第三方监控Agent远程探测端业务自有数据数据的产生应用/设备指标查看报警策略数据仪表盘报警事件报警媒介报警组数据展示数据的使用用户服务监控网络设备监控硬件基础监控操作系统监控云服务基础监控报警监控系统图 51.云平台告警综合监控系统微信告警告警短信邮件客服人员运维人员领导客户IM告警基于监控系统产出的监控数据,通过统一的告警平台,可以让运维人员及时发现问题和故障。告警平台除了提供默认

107、的告警策略和告警通告规则外,还支持自定义告警策略。5105 项目后期5.1.3 运维通过云平台运维产品,可以对物理机、网络设备和云资源进行日常运维操作。硬件运维:支持对物理服务器、物理交换机和路由器的基础运维操作和配置下发。云产品运维:对于云产品提供基础运维操作,如虚拟机的启停、迁移等操作。还提供调整超售比策略、调整网络 QoS策略等高级运维操作。作业平台:提供白屏化运维操作能力。除了提供自动化脚本执行、文件拉取和分发、定时任务等一系列基础运维动作外,还支持通过流程调度将零碎的单个任务组装成一个自动化作业流程。每个任务都可做为一个原子节点,提供给上层或周边系统和平台使用,实现跨系统调度自动化。

108、基于作业平台可以构建巡检能力、白屏化变更能力和批量升级能力,可以有效提升运维体系化能力并提升运维工作效率。AI 集群运维管理平台:针对 AI 基础设施资源和训练推理任务提供一站式运维管理服务。横向可以管理 AI 集群中的GPU 服务器,RDMA 网络和并行文件存储 PFS,纵向从训练推理任务维度提供运维管理、容量管理和性能管理能力。纵向管理包括:运维管理:对基础设施层和 AI 任务相关的问题监控和问题发现,基于智能运维大模型的故障和问题止损建议,对故障和问题进行根因分析并提供后续优化建议。容量管理:覆盖基础设施层面的 GPU 计算资源、RoCE 和 InfiniBand 的 RDMA 网络和

109、PFS 的资源利用率,提供租户层面的资源分配率和 AI 任务维度的资源使用率。性能管理:从基础设施层面、框架层面和任务层面提供一套完整的可观测性能指标和调优建议。图 52.AI 集群横向管理能力AI集群管理GPU集群RDMA网络PFS集群52图 53.AI 集群纵向管理能力运维管理问题发现:GPU、RDMA、PFS完整可观测指标体系和秒级告警问题止损:基于智能运维大模型的故障止损建议问题定位:基于智能运维大模型的故障诊断和快速故障定位利用率:GPU、RDMA、PFS的集群硬件利用率分配率:租户层的GPU、RDMA、PFS集群的分配率使用率:GPU、RDMA、的资源使用率PFS集群容量管理AI基

110、础设施性能:GPU、RDMA网络和PFS的关键性能指标监控和调优建议AI框架性能:数据并行和模型并行训练指标和调优建议AI任务性能:训练和推理的吞吐量,性能关联参数健康和调优建议性能管理AI集群管理5.1.4 服务基于 ITIL 标准,提供服务单、变更单、事件单、审批单以及知识库能力,实现流程管理和运维知识沉淀。故障管理故障管理源于 ITIL,目的是在生产环境出现重大宕机时尽快恢复正常的服务运营,将组件失败对业务所造成的负面影响降到最低,从而确保满足服务级别和质量目标。高效的故障管理机制对云平台的运维十分关键,云平台提供了完善的故障管理能力,包括故障快速发现、服务快速止损、服务快速恢复和故障总

111、结功能。故障管理通常包括以下步骤:1.故障发现:通过监控系统、日志文件等工具来发现和记录故障。2.故障止损:执行故障预案对故障进行止损。图 54.故障管理服务管理监控配置告警触发根因诊断根因处理结果确认运维知识库服务部署故障发生故障发现止损决策完成止损完成根因诊断完成恢复完成 故障关闭5305 项目后期3.服务恢复:止损预案执行后观测服务完成恢复。4.故障总结:分析故障的根本原因,并采取预防措施来避免类似故障再次发生。工单管理云平台将基础设施池化和服务化后,以标准化的流程对外提供服务,对于问题的反馈、处理和记录通过工单能力进行标准化。工单管理提供如下能力:1.工单提交:用户可以通过云平台提交工

112、单,描述问题和需求。2.工单分配:管理员可以将工单分配给相应的团队或个人。3.工单处理:团队或个人可以通过云平台处理工单,记录处理过程和结果。4.工单追踪:用户和管理员可以随时通过云平台查看工单状态和进展。5.工单统计:系统可以生成各种工单统计和分析报告,帮助管理员了解热点问题分布和工单处理效率。5.2 云平台运营云平台提供完善的用户管理、交易管理、合同管理等功能,具备高效与全面的对内和对外运营的能力。5.2.1 账户管理云平台提供完整的单租户多子用户方案和多租户独立结算方案,可以支撑各类内部运营场景。单租户多子用户方案中,用户在财务资源上是共享的,但子用户之间进行资源隔离。这种方案适用于子用

113、户之间存在共享财务资源需求,同时又要保证数据和资源的相对独立性的场景。在多租户独立结算方案中,每个租户在财务和资源上强隔离,可以确保不同租户之间的数据和资源互不干扰,提高数据的安全性和保密性。这种方案适用于需要对财务和资源进行严格控制和管理的企业或组织。5.2.2 交易管理交易管理具备一客一价的合同定价和优惠定制能力,以及清晰、准确的计量计费数据账单展示与导出能力,可支持对外运营场景。54图 55.交易管理定价和计费售卖和优惠定价:管理、定义多套价格,其他系统可快速获取。收/退款:支持灵活的收款和退款能力。订单:管理资源财务相关操作、记录商品优惠、支付信息。优惠管理:灵活配置查询账号下的折扣等

114、信息。计费:准确计量、计价、出账,记录使用量、优惠、扣费数据。特权配置:大客户特权,账期,不停服白名单,强制服务上下线。服务有效期:管理资源的停服和启动。企业组织/多用户访问控制:跨账号/同账号的财务管理。资产:商品交易所需的现金、优惠等个人资产。云平台通过完整的定价和计费功能,可以方便的新增商品,设置通用定价或差异化的定价策略。在计费和出账方面提供实时、准确的用量和账单数据。在售卖和优惠方面也提供灵活的收款和退款、优惠、特权等配置功能,方便用户为外部客户制定不同的优惠活动、折扣或套餐。5.3 智能运维云平台的运维将向智能运维架构演进,通过将大模型的能力融入到运维体系来提升云平台的智能化运维水

115、平。智能运维架构构建在云平台知识图谱基础上。知识图谱包含云平台的结构化和非结构化的数据。通过智能助理来统一对外提供服务,智能助理支持自然语言的方式进行交互,提供智能顾问、智能观测、智能编码、智能诊断和智能运营能力。图 56.智能运维将云相关知识(非结构化、结构化、时序、日志、配置)导入大模型,生成不断演进的云平台图谱,为上层业务提供全面数据支持。建立运维知识库,通过多轮智能问答方式高效解决问题,帮助用户用好云。智能顾问智慧工单、智能巡检、智慧问答利用大模型对经典AIOps算法进行深度学习训练,解放人工算法训练成本,优化传统AIOps算法,提示异常检测准召率。智能观测异常检测、链路检测利用大模型

116、辅助进行脚本编写、代码编写、脚本优化、代码优化、SQL编写、SQL优化等。智能编码编程助手基于传统自动化运维平台(CMDB、链路、日志)等,进行告警收敛、根因分析和决策,如复杂日志分析、日志bug定位、决策树构建等。智能诊断一键诊断所问即所得,一句话生成业务运营数据,如可视化大盘、报表、详尽的数据分析等。一键取数智能运营智能助理云平台图谱5505 项目后期5.3.1 智能运维技术架构智能运维技术架构基于运维平台的全链路追踪平台、智能监控中心、智能告警中心和故障界定中心,通过整合闭环应环,实现对运维故障的提前发现、收敛问题、快速定位、决策恢复,提升运维效率。智能引擎中台由数据收集、数据开发、数据

117、治理逐层构建,形成运维大数据中台,结合 AI 算法引擎构建运维大数据与智能中台底座。数据收集层:建设统一的采控中心,通过 Agent、SNMP、Syslog、Kafka、JDBC、Http API 等多种主动和被动的方式采集数据。结合监控平台、监控探针、CMDB 数据,统一收集各项运维数据。数据开发层:基于流批一体引擎技术,通过多项标准集成数据处理算子,形成低代码数据开发平台,支持快速配置各类数据治理清洗任务,支撑运维大数据的集成。数据治理层:由可观测指标中心组件构建。数据治理层内置运维指标体系各项最佳治理实践模型,借助统一的运维数图 57.智能运维技术架构客户自动化平台故障定界中心智能告警中

118、心智能监控中心全链路追逐平台产品模块故障自愈处置决策问题收敛故障发现运行观测故障处理智能引擎中台CMDB自动扫描应用监控探针基础监控探针采控中心数据收集大数据存储时序存储配置存储模型管理运维大数据统一查询统一数据仓库AI算法引擎算法引擎可观测指标中心数据治理统一任务调度字段计算定时任务算法算子函数调用元数据查询任务管理数据开发统计过滤类型文本拼接去重分流脚本计算公式计算文本截取时间解析GORK解析数据链接算子库统计任务调度任务维护和监控算子编排StandaloneYarn ApplicationYarn SessionPer-job流批一体流式计算任务管理计算编排运行环境管理56据模型管理、覆

119、盖度管理和指标管理,指导运维数据的治理,支撑标准运维大数据的标准化治理。运维大数据层:构建运维一数据仓库,对经过标准化治理的指标模型、运维对象、时序指标和各项告警、日志等信息进行统一存储,并通过指标中心构建完整的关联性,提供统一查询,为运维故障定位和处置场景提供数据支撑。AI 引擎层:由开放性 AI 算法引擎构建 AI 算法中心,为运维故障定位和处置场景提供算法能力支撑。产品模块建设全链路追踪平台、智能监控中心、智能告警中心和故障定界中心各项模块。运维故障定位与处置基于产品模块的核心能力支撑各类运维场景。基于全链路追踪平台进行运行观测,观测应用性能各项指标;基于智能监控中心,通过指标和日志的异

120、常检测发现故障;基于智能告警中心对故障告警进行收敛汇聚;基于故障界定中心对故障问题进行根因分析和处置决策,调用自动化程序完成故障自愈。5.3.2 智能运维处理流程智能运维处置流程是基于对象的应急处置预案。结合 CMDB、统一事件平台、自动化平台等周边系统,在故障事件发生时快速分析、诊断,提供处置推荐、自动或半自动处置。可以沉淀故障分析和快速处置的知识经验,加强应急处置的数字化管理,提升应急处置效率。图 58.智能运维处理流程 事前建模根因定位 止损推荐快速处理事后复盘对象模型建设对象实例接入排障分析模型建设处置场景及编排建设业务/技术影响分析模型管理处置记录及评价模型持续优化处置场景挖掘处置标

121、准性检查事件复盘快速处理外部接口异常检查轨迹检查日志检查根因定位及止损方案异常接入故障识别指标分解故障图匹配故障图匹配故障图匹配因果图构建处置场景止损方案处置实施故障恢复验证处置策略生成根因推荐 未知场景止损推荐统一登录运维门户告警集中监控业务影响分析架构视图指标数据服务指标体系配置关系CMDB对象间关系运维知识事件 问题 变更ITSM自动化运维平台同步更新运行信息所有指标告警自动化原子操作5705 项目后期5.4 基于云平台的 AIGC 应用当前 AIGC 应用如雨后春笋般快速涌现,发展前景十分广阔。AIGC 应用可以生产文本、图像、语音、视频等形式的内容。通过引入AIGC技术,打造针对广电

122、行业内部和外部应用,可以优化生产流程、提高内容生产效率,提升行业竞争力和影响力。5.4.1 文生海报在广电行业,数字海报是融媒体的关键产品之一。数字海报已经有广泛的使用,深受用户喜爱,比如主打实效性和视觉冲击力的新闻海报和用于做营销和推广的开机首屏海报。融媒体时代的数字海报同时有传统海报的纸媒属性和数字平面设计的元素,可以通过加入有视觉冲击力的图像和简洁直观的文字,实现与受众间的高效信息传递,有“一图胜千言”的效果。遇到重大素材、突发事件时,在融媒体上推送的数字新闻海报能达到很好的传播效果。基于云平台的算力,结合广电行业自身的图片和视频素材,通过模型的微调和训练打造广电行业的文生海报的技术路线

123、是可行的。下图是笔者在半个小时内基于文心一言的文生图功能制作的一副宣传海报。图 59.AIGC 海报洞见新格局,智变新视听第27届中国智能视听与科技创新高峰论坛武汉富力威斯汀酒店2024年5月23日-24日主办单位:协办单位:在实践中,文生图的功能可以为广电行业的视觉设计人员提供更多的创意参考和灵感源泉,更高效的生产新闻海报和营销海报。585.4.2 文生视频基于用户输入的脚本生成高质量的视频,对于广电行业的内容制作和内容生产流程是一项重大的技术更新。通过这项新技术,可以极大的提高内容生产效率。广电行业中已有先行者通过文生视频工具进行内容生产,并将生产的内容向公众推送和传播。C 端用户可使用文

124、心一言进行文生视频。用户只需要在文心一言输入文案,就可以生成对应的视频,并支持方言播报视频文案。图 60.AIGC 视频由文心一言生成的黄鹤楼介绍视频的视频链接如下:https:/changjiangyun- 项目后期图 61.AI 智能混剪AI视频:智能混剪输出:成片视频输入:Prompt/视频文案输入主题,全自动剪辑:客户只需输入宣传主题,即可享受全自动化视频生产剪辑流程。行业定制,精准满足:可以根据金融、媒体等行业的场景需求进行模型定制,从而精准满足客户的端到端需求。视频再编辑,高效灵活:支持对生成的视频进行二次编辑,满足个性化需求。中国航天近年的发展成视频2秒 10/1800AI帮写5

125、.4.3 数字人应用数字人技术指通过数字技术创造逼真的、可以在虚拟环境中进行互动的数字化人物。在广电行业中,数字人也有重要的应用场景,比如通过数字人主播进行新闻播报。此外在将大语言模型和数字人结合后,数字人将具备强大的自然语言理解能力和多轮交互对话能力,这让数字人和观众进行实时交互成为可能。如本例,新闻资讯虚拟数字人的展示视频链接如下:https:/changjiangyun- 62.AI 数字人DIGITAL HUMAN605.4.4 元宇宙应用基于云平台可以快速搭建元宇宙应用,实现从 0 到 1 快速建设元宇宙平台。元宇宙平台集成了智能视觉、智能语音、自然语言理解和实时音视频等 9 个技术

126、方向的 20 余项重要 AI 能力。平台还实现了端侧、玩法侧和业务侧的开放,并面向生态伙伴开放代码,支持自主创造。通过完善的平台能力、运营能力和生态开放能力,可以实现在多个垂直领域构建长江云的元宇宙虚拟空间,并基于元宇宙空间进行内容创新,实现传统媒体业务的转型和发展。图 63.元宇宙架构落地场景运营层创造层算法层数资层服务场景社交场景娱乐场景商业场景VR端移动端PC端Mac端云手机端/Web端渠道包/平行宇宙端多端入口打通社区活动主题演出社交活动快闪活动品牌活动电影节产品加速希壤用户平行宇宙用户用户运营个人空间用户留存企业空间平行宇宙用户空间用户成长体系运营管理系统用户管理空间管理数资管理社区

127、管理移动端大屏端客户端统一账户中台统一数据商城类PaaS+SaaS演出类PaaS+SaaS统一运营Avaion SDK产品运营个人空间企业空间商业空间公共场景地图传送自动导航一键传送POI交通工具道具背包屏幕交易系统/商场形象表情动作AI智能人物渲染能力十万人混音语音对话能力万人同屏Nearby策略环境音物体场景Avatar/数字人/NPC视觉算法视频算法人体建模算法模型训练数据算法语音算法图像算法AI行为算法交通模拟算法物体建模算法场景建模算法百度智能云百度官方教资生态教资客供教资(商业客户/平行宇宙空间)表情动作库Avatat模型库物体模型库场景模型库Avatat模型库物体模型库场景模型库

128、Avatat模型库物体模型库场景模型库IP库统一模型标准、格式场景内容6105 项目后期基于元宇宙平台打造宣传和展示中心根据后台人员设置的内容生成展示和宣传专区,并通过图文、音视频和 3D 模型的方式进行交互,还可以在任务完成后给予奖励和积分,实现更高效的信息传播。基于元宇宙平台打造虚拟舞台在虚拟舞台上可以举办演唱会等活动。演唱会的虚拟舞台可根据活动主题定制风格。观众可以通过点赞、鼓掌、表情和文字等多种方式进行交流和互动。图 64.元宇宙展示中心图 65.元宇宙虚拟舞台62基于元宇宙平台打造数字影视通过沉浸式的数字影视虚拟场景和丰富的影视交互活动打造出一个虚拟与现实相互交融的影视元宇宙世界,提

129、供全新的社交形式和多元的用户体验。图 66.元宇宙数字影视5.5 基于云平台的行业应用长江云基于云平台的大模型和 AI 基础能力可以在多个垂直领域构建行业 AIGC 应用。5.5.1 政务相关应用通过大模型等新技术,长江云可以为政府开发多种类型的政务应用。一站式的政务服务大厅通过一站式的政务服务大厅,为办事公众提供智能预约、智能取号、智能引导、智能交互、智能填报等服务,还可以支持语音对话服务、语音投诉服务和智能识别服务。6305 项目后期政务智能语音客服应用依托大模型的知识库和语音识别能力,长江云可以为政府构建政务智能语音客服应用。在市民呼入热线等待接听时,智能客服可率先接听,并预先采集市民来

130、电意图。对于与知识库匹配的问题,智能语音客服可自动解答。将复杂问题转交人工话务员处理,并让话务员在接听电话之前了解市民来访意图;还可以利用智能语音客服对事项办理情况进行回访,将事项办理结果告知市民,并采集市民对该事项满意度。政务智能语音客服可以帮助人工话务员快速完成回访的初筛工作,让话务员更有针对性地跟进处理不满意工单,助力热线有效完成业务闭环,实现事事有回应。5.5.2 文旅相关应用广电媒体可以通过新闻报道、社交媒体、网络直播、短视频等渠道来宣传和推广旅游目的地、文化活动和旅游产品,吸引更多的游客前来体验和消费,从而推动文化旅游的发展。长江云通过大模型技术的助力,可以轻松实现文旅应用程序和文

131、旅数字人的开发,为游客提供行程智能规划、智慧导览、智慧停车、虚拟导游、沉浸式旅游和数字藏品等一站式个性化旅游信息服务,实现游前、游中、游后全流程服务支撑。图 67.一站式政务服务大厅47m数字人智能咨询AR导航/室内导航数字人智能咨询政务服务大厅人性化表现645.5.3 教育相关应用通过数字化、网络化、智能化手段,可提高教育教学的效率和质量,促进教育资源的优化配置和共享,推动教育的创新发展。学生可以通过长江云开发的 APP 获取丰富的学习资源,实现个性化学习。比如借助于大模型和虚拟现实相关技术实现汽车行业的现场或远程多人分组协同实训。图 68.文旅应用语音导览资讯问答AI讲解虚拟导游720 V

132、R全景体验。5G直播虚拟体验AR旅游体验元宇宙AR打卡沉浸式体验电子商城购物精准推荐精准营销预约购票智能行程规划旅游预约、规划游前车位预约反向寻车车位级导航智慧停车周边推荐路线规划找设施找美食智慧导航预约购票三码合一5秒入园个人旅游大数据分析报告数字藏品NFT留住记忆图 69.教育应用6505 项目后期5.5.4 健康相关应用广电行业承担着宣传党和国家卫生方针政策和向社会和公众普及健康知识的重要任务。长江云借助大模型和 AI 新技术可以开发对应的 APP,提高宣传效果并可以通过生动的案例和深入的解析引导人们形成科学和健康的观念和生活方式。图 70.健康应用视频通话健康咨询语音呼救紧急呼救联系子

133、女和政府监管平台语音呼叫服务站人工坐席依托百度百科、百度医典智能回答健康问询SOS开始呼救向Ta呼救紧急联系(1)度急救助 186*32566706 项目全生命周期管理06 项目全生命周期管理项目管理贯穿于迁移上云项目的全生命周期,并起到了至关重要的作用。通过有效的项目管理,对项目进度、预算和风险等进行全面的控制,确保项目能够按时保质高效的完成。6.1.制定项目计划制定可行的项目计划并确保项目按计划进行,确保相关人员都清楚自己的责任,进而使得项目能高效的落地和执行。6.1.1 干系人管理项目干系人是影响项目决策、活动或结果的个人、群体或组织,以及被项目决策、活动或结果所影响的个人、群体或组织。

134、在实践中的一个经验是对于大型项目成功落地的首要因素是要做好项目干系人管理。云平台建设和应用迁移上云的项目,首先得到了集团高层的全力支持。长江云董事长作为项目一号位和总指挥,总经理作为总负责人,牵头该项目的落地。其次,长江云的业务部门和技术支持部门作为核心参与方,全力推进项目的落地和实施。最后,应用软件供应商、云平台供应商和周边生态伙伴全力协作,对齐项目目标和计划并签署项目军令状。项目总指挥和总负责人给项目团队明确的三点作战策略为:第一:明确目标,统一思想待迁移的业务系统是长江云的核心业务,不但为集团贡献了相当可观的收入,还承担了很重要的社会任务。云平台的建立属于公司核心战略,是未来实现广电行业

135、创新和突破的关键,各方需要高度重视、给予足够的支持,确保项目的顺利落地。第二:充分对齐,精细实施鉴于项目的战略意义,集团、业务部门、技术支撑部门和各参与厂商需要非常慎重的对待迁移上云的实施。每个业务系统迁移前,对应系统各参与方要做到信息和方案前置,充分的对齐,明确迁移范围、网络关系、迁移风险、应对措施和明确分工及各事项牵头责任人。每个系统至少进行三次对齐。第一次迁移项目组内部对齐;第二次四方预对齐;包括迁移项目组、业务部门、业务系统供应商和周边伙伴;第三次进行割接前对齐。三次对齐后,各方签字确认。第三:全流程验证,全天候保障迁移完成后的第一时间,相关方对业务系统及其上下游业务进行全链路验证。验

136、证通过后,确认迁移完成,转入迁移保障阶段。第一个业务系统上线后即刻启动 7*24 小时的现场值班保障。686.1.2 制定项目计划项目计划是项目成功落地的关键。项目计划明确了项目的整体目标和各个阶段的目标,为项目团队提供了明确的方向。在迁移的项目中,制定的核心项目计划包括:云平台硬件部署计划:包括硬件服务器和网络设备等的到货,部署安装的详细计划。云平台软件部署计划:包括云平台的软件部署的详细计划。云平台功能验收计划:对云平台的功能进行测试和验收,确保其满足需求和标准。应用迁移计划:包括将现有应用迁移至云平台的方案验证,应用迁移先后顺序的详细计划。在每个项目计划中:制定任务分解结构:将项目工作细

137、分为具体的任务,并给每项任务指定具体的责任人。成本核算:估算各个任务所需的时间、资源和预算。确定项目关键路径:识别出决定项目总时长的重要任务序列。统筹各项任务:安排任务的先后顺序,形成项目执行路线图。在制定完项目计划后,需要项目计划中每项任务的责任人签字。6.2.项目实施和质量管理项目实施和质量管理是项目的重中之重,它对于确保项目按时保质完成、控制资源和成本等方面都具有重要意义。6.2.1 使用 PDCA 工具在迁移上云项目中的进度管理采用了 PDCA(Plan-Do-Check-Act)戴明环工具。PDCA 由美国质量管理专家休哈特提出的,后来被戴明采纳并广泛宣传,是项目管理和质量管理领域科

138、学和有效的工具。6906 项目全生命周期管理PDCA 循环分为四个阶段:1.P(Plan)阶段:制定计划,明确目标,并制定相应的实施方案。2.D(Do)阶段:实施计划,即根据方案来执行计划。3.C(Check)阶段:检查计划执行的效果,通过评估、测量和报告等方式确认实施效果,并找出实施过程中可能存在的问题。4.A(Act)阶段:对检查的结果进行处理,对成功的经验加以肯定,并予以标准化;对于失败的教训也要总结,引起重视。对于没有解决的问题,应提交给下一个 PDCA 循环中去解决。图 71.PDCA 工具706.2.2 项目中的进度管理实践在项目过程中,当实际进度与项目计划有较大的偏差时,如进度延

139、期超过 1 周或 1 周以上,项目经理会及时上报项目交付延期风险,并组织项目核心成员对当前问题进行分析和决策,视情况做加强资源投入动作或做计划变更的动作。如果要做计划变更的动作,需要上升到项目的总负责人进行决策。图 72.进度管理进度监控及纠偏进度可视化进度计划定期复核纠偏成果验证计划有效性在项目进度把控和可视化层面采用的动作包括:项目阶段性汇报会议:项目组进行阶段工作成果汇报和阶段工作汇报,将工作成果提报给项目领导小组进行审核。项目组周例会:采用远程会议或现场方式对当周项目进程和阶段成果进行汇报和研讨,并规划下一阶段工作计划。项目周报:由百度智能云项目组每周出具项目周报,包括本周工作总结和下

140、周工作安排,以邮件形式提报给领导小组成员,并抄送给项目执行小组成员。重大问题备忘录:对项目运行中的重大问题进行澄清和确认。在进度管理积累的优秀实践是:专题研讨会:针对项目过程中的关键问题、难点问题,邀请小组成员参与讨论解决的研讨会。复盘会:根据项目的实际情况,对关键问题进行复盘,提炼后续优化方法。为后续任务提供最佳实践指导。6.3 风险管理项目管理要提前识别和分析风险,并提前制定应对策略。这样可以在风险发生时迅速采取行动,减少风险对项目的影响。7106 项目全生命周期管理6.3.1 风险管理的重要性云平台的建立和存量应用迁移上云是一个复杂的大工程,其中存在多方面的风险,各种风险需要得到充分的识

141、别和评估。这些风险包括应用在云平台上部署时的运行性能风险、业务适配风险和业务合规风险,以及在迁移过程中的业务中断风险和数据安全风险,和在整个项目落地过程中的人员技能风险等。只有通过对风险进行有效的识别并制定有效的应对策略才能确保项目能顺利的落地。6.3.2 项目中的风险管理实践项目组成员对于迁移项目过程中的风险管理十分重视。项目经理在项目初期即牵头组织团队核心成员对各方面的风险进行识别和记录,这些风险涵盖方案、技术、进度和资源等多个维度和多个领域。针对每一项风险都会具体评估影响范围、严重性和责任人,并制定可落地的风险应对措施,此外还会持续跟踪和监控风险消除情况。如果风险持续 1 周或以上不能解

142、决,会组织专题研讨会进行攻关,如仍不能解决的会上报到项目核心管理团队进行决策。对于贯穿于项目全流程的信息安全风险,在项目初期就会要求所有项目成员签订保密协议,要求所有项目成员不泄露项目关键信息,如项目中有新员工加入,会在上岗之前进行相应的信息安全培训。7307.未来展望07 未来展望生成式人工智能作为现象级技术热点在内容行业产生颠覆式创新的趋势已经变得越来越明显。广电行业在视频生成领域有积累和沉淀,未来广电行业借助生成式人工智能技术进行产业创新存在着十分巨大的想象空间和市场机会。可以预见的是人工智能技术在广电行业的内容创作、节目制作、节目分发和用户体验优化等多个方面将发挥越来越重要的作用。在内

143、容创作方面,生成式人工智能技术可以显著地提高内容创作和内容生产效率。基于大模型的自然语言理解能力和视频内容生成能力,大模型可以根据输入的创意脚本生成高质量的视频内容,这将为编剧、导演和制片人提供更多的创意和选择。在节目制作方面,生成式人工智能技术在视频制作过程中也能够实现提效的作用。此外基于大模型的人工智能技术可以简便的处理和合成音频和视频等素材,提高剪辑、合成和特效等环节的效率。比如在工作人员输入长视频后,拆条引擎完成不同类型视频素材片段的自动标识,协助后续其他业务系统进行合成、摘要和集锦等多种类型的视频创作需求。在节目分发和用户体验方面,生成式人工智能技术也有很大的用武之地。通过大模型的记

144、忆和理解能力,可以构建个性化的智能推荐服务,人工智能可以根据用户需求和偏好,为用户提供更加精准和个性化的内容推荐和服务。同时人工智能还可以通过智能分析和数据挖掘技术提高广电行业的广告投放的精准度和效果增加广告收入。广电行业中有海量的有版权的视频素材数据,在有了算力和大模型能力的加持后,借助已有的视频数据,对基础大模型进行微调和训练就具备了产出广电行业视频生成大模型的条件。此外广电行业也有庞大的 IPTV 客户群,对于大模型产出的高质量的视频节目内容,有清晰的市场落地场景和很大的市场空间,具备完整的商业闭环能力。另外一方面,未来承载生成式人工智能应用的云智一体平台的重要性也会更加突显。随着大模型

145、技术和生成式人工智能应用在各行各业的逐渐成熟,云智一体的云平台产品和技术将如同一台强大的引擎,为媒体、政府、文旅、教育和健康等多个行业的技术创新和业务升级提供源源不断的动力。云智一体的云平台不仅提供强大的计算算力、高性能存储和网络,还通过 PaaS 层的大模型训练调优平台,帮助各行各业更好地使用生成式人工智能技术。政府可以借助云平台提升公共服务效率,实现政务数据的智能化处理与分析。在文旅领域,云平台能够通过大数据分析,为游客提供更加个性化的旅游体验和精准的市场营销。对于教育行业,云平台可以根据学生的学习情况和兴趣,提供更加定制化的教学方案和智能辅导。在健康医疗领域,云平台则可以协助医生进行更精

146、准的诊断和治疗方案制定,同时为患者提供更加便捷的在线医疗服务。长江云“云智一体”专有云平台建设不仅可以支撑长江云数字化和智能化战略更好落地和新质生产力的高质量发展,同时为广电单位平台上云提供可复制、可推广的技术方案和典型案例,从而持续推动 AI 技术在媒体跨界融合领域的应用与发展。在虚实结合的场景下,可以通过虚拟现实与新闻报道的融合、增强现实与广告营销的融合、数字分身与社交媒体的融合、智能语音与广播电台的融合等方式,不仅可以为受众提供更加丰富、多样的内容和服务,还能为媒体行业带来新的业务增长点和盈利模式。在数据治理的场景下,可以通过数据整合与共享、智能化内容生产与传播、精准营销与广告投放、媒体

147、业务创新与优化以及与政府和其他行业的合作等,为媒体行业的转型和升级迎来新的发展机遇和挑战。未来,长江云将以“云智一体”专有云平台建设为契机,与百度智能云等合作伙伴紧密合作,共同构建省域智能融合生态,并在技术共享、产品研发、平台升级、标准制定等多个领域展开深入合作,从而持续推动 AI 技术在媒体跨界融合的深度应用与发展,助力广电行业培育发展新质生产力,赋能行业高质量发展。74附录缩略词表缩 略 词说 明AIGCAIGC 是“Artificial Intelligence Generated Content”的缩写,意为“人工智能生成内容”,是一种利用人工智能技术来生成内容的方式,涉及多个技术领域

148、,如自然语言处理、机器学习、深度学习等。ARMARM 架构,全称为 Advanced RISC Machine,是一种精简指令集(RISC)处理器架构。AVAV 是 Anti Virus 防病毒防火墙的缩写。它是一种网络安全软件,旨在保护计算机免受恶意软件和病毒的攻击。BVRBVR是Baidu Virtual Router的缩写,提供路由、访问控制、限速、地址空间转换、网络地址转换等功能。CDNCDN 是 Content Delivery Network 的缩写,即内容分发网络。它是一种分布式网络架构,通过将内容分发到全球各地的服务器节点上,以提高内容传输速度、降低网络延迟、减轻服务器负载、提

149、高网站可靠性和抵御攻击。EVREVR 是 External Virtual Route 的缩写,用于连接云平台和传统数据中心 IDC。EPGEPG 是 Electronic Program Guide 的英文缩写,意思是电子节目指南。EPG 通常以图形界面显示,包括节目名称、频道、播出时间等,用户可以选择观看每个节目的更详细内容。FTPFTP 是 File Transfer Protocol 的缩写,中文名为文件传输协议。它用于在网络上的两台计算机之间传输文件,是互联网上广泛使用的一种文件传输方式。GUAGUA 是 Global Unicast Address 的缩写,也被称为可聚合全球单播地

150、址。该类地址全球唯一,用于需要互联网访问的主机,相当于 IPv4 的公网地址。HAVIPHAVIP 是 High Availability Virtual IP 的缩写,是一种高可用虚拟 IP 地址,通常用于实现云主机或服务器的高可用性部署。08.附录75IaaSIaaS 是 Infrastructure as a Service 的缩写,中文名为基础设施即服务。IDCIDC 是 Internet Data Center 的缩写,中文名为互联网数据中心。IPSIPS 是入侵防御系统(Intrusion Prevention System)的缩写。它是一种网络安全设备或系统,可以实时检测、防范和

151、阻断网络中的攻击行为。IPTVIPTV 是 Internet Protocol Television 的缩写,意为“交互式网络电视”。LEAFLEAF 交换机是叶脊(Spine-Leaf)网络架构中的重要组件之一。在这种架构中,LEAF 交换机作为接入层,提供网络连接给终端、服务器,同时上联给 Spine 交换机。LVSLVS(Linux Virtual Server)是一个开源的集群系统,可实现负载均衡和高可用性,使得多台服务器能够共同处理网络请求,提高系统的性能和可用性。NATNAT 网关(Network Address Translation Gateway)是一种网络设备,它能够将内部

152、网络的私有IP 地址转换为合法的公网 IP 地址,使得内部网络的主机可以通过 NAT 网关访问外部网络。NLPNLP 是自然语言处理(Natural Language Processing)的缩写。这是一门融合计算机科学、人工智能和语言学等领域的交叉学科。PaaSPaaS 是 Platform as a Service 的缩写,中文名为平台即服务。PFSPFS(Parallel File Storage),即并行文件存储,是一种面向高性能计算场景(如 AI、HPC 等)的存储解决方案。这种存储系统的主要特点在于其支持多应用客户端的并行访问,且能为大型高性能计算集群提供高 IOPS、高吞吐、低时

153、延的数据存储服务。RDMARDMA(Remote Direct Memory Access,远程直接内存访问)是一种网络通信协议,允许网络中的一台计算机在不通过操作系统、协议栈以及 CPU 中断等干预的情况下,访问另一台计算机上的内存中的数据。RLHFRLHF(Reinforcement Learning from Human Feedback,从人类反馈中进行的强化学习)是一种机器学习方法,它将强化学习(RL)与人类提供的反馈相结合,以训练机器学习模型。76RoCERoCE(RDMA over Converged Ethernet)是一种网络通信协议,它允许通过以太网连接实现高性能、低延迟的

154、远程直接内存访问(RDMA)。RPRP 节点在组播中是 Rendezvous Point 的缩写,中文名为汇聚点。RP 的主要作用是在组播中作为发送者和接收者的汇聚中心。SFCSFC(Service Function Chain,流量编排)是一个有序的业务功能的集合,它基于分类和策略对网络上的 IP 数据包、链路帧或者数据流进行一系列的业务处理。SNMPSNMP(Simple Network Management Protocol,简单网络管理协议)是一种用于网络设备管理和监控的互联网标准协议。SpineSpine 交换机是叶脊(Spine-Leaf)网络架构中的核心交换机,其主要功能是实现高

155、速数据传输和提供网络连接的可靠性。它与 Leaf 交换机共同组成了叶脊架构的核心部分,其中 Leaf 交换机负责接入层的网络连接,而 Spine 交换机则作为核心层,负责高速数据传输和汇聚多个 Leaf 交换机的流量。SSLSSL(Secure Sockets Layer,安全套接层)是一种提供网络通信安全性的协议,可在客户端和服务器之间建立加密的通信通道。ULAULA(Unique Local Address)是 IPv6 中的一种地址类型,全称为“唯一本地地址”。这种地址类型设计用于在本地网络内部进行通信,而不会被路由到全球互联网中。VLANVLAN(Virtual Local Area

156、Network,虚拟局域网)是一种将局域网内的设备从逻辑上划分成多个不同网段的技术。VPCVPC 是 Virtual Private Cloud 的缩写,中文名为虚拟私有云。指的是用户在云上申请的一个隔离的网络环境,这个环境可以包含多个云资源,如云服务器、云数据库、云存储等。VRRPVRRP(Virtual Router Redundancy Protocol,虚拟路由器冗余协议)是一种用于提高网络可靠性的协议。它通过在一组路由器之间选举一个虚拟路由器作为默认网关,实现网关的备份和故障切换,从而确保网络的高可用性。VXLANVXLAN(Virtual Extensible Local Area Network,虚拟扩展局域网)是一种封装协议,它使用隧道技术在底层第 3 层网络上扩展第 2 层连接,从而提供数据中心连接。WAFWAF 是 Web 应用防火墙(Web Application Firewall)的缩写。它是一种专门用于保护 Web 应用程序免受各种攻击的安全设备或系统。

友情提示

1、下载报告失败解决办法
2、PDF文件下载后,可能会被浏览器默认打开,此种情况可以点击浏览器菜单,保存网页到桌面,就可以正常下载了。
3、本站不支持迅雷下载,请使用电脑自带的IE浏览器,或者360浏览器、谷歌浏览器下载即可。
4、本站报告下载后的文档和图纸-无水印,预览文档经过压缩,下载后原文更清晰。

本文(百度智能云&长江云:2024面向AIGC的数智广电新质生产力构建白皮书(82页).pdf)为本站 (Dimples) 主动上传,三个皮匠报告文库仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。 若此文所含内容侵犯了您的版权或隐私,请立即通知三个皮匠报告文库(点击联系客服),我们立即给予删除!

温馨提示:如果因为网速或其他原因下载失败请重新下载,重复下载不扣分。
客服
商务合作
小程序
服务号
会员动态
会员动态 会员动态:

wei**n_...  升级为高级VIP 136**67...  升级为标准VIP

136**08...  升级为标准VIP 177**34... 升级为标准VIP 

 186**59...  升级为标准VIP  139**48... 升级为至尊VIP 

wei**n_... 升级为标准VIP 188**95... 升级为至尊VIP

 wei**n_... 升级为至尊VIP  wei**n_... 升级为高级VIP

 wei**n_... 升级为至尊VIP 微**... 升级为至尊VIP  

 139**01... 升级为高级VIP  136**15...  升级为至尊VIP

jia**ia...  升级为至尊VIP  wei**n_... 升级为至尊VIP 

 183**14... 升级为标准VIP  wei**n_... 升级为至尊VIP 

微**... 升级为高级VIP  wei**n_...  升级为至尊VIP

 Be**en 升级为至尊VIP  微**... 升级为高级VIP 

186**86... 升级为高级VIP  Ji**n方...  升级为至尊VIP

188**48... 升级为标准VIP  wei**n_...  升级为高级VIP 

 iam**in... 升级为至尊VIP wei**n_...  升级为标准VIP

 135**70... 升级为至尊VIP  199**28... 升级为高级VIP

wei**n_...  升级为至尊VIP wei**n_... 升级为标准VIP

wei**n_... 升级为至尊VIP  火星**r... 升级为至尊VIP 

 139**13... 升级为至尊VIP   186**69... 升级为高级VIP

157**87...  升级为至尊VIP  鸿**... 升级为至尊VIP

 wei**n_...  升级为标准VIP   137**18... 升级为至尊VIP

 wei**n_... 升级为至尊VIP wei**n_...  升级为标准VIP

139**24...   升级为标准VIP 158**25... 升级为标准VIP 

 wei**n_...  升级为高级VIP 188**60...   升级为高级VIP

Fly**g ...  升级为至尊VIP wei**n_...  升级为标准VIP 

 186**52...  升级为至尊VIP 布** 升级为至尊VIP 

 186**69...  升级为高级VIP wei**n_...  升级为标准VIP 

139**98...  升级为至尊VIP  152**90... 升级为标准VIP 

 138**98... 升级为标准VIP  181**96... 升级为标准VIP

185**10... 升级为标准VIP  wei**n_... 升级为至尊VIP

高兴  升级为至尊VIP  wei**n_...  升级为高级VIP 

wei**n_... 升级为高级VIP 阿**... 升级为标准VIP

wei**n_... 升级为高级VIP     lin**fe... 升级为高级VIP

wei**n_...  升级为标准VIP  wei**n_... 升级为高级VIP

wei**n_...  升级为标准VIP  wei**n_...  升级为高级VIP 

 wei**n_... 升级为高级VIP  wei**n_... 升级为至尊VIP

 wei**n_... 升级为高级VIP  wei**n_... 升级为高级VIP 

180**21...  升级为标准VIP 183**36... 升级为标准VIP  

 wei**n_... 升级为标准VIP  wei**n_...  升级为标准VIP

xie**.g... 升级为至尊VIP   王** 升级为标准VIP 

 172**75... 升级为标准VIP  wei**n_... 升级为标准VIP

wei**n_... 升级为标准VIP wei**n_...   升级为高级VIP

135**82...  升级为至尊VIP  130**18...  升级为至尊VIP

 wei**n_... 升级为标准VIP  wei**n_...  升级为至尊VIP

wei**n_... 升级为高级VIP   130**88... 升级为标准VIP

张川  升级为标准VIP wei**n_... 升级为高级VIP 

叶** 升级为标准VIP   wei**n_... 升级为高级VIP

138**78...  升级为标准VIP wu**i   升级为高级VIP

wei**n_... 升级为高级VIP  wei**n_... 升级为标准VIP 

 wei**n_... 升级为高级VIP 185**35... 升级为至尊VIP 

wei**n_... 升级为标准VIP   186**30...  升级为至尊VIP