上海品茶

您的当前位置:上海品茶 > 报告分类 > PDF报告下载

6GANA:6G网络内生AI网络架构十问(56页).pdf

编号:120257 PDF  ;DOCX 56页 3.46MB 下载积分:VIP专享
下载报告请您先登录!

6GANA:6G网络内生AI网络架构十问(56页).pdf

1、 2 目录 文档作者列表.5 前言.6 概述.7 1.问题一:为什么需要 AI 用例自生成?.9 1.1 技术特征内涵.9 1.2 必要性分析.10 1.3 可行性分析.10 1.4 对网络架构的影响.11 1.5 本章小结.12 2.问题二:为什么需要 QOAIS?.13 2.1 技术特征内涵.13 2.2 必要性分析.13 2.3 可行性分析.14 2.4 对网络架构的影响.16 2.5 本章小结.16 3.问题三:如何支持 AI 生命周期管理?.17 3.1 技术特征内涵.17 3.2 必要性分析.18 3.3 可行性分析.18 3.4 对网络架构的影响.19 3.5 本章小结.19 4

2、.问题四:是否以任务为中心?.20 4.1 技术特征内涵.20 3 4.2 必要性分析.20 4.3 可行性分析.20 4.4 对网络架构的影响.22 4.5 本章小结.22 5.问题五:如何支持算网融合?.23 5.1 技术特征内涵.23 5.2 必要性分析.23 5.3 可行性分析.24 5.4 对网络架构的影响.24 5.5 本章小结.26 6.问题六:为什么需要自生长的数据服务?.27 6.1 技术特征内涵.27 6.2 必要性分析.27 6.3 可行性分析.28 6.4 对网络架构的影响.29 6.5 本章小结.30 7.问题七:为什么需要自生长和可信的算法?.32 7.1 技术特征

3、内涵.32 7.2 必要性分析.32 7.3 可行性分析.33 7.4 对网络架构的影响.34 7.5 本章小结.35 8.问题八:如何理解分布式 AI 架构?.36 8.1 技术特征内涵.36 4 8.2 必要性分析.36 8.3 可行性分析.36 8.4 对网络架构的影响.37 8.5 本章小结.39 9.问题九:分布式 AI 架构中不同节点如何协同?.40 9.1 技术特征内涵.40 9.2 必要性分析.40 9.3 可行性分析.41 9.4 对网络架构的影响.41 9.5 本章小结.43 10.问题十:可以对外开放哪些 AI 能力?.45 10.1 技术特征内涵.45 10.2 必要性

4、分析.45 10.3 可行性分析.47 10.4 对网络架构的影响.48 10.5 本章小结.49 11.总结.50 参考文档.51 缩略语.53 附录.55 5 文档作者列表 贡献者 单位 邓娟、郑青碧、冷昀橘、李刚、温子睿 中国移动 王栋、李鹏宇、于梦晗、邢燕霞 中国电信 艾明,孙万飞、舒敏 中信科移动 李娜 爱立信 杨春刚 西安电子科技大学 赵燕、王达 亚信科技(中国)有限公司 彭程晖、王君、王飞、刘哲 华为技术有限公司 张凯宾、温海波、沈钢、陈端 上海诺基亚贝尔 袁雁南 维沃移动通信有限公司 吴连涛、杨旸、李凯 上海科技大学 薛妍、谢峰、杨立 中兴通讯股份有限公司 周凡钦、丰雷 北京邮

5、电大学 徐勇军 重庆邮电大学 杨婷婷 大连海事大学 冯钢、秦爽 电子科技大学 许阳 OPPO 6 前言 人工智能(Artificial Intelligence)在最近十年发展迅猛,在挖掘大数据样本的非线性规律,与环境交互的在线精准决策等领域快速超越了以人工为主的专家经验(Human Intelligence)模式,在计算机视觉、自然语言处理、机器人控制等领域取得了巨大的成功。一方面由于以深度学习、强化学习等为代表的人工智能算法能力的突破;另一方面以 GPU 为代表的人工智能算力成本的快速下降和普及,在未来的十年的市场占有率有可能会超越 CPU,也加速了这一趋势。随着 ICT(Informat

6、ion and Communications Technology)技术的不断融合,网络正朝向深度 IT 化方向发展。在 5G 网络的演进过程中,AI 技术开始应用在无线网络信道估计,基站节能减排1和网络运维等领域。应用方式主要还是以云端智能为主,在云端汇聚大量的数据,利用集中的算力对数据进行预处理,AI 模型训练和验证等。但是在网络中传输大量的原始数据,一方面对传输带宽压力大,另一方面对于数据隐私保护也会带来很大的挑战。3GPP 定义了 NWDAF 支持网络数据的收集和处理,有利于在网络架构中引入 AI 相关的功能。然而当前的网络和 AI 技术的结合仍处于初级阶段。AI 叠加在网络之上,AI

7、 在网络中发挥的作用散落在网络不同的功能点,其主要目标是利用 AI 提升网络的性能,运营和价值。未来 6G 网络的作用之一是基于无处不在的大数据,将 AI 的能力赋予各个领域的应用,创造一个“智能泛在”的世界。6G 应在 5G 基础上全面支持整个世界的数字化,网络要助力千行百业的数智化转型,需要满足和提供相比云端智能实时性更高,综合能耗和安全隐私更优的智能化服务2。同时,网络运营维护也需要从局部的智能化运维向高水平的网络自治演进。这些都迫切要求网络与 AI 技术更紧密的结合,将 AI 能力通过网络架构的革新深度内化到网络中。为此,6G 网络提出了“智慧内生”的基本特征构想,即 6G 网络将在设

8、计之初就考虑与人工智能技术融合的理念,将 AI 和大数据的应用融入网络的基因当中,形成一个端到端的体系架构,根据不同的应用场景需求,按需提供 AI 能力和服务。通过在 6G 网络架构的设计中充分考虑 AI 的算法,算力和数据以及网络连接等诸多要素,6G 将成为融合连接和算力的新型基础设施,从而极大提高 AI 资源的使用效率并使 AIaaS(AI as a Service)成为可能,AI 能力在网络中无处不在、无孔不入,并像人体的大脑和神经网络一样,以分布式或集中的方式随时随地按需提供给网络自身及第三方,实现智慧的泛在可得、全面赋能万事万物。中国移动邓娟、上海诺基亚贝尔陈端、重庆邮电大学徐勇军

9、7 概述 6GANA TG2 是 6GANA 下负责研究基础网络架构的工作组,其将识别 6G 网络内生 AI 的基本技术特征,研究其对 6G 网络架构的影响,对标准化的影响,构建 6G 网络内生 AI 整体框架,定义基础架构,并对涉及的关键使能技术进行探讨。面向该目标,TG2 成员单位经过全面收集和充分探讨,凝练出现阶段业界广泛关注的、对 6G 网络架构存在潜在影响的十大核心技术问题。针对每项问题,从特征内涵、必要性、可行性、对网络架构的影响等四个方面展开分析,研究该问题所示技术特征是否6G 网络内生 AI 架构所需,并给出了 TG2 的观点和建议。这十个问题分别是:一、为什么需要 AI 用例

10、自生成?二、为什么需要 QoAIS?三、如何支持 AI 生命周期管理?四、是否以任务为中心?五、如何支持算网融合?六、为什么需要自生长的数据服务?七、为什么需要自生长和可信的算法?八、如何理解分布式 AI 架构?九、分布式 AI 架构中不同节点如何协同?十、可以对外开放哪些 AI 能力?十个问题间的逻辑关系如下图所示:承接 TG1 对需求和应用场景的研究,面向不同行业和场景对 6G 网络内生 AI 千差万别的需求,TG2 提出的第一个问题即是:如何去表达和导入用户对 6G 网络 AI 服务的需求?AI 用例(需求表达形式)的自生成(一种导入方式)为什么会成为 6G 网络支持的技术特征?进一步地

11、,在服务需求的基础上,如何去分析和映射到网络可以理解的 AI 服务的质量需求?针对这一问题,TG2 提出 QoAIS(Quality of AI Service)AI 服务质量的概念,并给出一种供参考的指标体系设计。作为 AI 服务的提供者,网络如何评估和持续地满足用户的上述需求,实施 QoAIS 保障,则需要从网络 AI 的管理、控制、业务流等多个层面展开思考。需求导入质量评估保障算力数据算法连接底层资源计算存储通信对外能力开放AIAI工作流工作流3 3集中式集中式AI超脑超脑分布式分布式AI 边脑边脑问题一问题二、三问题四问题五问题六问题七问题八问题九问题十AIAI工作流工作流1 1AIA

12、I工作流工作流2 2AIAI工作流工作流4 4网络执行 8 问题三从网络 AI 的管理角度提出如何通过对 AI 生命周期的管理来自动化的实现 AI 应用的开发、部署和相关的模型管理,来实现 QoAIS 的保障?问题四则是从多维资源融合的角度,提出是否以任务为中心,协同控制网络 AI 所需四种资源要素(即算法、算力、数据、连接),以实时的、持续的满足用户对 QoAIS 服务质量要求。由于算法、算力和数据将同传统连接一样,成为网络中可管控的新资源维度,资源的异质性及挑战和需求的差异性使得它们在网络架构的设计中呈现出不同的技术特征,需进一步展开研究:问题五从算力维度,提出如何深度融合算力和连接资源以

13、实现更高效能的 AI 任务?问题六从数据维度,提出为什么需要通过内生 AI 改善当前数据价值密度低,存取效率低等问题,实现按需动态的数据编排和配置,反哺于内生 AI 的数据服务;问题七从 AI 算法维度,针对当前 AI 领域面临的两大挑战:AI 算法对大数据的过度依赖和 AI 算法的可信?提出为什么可通过基于模型的计算实现 AI 算法的自我进化,以及如何提供可信的 AI 算法?在上述资源的部署架构方面,6G 将呈现集中式和分布式相结合的特点。集中式资源下的 AI 能力供应在 5G 网络中已有较多的实践,因此问题八和九提出 6G 如何理解分布式 AI 架构,体现在哪些方面,以及不同节点间如何协同

14、的问题。最后,从资源对外开放的角度,问题十提出 6G 网络中上述资源可包装成哪些特定的能力向第三方开放。本白皮书的最后一章总结了现阶段 6G 网络内生 AI 架构需具备的重要技术特征,对下一步工作进行了展望,并呼吁业界聚焦到关键技术问题的深入探讨和研究上。在本版本的编制过程中,TG2 成员单位经过多次开放性技术探讨,对于 6G 网络内生 AI 的需求、概念和内涵已逐渐达成共识,对上述技术特征的重要度尚无统一意见,在对网络架构的影响方面仍需深入全面的分析。在 6G 网络内生 AI 研究伊始,希望本白皮书版本能成为 AI 技术专家和 6G 网络专家紧密合作的契机,共同助力构建“智慧泛在”的未来社会

15、!中国移动邓娟 9 1.问题一:为什么需要 AI 用例自生成?1.1 技术特征内涵 AI 用例自生成:网络自身根据数据分析推演或外部导入,生成关于 AI 用例描述的过程。通过 AI 用例的管理将 AI 用例部署到网络中,网络根据 AI 用例的描述按需调配网络元素(包括数据、算法、算力、连接等)以满足该用例的性能需求。AI 用例:AI 用例是用户在智能应用场景下向网络提出的一次 AI 服务请求,一个 AI 用例可能涉及到一类或多类网络内生 AI 服务(如 AI 训练、验证和推理服务)的调用。如下示例为一个 AI 用例涉及单一类型服务和涉及多种类型服务的情况:-单一类型服务:AI 数据服务 或 模

16、型训练服务 或 模型验证服务 或 模型推理服务-多种类型服务:AI 数据服务 和 模型训练服务 智能应用场景:指应用 AI 用例所生成的智能的场景,一个智能应用场景下可能需实施一个或多个AI 用例才能达到智能化目标。智能应用场景例如网络自治类场景、行业类场景、未来数据推演出的新场景等3。以网络自治中的智能应用场景举例说明智能应用场景与 AI 用例之间的关系:如网络通过 KPI(Key Performance Indicator)指标监测发现某 CBD(Central Business District)区域语音切换成功率普遍较差,需要进行智能化提升。智能应用场景为提升该 CBD 区域内所有小区

17、的切换成功率,智能化目标为该 CBD 区域内所有小区的切换成功率达到目标值。网络通过智能分析,诊断出影响该区域切换成功率的因素有部分小区的 SSB 波束覆盖不佳、部分小区的邻区配置不准确、部分小区的切换测量参数配置值不佳等三个原因,从而生成此智能应用场景下的三个 AI 用例:AI 用例一:优化部分小区的 SSB 波束覆盖 AI 用例二:优化部分小区的邻区配置 AI 用例三:优化部分小区的切换测量参数值 AI 用例描述:AI 用例描述承载了与 AI 用例相关的信息,这些信息是网络为了满足用户提出的 AI服务请求,在实操层面需获知的框架性或辅助性信息。从描述中,网络可获知在智能应用场景、输入输出数

18、据、模型选择、模型训练、模型验证优化、以及实施模型输出的结论/决策等方面的信息。“可行性分析”部分给出了针对上述 AI 用例一的一种描述方式。AI 用例管理:AI 用例生成后,针对不同智能应用场景,按需管理和智能部署 AI 用例。10 1.2 必要性分析 面向网络智能自治,采用人工发现问题并使用 AI 解决问题,始终受到人工认知的局限性,网络的智能化能力和网络功能性能潜力也将无法最大化激发4;同时,依赖人工的烟囱式解决问题的方式,往往在不同优化用例之间产生优化效果的冲突,如某小区覆盖性能的提升导致周边小区干扰的抬升和业务体验指标的下降,由此导致往复低效的优化工作;面向网络全场景,网络架构及网络

19、功能、服务等网络元素需求将千差万别,基于配置的方式将无法最大化的满足和适应网络全场景对网络和服务的差异需求5;面向未来未知的新行业和新需求,由人工发现和总结未来的需求更不现实,更需要基于网络内生 AI 的方式,智能化地生成和调度实施 AI 用例,避免 AI 用例之间的冲突,保证叠加效果最优。因此,基于 AI 用例自生成的智能内生网络,才能体现智能网络的特征和优势、展现差异化服务的巨大适应能力以及使能网络自身具备智慧。综上描述和分析,AI 用例自生成需要作为 6G 网络内生 AI 的技术特征之一。1.3 可行性分析 以上述 AI 用例一:优化部分小区的 SSB 波束覆盖为例,一个 AI 用例描述

20、可包括如下内容:1)智能的实施范围:包括时空范围,此例为待优化小区 ID(Identify)。2)智能的实施对象:智能输出的结论应用的对象。此例中为待优化小区的大规模天线 SSB 波束。3)智能的问题类型:此例中为决策优化问题,网络据此选择对应的算法进行智能模型的训练。4)智能模型的输入和输出数据模板:智能模型输出的数据元素模板和智能模型训练所需的所有数据元素模板。此列中输入数据为用户位置分布数据,输出数据为待优化小区的 SSB 波束权值,奖励变量为小区覆盖性能指标数据。5)智能模型的结构信息和参数值:可选内容,智能模型的结构可以是在 AI 用例中明确定义好,或由网络选择。此例中可以是强化学习

21、相关算法模型。6)智能模型的验证集/场景需求:对于验证集需求,可以包含对训练集和验证集数据量的比例要求、验证集中样本的分布要求或某些必须包括的样本要求等;对于验证场景,可以包含对验证场景的数字孪生的需求67。此例中验证样本可以是某些特定的用户位置分布,验证场景包括用户位置分布、周边地理环境、基站配置参数等。7)QoAIS 要求(Quality of AI Service):一个 AI 用例的完成可能涉及到多种 AI 服务的调用,每种 AI 服务都有对应的服务质量评价和保障指标,包括 AI 服务的性能指标8、开销指标、安全性、隐私性、自动化、可控度等要求,关于 QoAIS 和 AI 服务的具体介

22、绍参见第二章 QoAIS 的定义及指标体系。11 需要说明的是,上述描述是针对一个包含训练、验证和推理服务的 AI 用例,若 AI 用例仅需做模型验证或模型推理,则对应的 AI 用例的描述仅包括上述部分元素。AI 用例生成的方式有两种:一种是网络基于数据分析推演的方法生成,另一种是通过对外接口导入 AI 用例描述。通过数据分析推演生成 AI 用例的方式,可基于网络元数据实现内生意图精确推理与语义模型自动构建;也可以利用知识图谱技术,通过构建和持续更新网络 KPI 和可优化配置参数之间的关联关系,生成 AI 用例的输入输出数据模板。通过对外接口导入 AI 用例的方式,除了人工进行参数配置外,还可

23、基于自然语音处理模型,将用户通过语音输入的 AI 用例生成需求,进而实现 AI 用例自生成。从用例的描述方式上,网络生成的 AI 用例描述可标准化,但由外部导入的 AI 用例描述可能因导入方持有的信息或意愿不同而难于统一要求,因此,可初步分为“面向用户的描述方式”和“面向网络的描述方式”:前者用于第三方或普通用户描述和导入 AI 用例,后者用于研发人员或网络自身根据标准化的描述模板导入或生成 AI 用例。两者之间可能需要转译。1.4 对网络架构的影响 对于网络自治场景下,AI 用例由网络自生成的情况,网络 AI 用例生成所需的数据可能跨越多个域,需要设计高效的网络架构以支持 AI 用例生成对数

24、据采集、存储、传输等方面的性能需求。比如:-AI 用例在网络运维系统中自生成。基于 KPI 历史监控指标数据、KPI 指标之间以及 KPI 指标与网内各类数据元素间的关联度知识图谱,生成 AI 用例描述。该场景下,主要功能逻辑在运维管理系统内,网络架构需要考虑支持数据知识图谱的构建、存储和更新。-AI 用例在网元中自生成。网元的数字孪生体是网元实时状态在数字域的拟真,其包含网元内部组件拓扑和数据元素间的关联度知识图谱。当网元性能恶化时,触发此场景下的 AI 用例。该场景下,网络架构需要考虑支持网元内、域内和跨域多层级的集中式和分布式数字孪生体之间的交互与协同,控制面如何支持需要进一步研究。面向

25、网络全场景的 AI 用例自生成,网络架构需要能够灵活拆分组合以及自生成,网络功能需要能够按需组合。除此之外,网络功能与服务的划分颗粒度等,在架构设计中需要研究。AI 用例自生成除了在网络架构的研究方面需要开展上述工作外,在今后的标准化工作和产业生态的影响分析中,也需要开展如下工作:在标准化方面,需要进行面向网络的 AI 用例描述模板标准化的研究。在产业和生态的影响方面,需要在如下几个方面进行影响分析:AI 用例自生成的优势在于网络强大的数据关联度分析优势,可跨层级、跨域分析,由此生成的 AI 用例描述比人通过专家知识构造的用例更准确高效。因此,构建能支持网络数据关联度分析能力的网 12 络架构

26、尤其重要。若最终分析认为通过标准化手段无法保证跨层级跨域的数据关联和协同性能,那么可能导致在一片区域内所有网元网管设备均为同一供应商。对于用户导入 AI 用例的场景,由于对用户描述语言的规范化难度较大(用户背景广泛,对新鲜事物的接受能力参差不齐),可能会催生从用户描述语言到机器可理解的 AI 用例描述语言间的转译工具/软件的供应商。比如,该转译工具能面向不同的背景的用户提供不用的用户描述界面,或通过交互式流程提示用户需要输入哪些必选信息和可选信息等。1.5 本章小结 1.5.1 观点 6G 智能内生网络将具有为全场景提供最佳适配的强大适应能力。面对千差万别的巨大差异和细微不同的微小差别,借助内

27、生 AI,6G 网络通过网络自生成或对外接口导入的方式,基于 AI用例描述模板,将场景的 AI 需求精准的用例化。通过 AI 用例管理,6G 智能内生网络对场景所需的资源,进行精准适配和全局最优的调度。因此,6G 内生网络 AI 架构需要 AI 用例自生成。1.5.2 建议 建议基于 TG1 广泛收集各类智能应用场景需求,进一步研究完善智能应用场景与 AI 用例的关系、AI 用例的描述模板。建议 TG3 研究可支持 AI 用例自生成的数据采集、存储、治理、传输等数据面架构。建议 TG4 研究可支持 AI 用例自生成的智能算法。中信科移动孙万飞、艾明、中国移动邓娟、冷昀橘 爱立信李娜、中国电信王

28、栋、西安电子科技大学杨春刚 13 2.问题二:为什么需要 QOAIS?2.1 技术特征内涵 QoAIS(Quality of AI Service)是评估和保障网络内生 AI 服务质量的指标体系和流程机制。一个 AI 服务对应一套 QoAIS 指标,一个 AI 用例对应的 QoAIS 指标由其包含的所有 AI 服务对应的QoAIS 指标组合构成。不同 AI 服务的 QoAIS 指标构成可能存在共通的指标部分,也可能存在与服务特性相关的特殊指标部分。AI 用例、AI 服务和 QoAIS 之间的逻辑关系见下图 2-1。QoAIS 是网络内生 AI 编排管理系统和控制功能的重要输入,管理编排系统需要

29、对顶层的 QoAIS进行分解,再映射到对数据、算法、算力、连接等各方面的 QoS 要求上,通过管理面、控制面和用户面相关机制设计获得持续保障。QoAIS 获知的方式有两种:一种是外部导入,比如在外部导入 AI 用例描述的同时,即包含 QoAIS 要求;一种是内部生成,比如对于网络根据上层意图信息生成 AI 用例的场景,网络也可以根据意图信息同时生成 QoAIS 的指标要求。图 2-1:AI 用例、AI 服务、QoAIS 和 AI 工作流间的逻辑关系图示例7 2.2 必要性分析 6G 网络将不再只是服务于传统通信业务的管道,6G 网络将构建内生于网络的 AI 能力,形成一套可服务于多种智能应用场

30、景的能力体系,即 AIaaS。考虑到不同的智能应用场景(如网络高水平自治,行业用户智能普惠,用户极致业务体验,网络内生安全等)对 AI 服务的质量将有着不同的需求,因此需要一套指标体系通过量化或分级的方式表达用户层面的需求以及网络编排控制 AI 各要素(包括算法、算力、数据、连接等)的综合效果。在具体指标体系设计上,传统通信网络的 QoS 主要考虑通信业务的时延和吞吐率(MBR、GBR等)等与连接相关的性能指标9。6G 网络除了传统通信资源外,还将引入分布式异构算力资源、存储资源、数据资源、AI 算法等 AI 服务编排的多种资源元素,因而需要从连接、算力、算法、数据等多个维度来综合评估网络内生

31、 AI 的服务质量。同时,随着“碳中和”和“碳达峰”政策的实施、全球智能应用行业对数据安全性和隐私性关注程度的普遍加强,以及用户对网络自治能力需求的提升,未AI 用例描述 QoAIS AI 训练服务 AI 数据服务 AI 验证服务 QoAIS QoAIS AI 工作流 1 AI 工作流 2 AI 工作流 3 AI 工作流 4 生成 AI 用例 生成 AI 服务及 QoAIS 要求 生成 AI 工作流和任务 任务 AI 用例描述 AI 服务 QoAIS 14 来性能相关指标将不再是用户关注的唯一指标,安全、隐私、自治和资源开销方面的需求将逐渐深化,成为评估服务质量的新维度,而不同行业和场景在这些

32、新维度上的具体需求也将千差万别,需要进行量化或分级评估。因此,QoAIS 指标体系从初始设计时,即需要考虑涵盖性能、开销、安全、隐私和自治等多个方面,需从内容上进行扩展。在质量评估和保障机制上,5G 网络的 QoS 机制仍存在一些问题,如业务区分颗粒度较粗,优化调整的周期较长,空口资源配置无法灵活适配网络与业务的实时动态变化等。因此在 6G 网络中提出评估 AI 服务的 QoAIS 指标的同时,也需要考虑如何设计端到端 QoAIS 机制和流程以更加高效准确。2.3 可行性分析 6G 网络内生的 AI 服务可以分为 AI 数据类、AI 训练类、AI 推理类和 AI 验证类。表 2-1 提供了一种

33、针对 AI 训练服务的设计方式。表 2-1:AI 训练服务的 QoAIS 指标体系 AI 服务类型 指标维度 QoAIS 指标 AI 训练 性能 性能指标界、训练耗时、泛化性、可重用性、鲁棒性、可解释性、损失函数与优化目标的一致性、公平性 开销*存储开销、计算开销、传输开销、能耗 安全*存储安全、计算安全、传输安全 隐私*数据隐私等级、算法隐私等级 自治 完全自治、部分人工可控、全部人工可控 注*:不同类型 AI 服务间相同的评估指标 除了上表所示的评估维度,QoAIS 也可以包括智能应用的性能指标。以信道压缩为例10,可以选择归一化均方误差(Normalized mean square er

34、ror,NMSE)或是余弦相似度作为信道恢复精度的 KPI,也可以选择链路级/系统级指标(如误比特率或吞吐量等)作为反映信道反馈精度对系统性能影响的 KPI。此外,QoAIS 还可以包括 AI 服务的可获得性、AI 服务的响应时间(从用户发起请求到AI 服务的首条响应消息)等与 AI 服务类型无关的通用性评价指标。15 图 2-2:QoAIS 指标分解到各资源维度上的 QoS 指标 上图 2-2 展示了 QoAIS 各指标维度和各资源维度上的 QoS 之间的映射关系。AI 服务的 QoAIS整体指标拆解到各指标维度上的 QoAIS 指标,再进一步映射到各资源维度上的 QoS 指标,由管理面、各

35、资源维度的控制面和用户面机制进行保障。图中各资源维度上 QoS 指标可分为适合量化评估的指标(如各类资源开销)和适合分级评估的指标(如安全等级、隐私等级和自治等级)。在前一类指标中,有部分指标的量化方案已成熟或较容易制定(如训练耗时、算法性能界、计算精度、各类资源开销等),部分指标目前尚无定量评估方法(如模型的鲁棒性、可重用性、泛化性和可解释性等),如表 2-2 所示。因此,如何在起始阶段设计出足够开放包容的网络架构以便后续逐步引入上述指标的成熟量化技术是需要思考和研究的问题。表 2-2:AI 训练服务性能 QoAIS 到各资源维度的映射 指标维度 QoAIS 指标 资源维度 可量化 QoS

36、指标 尚无量化方案 QoS 指标 性能 性能指标界、训练耗时、泛化性、可重用性、鲁棒性、可解释性、优化目标匹配度、公平性 数据 特征冗余度、完整度、数据准确度、数据准备耗时 样本空间平衡性、完整性、样本分布动态性 算法 性能指标界、训练耗时、是否收敛、优化目标匹配度 鲁棒性、可重用性、泛化性、可解释性、公平性 算力 计算精度、时长、效率 连接 带宽及抖动、时延及抖动、误码率及抖动、可靠性等 16 2.4 对网络架构的影响 由于 QoAIS 指标体系中增加了新的指标维度,且涉及到多种资源维度,如何将面向用户需求的QoAIS 指标映射到网络各资源面上的 QoS 指标,并通过在管理面、控制面和用户面

37、上设计新的机制进行保障是网络架构设计需要考虑的问题。具体需要考虑如下几个方面:1.目前考虑 QoAIS 需求的生成有两种方式:网络自生成和外部导入。需研究每种方式在管理面实现和在控制面实现的可能性,及对网络架构的影响 2.对于在管理面生成的 QoAIS 指标需求,其向各维度资源 QoS 指标的映射机制,以及管理面如何与控制面进行机制协同以保障 QoAIS 达成 3.对于控制面生成的 QoAIS 指标需求,是否需要管理面进行协同保障,如何设计相关机制?2.5 本章小结 2.5.1 观点 6G 时代将出现各种新型智能应用场景,不同场景对 QoAIS 的需求不同,需要一套指标体系通过量化或分级的方式

38、表达用户的需求;6G 网络除了传统通信资源外,还将引入分布式算力、数据、算法等多维资源,需要从多个维度综合评估网络内生 AI 的服务质量。因此我们认为 6G 内生 AI 需要构建一套适用于网络内生 AI 服务的质量评价指标和保障机制,即 QoAIS(可区分为 QoAIS 指标体系和QoAIS 保障机制)。QoAIS 指标体系需考虑性能、开销、安全、隐私和自治五个指标维度,由指标维度映射到连接、数据、算力和算法等资源维度上的 QoS 上。2.5.2 建议 网络在引入 AI 服务后,用户对 AI 服务安全性和隐私性上存在不同的需求选项,如何打破传统通信服务中 QoS 体系和安全体系分开独立设计的模

39、式,使这种需求的差异性得到更好的满足?当前,部分 QoAIS 指标尚无成熟的量化评估方式(如模型的泛化性、可解释性、可重用性),建议 TG4 开展相关研究,建议 TG2 后续研究:如何在起始阶段设计出足够开放包容的网络架构以便后续逐步引入上述指标的成熟量化技术?中国移动邓娟、冷昀橘 17 3.问题三:如何支持 AI 生命周期管理?3.1 技术特征内涵 1.AI 生命周期是以一种针对特定应用程序开发、部署和管理机器学习模型的过程1112。6G 内生AI 要求自动化 AI 的生命周期管理。机器学习的生命周期包括:-基于业务目标出发构建机器学习问题(场景,QoAIS,KPI,监控需求)。-收集数据、

40、准备数据,包括特征工程、清理等任务。-分析、训练、测试和评估模型,构建和自动化机器学习管道。-部署模型。静态部署或动态部署。-模型应用,如预测和推断。-监控、优化和维护模型。AI 生命周期管理流程如图所示:图 3-1:AI 生命周期管理流程 2.自动化 AI 的生命周期要求在其管理流程中支持持续构建、交付、部署的能力。由于 AI 技术的局限性,如数据质量变化,模型衰减,数据局部性等问题,要求模型能够持续迭代。对于不同的 AI 服务,需要支持不同的 QoAIS,以及基于任务的管道和资源编排。通过在 AI 生命周期管理所有步骤中实现自动化和监控,并建立模型持续优化和改进流程,使能全场景自动闭环,自

41、诊断,自修复和自优化,将促使网络向 L5 级“自动驾驶”网络的自治管理模式演进。18 3.2 必要性分析 6G“原生”AI 旨在随时随地的提供 AI 服务,并通过持续迭代优化,不断提升系统性能和用户体验。实现深度融合 AI 和智能化无处不在的 6G 网络,要求相应的算法、数据、可编程能力集成到 6G系统架构,并且构建和管理可重现,可测试和可持续的 AI 能力。6G 网络可能是由分布式的具有内生 AI 能力的功能节点组成,为智能业务提供原生支持或者支持AI 业务的自演进,要求自动化构建和管理 AI 生命周期,使 AI 能力更加快捷,频繁,可靠地在系统中迭代。3.3 可行性分析 6G 网络管理架构

42、将实现以闭环自动化为基本特征的自治网络运营管理架构,在 AI 的生命周期管理中通过支持持续集成(CI)、持续交付(CD)和持续训练(CT)的 ML(Machine Learning)管道,可以构建自动化的 AI 的生命周期闭环管理流程,并持续改善工作流各节点的业务质量。下图提供了一种端到端自动化管道和 AI 生命周期管理示例。图 3-2:端到端自动化管道和 AI 生命周期管理 这些关键组件可实现的功能包括:1)可重现性 ML 管道。为数据准备、训练、评估验证过程定义可重复可复用的步骤。2)可重性集成环境。用于训练和部署模型,跟踪使用模型时所需的网络资源模型,支持模型的注册、打包和部署等操作。3

43、)端到端 ML 生命周期的数据感知。如版本,发布者、更新原因等配置参数,以及运行态模型相关性能指标。19 4)告警管理和可观测的监控。针对 ML 生命周期中的事件发出通知和警报,例如,模型注册、模型部署、模型测试和数据偏移检测等。持续监控模型在运行中的预测性能,监控数据治理、质量和合规性。此外,开放网络自动化平台 ONAP(Open Network Automation Platform)1314提供了一种统一的编排、管理和自动化的开源操作框架,通过策略驱动设计、实施、分析和生命周期管理实现AI 大规模负载和服务。通过 ONAP 和 3GPP 系统接口开放和协作,网络运营商可以实时动态编排物理

44、和虚拟网络功能以满足 AI 需求。与此同时,ONAP 的开放性和全球主要网络供应商的普遍接受加速了网络功能虚拟化生态系统的发展,进而支持网络内生 AI 能力增强。3.4 对网络架构的影响 1)统一 AI 生命周期管理与数据和算力的调度编排;2)支持以工作流和任务为中心的编排机制和 ML 管道机制;3)支持 ML 模型管理架构的集中式,分布式和混合式部署。对于实时 AI 服务,支持控制面和管理面融合;3.5 本章小结 3.5.1 观点 6G 内生 AI 网络架构需考虑如何将 AI 生命周期管理以及 ML 管道自动编排技术相结合,并且在基于以任务为中心的架构下,来构建 6G 内生 AI 网络的使能

45、技术。3.5.2 建议 开展 AI 生命周期相关方案的研究,包括 1)AI 生命周期定义、管理接口以及网络资源模型定义;2)支持以工作流和任务为中心的自动化编排机制和 ML 管道机制;3)如何实现 AI 算力、算法、数据的管理编排以及与控制面的融合;4)支持 AI 能力开放接口,与 ONAP 等开源平台接口标准化。中信科移动舒敏、艾明、中国电信王栋 亚信科技(中国)有限公司王达 西安电子科技大学杨春刚 20 4.问题四:是否以任务为中心?4.1 技术特征内涵 针对网络自用 AI 或第三方的 AI 用例,6G 内生 AI 网络可以提供所需的计算、算法、连接、数据的协同和调配等融合服务,在这个过程

46、中,将引入如下基础概念:1)任务:协同计算、算法、连接和数据完成某个特定的目标,该目标来源于 AI 用例,可以是一个或多个 AI 训练或 AI 推理。AI 用例到任务的映射过程可以是灵活的,如在问题二中描述,AI 用例可以先分解为一个或多个 AI 服务,AI 服务可以进一步分解为一个或多个 AI 工作流,而 AI 工作流可进一步分解为一个或多个任务。2)任务为中心:任务为中心是指以任务为管控对象,支持任务的生命周期管控,通过计算、算法、连接、数据的协同和调配等来保障任务的 QoS、确保任务的顺利执行等。其中,任务的 QoS 来源于 AI 服务的 QoAIS 分解和映射,与 AI 用例到任务的具

47、体映射相关。4.2 必要性分析 传统通信系统是以会话为中心的设计,提供了完整的会话生命周期管理机制(如,E2E 隧道的创建、修改、删除、锚点迁移等流程);6G 原生支持网络 AI,涉及到多节点场景下的多算力、多连接、多算法、多数据的协同来完成某个特定的目标,因此网络需要针对这样的变化,设计以任务为中心的完整生命周期管理机制,来保障任务的顺利执行和 QoAIS 保障。4.3 可行性分析 1)前提假设:a)6G 网元、终端等都具有内生算力,并参与到 AI 任务中。b)6G 网络为分布式的算力和 AI 系统。2)应用场景:网络 AI 业务以任务的形式在 6G 网络内执行。3)设计目标:任务的生命周期

48、管理(如,算力、算法、数据、连接等资源的编管控)、任务 QoS 生成及保障(如,通过 AI 服务 QoAIS 映射到任务 QoS,以及任务执行过程中的实时的任务 QoS 保障)。4)方案设计:为了达成上述设计目标,设计任务为中心架构,其中,引入任务控制和任务执行两个逻辑功能。21 a)任务控制:在接受任务源(如,服务编排)提供的请求后,任务控制负责对整个任务的生命周期管控,包括调控资源四要素(算力、算法、数据、连接)来进行任务的 QoS 保障。b)任务执行:接受任务控制分配的任务后、负责任务的执行及执行结果上报。c)任务控制与任务源的接口:任务源(如,服务编排)提供 AIaaS 服务。在任务源

49、接受服务请求后,调用对应的 AI 服务、并产生对应的 QoAIS 参数;随后任务源通过与任务控制之间的接口,将任务控制的输入(如,工作流)和 QoAIS、传递给任务控制。图 4-1:任务为中心框架图 任务控制接受任务源(如,服务编排)请求后、将业务需求(如,工作流)分解为一个或多个任务、并映射到一个或多个执行体来共同完成这些任务,以及任务控制基于 QoAIS 产生任务 QoS。由于任务控制具备算力、算法、数据、连接等资源的实时协同和调度功能,以合理、高效地分配任务及执行体映射,以及在任务执行过程中当任务 QoS 无法满足时、快速调整资源,从而在任务 QoS 保障的前提下顺利完成任务。图 4-2

50、 作为一个示例,描述了 AI 用例、AI 服务、工作流、任务个数、执行体等的对应关系:图 4-2:AI 用例、AI 服务、AI 工作流和任务的映射关系示意图 22 上述是以服务编排为任务触发源、并由任务控制将服务编排触发并生成的工作流分解为具体任务并映射到具体执行体来执行;除此之外、还可以存在网络自触发的任务,此时无需服务编排的参与。4.4 对网络架构的影响 任务为中心对网络架构的影响:1)任务控制的引入、及逻辑功能定义,从而支持对算力、算法、数据、连接的统一管控,以任务为对象进行生命周期管理、进行网络 AI 的 E2E QoS 保障。2)任务源的引入、及逻辑功能定义,从而支持任务的触发和编排

51、。任务为中心对标准化影响分析:1)任务为中心:6G 网络通过控制信令支持任务的生命周期管理,网络 AI 的 QoS 生成、分解和保障,及相关资源(算力、算法、数据、连接)的控制。2)对外接口:服务编排与任务控制之间接口定义,如,服务编排分解后的工作流、以及其对应的QoS 指标传递给任务控制。4.5 本章小结 4.5.1 观点 传统通信系统是以会话为中心的设计、提供了完整的会话生命周期管理机制(如,E2E 隧道的创建、修改、删除、锚点迁移等流程);6G 原生支持网络 AI,涉及到多节点场景下的多算力、多连接、多算法、多数据的协同来完成某个特定的目标,因此网络需要针对这样的变化,设计以任务为中心的

52、完整生命周期管理机制,来保障任务的顺利执行和 QoS 保障。4.5.2 建议 立即开展任务为中心及相关方案的研究,包括:1)任务为中心:包括管控对象“任务”的定义、以及任务的生命周期管控流程;2)对外接口:服务编排与任务控制间的交互接口。华为技术有限公司彭程晖、王君、王飞 23 5.问题五:如何支持算网融合?5.1 技术特征内涵 6G 移动基础设施将从单纯的提供连接服务发展为同时能提供连接服务+计算服务的基础设施,可以满足 AI 所需的连接和分布式计算服务;并可能进一步基于 AI 的连接和计算融合控制需求,支持网算深度融合或算网一体化。算网融合,即网络中支持算力和网络相互感知相互融合。具体是指

53、在控制面拉通,包括分布式算力(如,终端算力、基站算力、核心网算力)与连接的相互感知,相互协同,实现实时准确的算力发现、灵活动态算力调度,提供无处不在,满足计算服务的服务质量需求的计算服务和连接服务,实现算力资源、连接资源的合理分配,从而支撑 AIaaS。算网融合在实现相应功能时能综合考虑空口状态信息、网络状态、算力分布等信息以达到性能的最优化或者资源最小消耗,例如在分配算力实施业务部署时考虑网络状态、用户分布、用户空口状态;在建立 网络连接、转发或路由数据时考虑算力分布。算网融合包括的技术内涵包括:1)算网融合网络架构:网元和计算节点组成可调度的计算和通信节点集群,其计算能力与通信能力相互融合

54、,包括如下特征:算力内生、分布式、算力异构和多层次。算力内生特征具体是指,网元兼具通信和计算能力,计算网元和计算节点产生的算力称为内生算力;分布式特征具体是指,计算服务部署到多个节点,使得通信、计算和存储资源得到更充分的利用;算力异构特征具体是指,节点的计算能力、存储能力、算力类型不同;多层次特征具体是指,算网融合网络架构是包括云层、雾层、边缘层和终端层的多层次网络(端、边、核心网云),层与层之间相互连接,相互配合,共同为用户提供服务。2)异构算力的建模、感知、发现。算力感知具体是指,6G 内生 AI 网络需要感知到算力资源信息,如算力类型、算力资源的数量、算力资源的使用状态等。算力发现具体是

55、指,网络在运行过程中,6G 内生 AI 网络感知到新的算力资源,可以是新的具有算力资源节点发现,也可以是存在的节点的新的算力资源发现。算力注册具体是指,在网络发现新的算力资源后,会与该算力资源的节点进行信息交互,并将新的算力资源接入到网络的过程。3)计算、连接的融合控制;融合控制功能具体包括分布式异构算力资源、连接资源的调度与控制。在资源调度时,融合控制功能会综合考虑空口状态信息、延时、算力分布、算力异构情况等信息,从而在保证计算服务 QoS 前提下达到性能的最优化或资源的最小化。5.2 必要性分析 6G 时代的新兴 AI 业务如沉浸式 XR、自动驾驶等,对算力和网络提出更高的要求,如超高算力

56、、超低时延、灵活算力调度等。而传统集约式的云数据中心与端侧算力显然无法满足多样化的业务需求,算力向网络边缘侧扩散,云、边、端多级算力结构成为必然。当前分布式的云、边、端等多级 24 算力互为资源孤岛,容易产生资源浪费、算力不足、无法满足低时延业务要求等问题。如何将利用多级算力资源,以满足 AI 业务的需求成为一个急需解决的问题。通过网络连接分布式算力资源,可突破单点算力的性能极限,发挥算力的群体优势,提升算力规模效能,通过对算力资源、连接资源的全局智能调度和优化,可有效促进算力资源的按需“流动”。计算和网络深度融合,一方面可以整体提高算力资源的利用率,另一方面可以按需为 AI 业务提供最佳的计

57、算、网络等资源服务。此外,5G MEC 方案中也引入了边缘计算能力,用于提供低延时的计算服务,基本是将重点放在了计算能力下沉上,网络和计算部分相对是松耦合的设计,在效率、部署成本、安全和隐私保护等方面存在进一步提升的空间。例如,在 5G MEC 方案中,核心网用户面网元 UPF 可以与 MEC 合设,但在逻辑架构层面,及控制管理机制上,都还是两套相对独立的系统,当需要同时调整连接和算力时,是通过管理面进行协同,协同调整的时延较大;另一方面,网络 AI 面对的资源是分布式、异构多类型的,并需要实时适配无线边缘动态复杂的环境,这和 Cloud AI 情况是完全不同的,也需要在控制面进行实时的协同处

58、理。因此,6G 网络需要计算和通信深度耦合机制,使能 6G 网络成为“连接+计算”双基础设施,将算力高效连接、灵活调度,以支持内生 AI 所需的强大算力,满足各种实时的 AI服务。5.3 可行性分析 政策支持:围绕 AI、大数据、物联网、工业智能制造、工业互联等新一代信息技术产业,我国政府已出台系列政策指引产业发展。这些政策对相关产业的推动,将激发对算网融合的需求。以 2021年 5 月国家发展改革委、中央网信办、工业和信息化部、国家能源局联合印发全国一体化大数据中心协同创新体系算力枢纽实施方案为例,明确提出构建数据中心、云计算、大数据一体化的新型算力网络体系,促进数据要素流通应用,实现数据中

59、心绿色高质量发展。此外在标准上,多个标准化组织一直在推动算网融合,以提升“连接+计算”能力。ETSI NFV 和3GPP SA5 通过标准支持通信和计算在管理功能上进行协作,使得算力服务于移动通信网络;ETSI MEC 和 3GPP SA2 通过标准支持通信和计算在信息开放上进行协作,使得移动网络承载管道和计算业务之间更好地匹配。在传输领域,IETF 基于 IPv6 协议开展 CFN(computing first network)标准化,通过 SRv6 技术来携带算力节点的算力服务信息和算力状态信息,从传输网络层面解决算力感知,以及连接和算力的良好匹配。政策支持及其他领域算网融合技术快速发展

60、的双重推动作用下,6G网络在控制面的功能上协同通信与计算,实现算力资源、连接资源的合理分配,满足计算服务质量需求成为可能。5.4 对网络架构的影响 算力对架构的影响包括:算力可能成为 3GPP 的逻辑功能网元;RAN 侧(包括基站与终端)的、核心网的算力部署选项,潜在的接口、协议的影响;算力与控制面、用户面的关系。25 融合控制功能对架构的影响包括:RAN 侧、核心网侧的计算、连接融合控制机制,例如究竟是在控制面耦合还是在管理面耦合;跨技术域的计算、连接的协同机制,其中技术域包括但不局限于RAN 域、CN 域、管理域等;融合控制与网络 AI 全生命周期管理编排、任务为中心等关联关系。核心网部分

61、融合控制的潜在方案包括:1)方案 1,核心网会话控制功能和算力控制功能(包括算力感知、调度、控制等)独立部署,定义控制信令交互接口。其中会话控制功能包括计算会话的创建、更新、删除等控制管理功能,计算会话具体是指端到端的计算逻辑节点之间的计算输入/输出的数据通道。2)方案 2,核心网会话控制功能、核心网算力控制功能融合为一个控制功能。此外,RAN 侧部分融合控制功能的潜在方案包括:1)方案 1,RAN 侧引入新的逻辑计算单元 xNC(Computing Node),与传统连接服务基站xNB 对等,RRC(Radio Resource Control)和 CRC(Computing Resourc

62、e Control)通过标准接口进行控制面交互,其中 RRC 控制部分包括计算承载的创建、更新、删除等控制管理功能,其中计算承载具体是指终端计算逻辑节点到基站侧计算节点的计算输入/输出的数据通道。这种方案的好处是允许 xNB 设备和 xNC 设备间异厂商连接,部署方式更灵活,运营商可选择范围更大,缺点是外部接口时延较长,较难满足控制面实时性要求。2)方案 2,逻辑计算单元内置于基站 xNB 内,属于基站功能范畴,RRC 和 CRC 通过内部接口进行控制面交互。这种方案的好处是基站内部接口实现性能较好,且无线通信资源和计算资源的独立控制、按需调用,便于依据资源特性设计专用控制流程,也便于统计资源

63、状态。3)方案 3,逻辑计算单元内置于基站 xNB 内,属于基站功能范畴,RRC 和 CRC 融合成统一的资源控制实体(xRC),同时对连接和计算资源进行控制。这种方案的好处是同时决定连接和计算资源的控制决策,资源控制的协同和实时性最佳,但联合控制机制的设计较复杂。图 5-1:AI 计算和通信在控制面上融合的三种模式7 此外,融合控制功能还包括对异构算力资源进行统一建模与感知,对其进行标识,并能降低用户移动性对计算服务、连接服务的影响,如计算迁移等等。为了更好的提供计算服务,需要对计算服务的 QoS 进行定义,比如包括性能维度 QoS 的计算时间、传输时间;开销维度 QoS 的计算开销、传输开

64、销,存储开销、计算能耗、传输能耗等;是否可以作为 QoAIS 的子集。基于融合控制功能,需要进一步研究计算服务 QoS 的保障机制。26 此外,融合控制功能还需要支撑 UE(User Equipment)相关的算力服务机制,例如 UE 作为算力请求方或提供方时算力资源的请求和协商,运营支撑系统应支持算力服务签约,并实现与用户的其他业务一起统一计费;UE 作为算力提供方时,运营支撑系统应支持算力能力开放以及计费结算等。算网融合的融合控制功能使得运营商有能力构建“连接+计算”的双基础设施,支持网络 AI 和AIaaS 等全新的商业模式。5.5 本章小结 5.5.1 观点 支持算网融合的技术特征,是

65、在架构的控制面支持算力、连接的拉通与融合控制。融合控制功能具体包括:1)分布式异构算力的建模、感知、发现;2)分布式异构算力资源的调度与控制;3)计算服务的 QoS 保障机制。5.5.2 建议 立即开展算网融合相关方案的研究,包括:1)核心网侧算力、连接的融合控制功能,功能定义及相关的控制接口;2)RAN 侧算力、连接的融合控制功能,功能定义及相关的控制接口。华为技术有限公司彭程晖、刘哲 中国移动李刚、上海诺基亚贝尔沈钢、中国电信邢文娟 维沃移动通信有限公司袁雁南、上海科技大学吴连涛、杨旸、李凯 27 6.问题六:为什么需要自生长的数据服务?6.1 技术特征内涵 数据服务是数据提供者和数据消费

66、者之间的抽象,是对数据消费者和物理数据提供者的解耦。特别是存在多数据提供者或多数据消费者时,数据服务有助于维持数据的统一性、完整性和重用性。在 6G 内生 AI 网络中,AI 与数据服务紧密结合,在数据采集、处理、存储、知识转化、应用等多个方面促使数据服务能力进化,形成自生长的数据服务。通过 AI 与数据服务的结合,AI 为数据服务提供网络感知能力以及数据采集、处理、流转等过程的智能策略/算法,为数据应用提供知识关联。自生长的数据服务具有以下特点:对海量异构数据精准感知、主动推送和动态按需采集,避免数据冗余,提升数据分析能力和价值挖掘能力;使用 AI 手段进行数据价值挖掘并对数据价值进行变现,

67、通过对不同价值的数据进行云边端分布式存储和策略优化提升数据服务响应速度;通过模型训练和知识推理进行场景动态适配,实现数据服务的智能编排调用、配置参数的智能调整。6.2 必要性分析 数据是 6G 的核心生产要素之一,数据服务能力直接影响网络性能和数据价值。数据服务包括数据采集、数据预处理、数据存储、数据访问、数据共享与协同等阶段,涉及的数据元素包含业务数据、用户数据、网络数据、感知数据、外部数据、资源层数据等。相比于以通信网络运营数据和用户签约数据为主的 5G 网络数据,6G 数据的范围和类型从通信扩展至感知、计算和 AI 等领域。面向 6G网络,当前数据服务存在下列问题:1)数据服务效率低:在

68、数据的采集、存储和流转过程中,如果数据服务响应速度过慢,将会直接导致数据失效。6G 网络存在巨量的连接设备和传感器,其产生的海量异构数据分散在网络各层各域。对多源跨层跨域的数据服务,在数据时效性和一致性保证上存在难度,需要结合 AI 提升数据服务效率。2)数据价值局部化:6G 多元异构网络的数据呈现出海量性、多态性、时序性、关联性等特点。单一、孤立的数据集往往无法反映内在规律,难以解决复杂多变的网络问题。对数据的单点采集和单一模型训练,只能适应于特定问题和应用,局部数据的价值难以推广。对数据价值深度挖掘实现价值最大化,需要打通各个数据孤岛进行知识关联。3)数据匹配能力差:6G 网络中海量、异构

69、、跨层跨域数据打通后,盲目的数据采集将会带来存储量大、数据冗余度高、难以快速选择数据训练集等问题。同时,千行百业个性化特点带来千差万别的场景需求,而当前的参数配置和数据服务编排方式难以做到对各种场景的动态适配。打造更为丰富多样的 6G 场景应用,需要更为灵活的参数配置和数据服务编排方式。28 通过自生长的数据服务,可以对数据价值的分析进行云边端分布式存储策略优化,将高价值数据存放在云端,低价值数据存放在边端,提升数据服务效率;通过集中式与分布式相结合的网络架构来实现对全局跨域的数据编排、网络各域/各节点数据协同、本地数据处理和按需共享;在 AI 加持下进行数据价值挖掘、数据按需采集和服务灵活编

70、排。6G 内生 AI 网络需要自生长的数据服务保证数据的通用性、一致性、时效性、协同性,在安全可信的前提下进行数据流通、精准高效服务和价值挖掘创造。6.3 可行性分析 对 6G 内生 AI 网络,数据服务能力可以从数据采集、数据中间处理和数据应用三个层面进行提升,实现数据服务的自生长。n 原始数据 原始数据中数据非常庞杂,为了控制数据质量和数量,数据采集要在一定的限制约束前提下进行才能使数据越来越符合特定需求。基础数据可以广泛应用于多个数据服务,多个数据服务使用也提升了基础数据的通用性。通过对数据多维度挖掘、对第三方数据采集,可以扩展数据范围并丰富数据的种类。通过对原始数据的精准感知、高质高效

71、采集,复用性增强和数据增广等方式,能够实现数据服务的智能提升。n 中间数据 在数据中间处理部分,数据处理加工方式的智能选择促进了中间数据的自生长,例如使用 AI 内生架构中的智能策略/算法对数据进行抽取、转换、计算形成更加简洁、规范、清晰的样本数据。中间数据的质量提升使得数据服务效率和准确性得到提升。n 应用数据 应用数据的数据含义明确,能够直接面向场景业务。通过对应用场景、业务的不断挖掘以及数据可视化、数据关联性的提升,数据服务的适配能力和迁移拓展能力也得到智能提升。图 6-1:数据服务自生长 29 如图 6-2 所示,通过全生命周期的工作流编排实现对原始数据、中间数据和应用数据的数据服务自

72、生长。图 6-2:6G 内生 AI 数据服务工作流 数据服务工作流包括数据集成,数据存储,数据处理,数据治理,数据安全,数据开放几个关键模块。依托大数据技术,6G 内生 AI 数据服务通过对多源异构数据进行非实时、准实时和实时的数据采集,按照高价值低价值数据的原则进行分布式存储,将 AI 融入数据分析处理过程,对外形成标准化的数据服务能力(包括数据、AI 模型、预测服务等),向 6G 内生 AI 网络及外部系统或用户提供开放服务。同时数据服务生命周期内,数据服务通过数据治理实现数据标准制定、元数据管理及质量稽核等全面数据质量管控工作,通过数据安全管理提供确认、授权、访问与审计等功能,最大化的保

73、证数据的可管、可控、可用。6.4 对网络架构的影响 为了实现数据服务的自生长,需要统一的数据服务框架。6G 网络数据服务框架需要适配终端的多样性、支持异构多源数据的接入、处理并存储海量数据,通过数据挖掘、AI 等技术将数据转化为知识,使能沉浸式 XR、全息通信、感官互联、数字孪生15、全域覆盖等全新业务场景。为满足 2B/2C内生智慧的基本诉求,需要考虑 6G 网络架构中数据逻辑管理与操作统一化、物理部署分离的“数据面”架构,通过云边数据协同,实现高效的数据服务。通过在网络中引入数据面,统一实现对网络各节点数据的感知、收集、分析、处理和管理,可以支撑数据服务对内和对外功能的提供。30 图 6-

74、3:网络数据面架构1 为了支撑自生长的数据服务,还需要搭建“逻辑集中、物理分布”的统一云边协同平台,云边协同配合进行数据管理。云端作为统一采集调度、统一数据处理、统一数据治理入口,负责统一开发调度、跨域多模模型管理、可视化开发、数据稽核与质量管理等功能,边端负责完成具体采集动作、与云端通过协同计算引擎配合进行下推算子的执行、完成数据治理的执行态。通过云边协同引擎实现云边的跨域跨库查询与分析,结合统一的 Catalog(实现平台的数据编目托管)完成两级的算组与算子的调度。为了支撑自生长的数据服务,6G 网络架构还需要对数据进行分层存储和管控,网络要能够主动感知发现数据源,在数据服务各环节进行质量

75、保证,对数据格式和分类规范化,对数据服务建立监督和评价反馈机制。在基站或相关无线网元逻辑节点中,要有数据自生长服务功能实体、相关的数据转发与管控流程。控制面信令要能对上述数据转发流程进行编排、配置,实现可管可控和高效转发。为实现数据服务的可信开放,还需要定义数据对外开放接口,数据服务规范化统一描述和安全访问授权流程。6.5 本章小结 6.5.1 观点 31 6G 网络需要数据服务能够适应海量、异构、多源、多样的数据采集、处理、存储和对数据高效流转。在内生 AI 的加持下,自生长的数据服务能够不断对数据各环节进行质量提升和价值挖掘,并且在安全可信的基础上不断提升数据服务效率和数据精准适配能力。因

76、此 6G 内生 AI 网络需要支持自生长的数据服务。为支持自生长的数据服务,6G 网络需要引入单独的数据面来构建统一的数据服务框架,还需要构建云边协同平台来对数据进行全面管控和协同。中兴通讯股份有限公司薛妍、谢峰、杨立 中国移动郑青碧 亚信科技(中国)有限公司赵燕、王达 维沃移动通信有限公司袁雁南 32 7.问题七:为什么需要自生长和可信的算法?7.1 技术特征内涵 算法自生长是指 6G 网络内生智能的算法/模型生成不再仅仅依靠基于大量训练数据的暴力计算模式,而是也能通过基于已有的算法/模型间的计算来生成新的所需算法/模型,即 6G 通过基于模型的计算来生成新模型。AI 可信不仅仅指 AI 系

77、统的性能,还包含鲁棒性、公平性、可解释性、透明度等方面,并且仅提升系统的性能不足以构建可信的 AI 系统。AI 可信度主要从如下维度来评估,可分为 3 个方面16:表 7-1:AI 可信度维度分类 可信维度 具体解释 技术方面 准确性 AI 系统的结果应该尽可能接近真实情况 鲁棒性 鲁棒性是 AI 系统处理数据输入错误、特征改变、执行错误等的能力,它直接关系到AI 系统的性能,可以保障系统的安全与可靠 可解释性 可解释性要求我们理解 AI 模型做出决策的原理,这是信任 AI 系统的基本因素,可以帮助我们发现 AI 系统的缺陷 泛化性 泛化性要求 AI 系统能够从有限的训练数据中提取知识,并且对

78、没有经过训练的领域的数据做出准确的预测 再现性 网络 AI 系统的再现包括数学推导的再现和实际应用的再现,这有助于检测 AI 系统的潜在风险 用户方面 隐私保护 AI 系统应该能够保护所有用户的隐私,避免未经授权使用可用于识别身份的数据,这是决定 AI 系统可信度的核心因素 自治性 人类拥有对 AI 系统自主活动(如,决策)的控制权 社会方面 透明性 透明性要求对 AI 系统的全生命周期进行信息披露,这已经是公认的要求,是建立公众对网络 AI 系统信任的基本要求 审计与问责 AI 系统应当接受审查、评估和审计,并且算法审计已成为公认的审计方法 其中,算法可信包含的维度还没有定论。7.2 必要性

79、分析 算法自生长方面,主要面向的问题是当前高成本低效率的算法或模型学习方式:需要提供大量训练数据,从数据中学模型,则数据的采集、存储、传输和计算的开销都非常明显,比如,人类平均 1 33 人年的碳排放量是 11023bs,在 GPU 上运行一个大型 Transformer 模型的碳排放量是 626115bs,相当于 56 个人 1 年的碳排放量。对于大型模型,参数的规模为 GB 级,这对于传输是极大的负担,并且大型模型的计算力为 GFLOPS 或者是 PetaFLOPS/s-day,计算开销很高。比如,OpenAI 提出的基于 Transformer 架构的 GPT-3 模型,参数量高达 17

80、50 亿,对算力的消耗更高达3640PetaFLOPS/s-day。为缓解这个问题,算法自生长是必要的。算法可信方面,随着 AI 技术的快速发展,AI 已经广泛应用于移动通信中,因此有必要保障 AI 系统的可信,不必担心其潜在危害。任一单方面的可信度都涉及 AI 全生命周期的多个阶段,不同的可信度间还存在着相互作用,因此应该通过共同优化这些可信需求来构建可信的 AI 系统。7.3 可行性分析 在算法自生长方面,已有一些新的学习框架被提出,比如小样本学习、迁移学习、元学习,其思路为提高已训练好的模型的可重用性,使得仅通过目标域少量数据的训练即可获得新的适配模型,这些方式可以作为“算法自生长”的起

81、始阶段,但这些方式并未改变“从数据中学”的学习本质。不同于从数据中学模型,从模型中学模型需要建立起对已有模型的知识体系。最基本的如,模型的元数据(描述该模型的数据,包括模型结构信息、适用场景、部署后的使用性能、训练过程中的超参等等)。更进一步如解释模型各种输出的知识,模型结构中的各个部分对于模型给出某种决策的影响程度。再进一步如建立起通信领域的基础模型集合,集合中的元素模型(或原子模型)均对应通信领域中某项基本功能或映射,具有很高的可重用性,可以通过调整模型参数值将原子模型适配到某个特定场景下的基本模型,也可以通过模型间的计算(比如拼接、融合、相交等)构建与更大功能相对应的更大模型。算法可信的

82、可行性方面,可信 AI 涉及到 AI 生命周期中各阶段。包括数据采集,数据预处理、特征提取、模型训练、模型测试和推理。其中,数据采集,数据预处理等环节属于数据服务,数据服务的可信意味着对数据提供者进行隐私保护,采取措施保障数据的公平性等可信特征。数据质量价值的提升有助于算法模型的准确性、可重用性提升,算法的自生长也可以促进数据服务各环节能力提升。数据采集和预处理环节需要考虑数据的隐私性与公平性等可信要求,特征提取阶段需额外考虑鲁棒性、泛化性、可解释性等要求。该阶段的鲁棒性可以通过定性和定量的方法来评估,比如鲁棒性测试(功能性测试、性能测试)、数学验证方法。可解释性一般通过定性指标(如,主观人类

83、评价)和间接定量测量方法(如,近似精度)来评估,目前仍然没有直接定量测量的方法。模型训练阶段除了需要考虑上述的可信要求外,还需要考虑再现性。该阶段的可解释性的定性方法一般为模型解释,而定量方法包含可解释的模型、特征解释等。鲁棒性主要通过额外的技术手段来实现,比如对抗性训练。泛化性一般通过技术手段来实现,比如预训练和元学习,也可以采用定量的方法来评估,比如交叉验证等。模型测试与推理阶段也需要考虑上述要求,并需要重点考虑准确性和鲁棒性等。34 另外,在 AI 的全生命周期都可以考虑准确性、自治性与审计等。准确度一般定量判断,自治性可采用定性的方式判断,比如可不可以人工干预,审计特性一般采用定性的方

84、式评估,比如审计检查表。7.4 对网络架构的影响 6G 网络架构要支持算法自生长,而算法自生长的技术突破主要在于算法/模型本身的研究,当前模型的可解释性方面的研究进展比较缓慢。因此,可以分阶段制定具体目标和技术机制,一种可考虑的方式如下:阶段一:基于元数据选择和重用模型。需要建立起模型的元数据框架,包括元数据包含哪些数据元素、如何采集获得这些数据,如何管理等。模型重用则可采用已有的具有较高性价比的学习方式(如迁移或元学习等)。模型库中的模型可以通过相互学习进行模型更新,如果性能不佳,模型库可以设置对外接口,通过 CI/CD 的方式从对外接口导入模型,进行模型的更新和迭代。该阶段所需的逻辑功能实

85、体及交互关系如图 7-1 所示:图 7-1:基于元数据的算法自生长与可信功能交互流程示意图 阶段二:基于可解释模型组件的算法自生长。这个阶段的模型知识更加丰富,除了阶段一中的元数据,还主要包括模型的不同层或分支的类型、结构和参数值对模型功能和结果的影响,这些解释模型组件可以通过编号、数学算法等方式来实现,并不代表“模型的可解释性”。当前已有一些AutoML 框架可以实现基于基础操作空间搜索的网络结构自生成了,比如 AutoML zero,而在获得了更深入的解释模型组件相关的知识后,模型的生成将不再仅依赖搜索算法,更可能是知识和搜索算法相结合的方式。阶段三:基于通信原子模型的算法自生长。经过第二

86、阶段,为满足某项功能生成的模型其结构将更加简洁精准,模型参数将更加灵活动态(比如模型参数不再是一个具体的值,而是一个函数,根据 35 应用场景的不同,映射出不同的参数值)。最终,会产生针对通信领域基本功能设计的基本模型集合。对于由多个基本功能组成的更大功能,则可以通过基本模型的组合生成对等的智能模型。算法自生长可以根据达到的智力水平高低进行划分,智力水平依据模型自身性能指标以及应用到use case 性能的好坏来评估,可以设计考虑安全、隐私、开销等的指标来进一步评估。算法可信评估已经成为算法评估中不可缺少的一部分,在算法自生长的研究中我们也应考虑算法可信对算法的要求,并嵌入相关的技术 提升算法

87、的可信度,比如对 AI 系统进行审计。审计过程可分为内部审计和外部审计,内部审计涉及 AI 系统的全生命周期,使得系统可以自我评估优化,独立方的外部审计可以更有效地获得公众的关注或信任。AI 系统的审计要求会影响移动网络的生态,未来或许会出现第三方对运营商的 AI 系统进行审计。目前 6G 算法可信的范畴还需要进一步研究,虽然 AI 可信的概念几乎涵盖了 AI 领域所有悬而未决的问题,以及对社会有影响的方面,除了鲁棒性、可解释性、再现性等,还有隐私保护、安全性、透明性、审计与问责、伦理与法律、环保等,但是这些内涵是否都要纳入 6G 算法可信的范畴?6G 网络 AI 是否可以提出其他的可信内涵?

88、7.5 本章小结 虽然算法自生长的相关研究较为缓慢,并且算法可信的范畴还未明确,但这两个特征对 6G 网络架构有较大的影响,并且对未来的生态应用有较大影响,可能有新的功能性组织机构出现。因此我们认为 6G 内生 AI 网络架构设计需要重点考虑算法自生长与可信的技术特征。中国移动郑青碧、邓娟 36 8.问题八:如何理解分布式 AI 架构?8.1 技术特征内涵 分布式网络是由分布在不同地点的计算机系统互连而成,通信控制功能可分布在各节点上。6G网络分布式 AI 架构借鉴分布式网络的思想,将 AI 能力作为网络的基本服务,将 AI 能力分布到各个节点,多点协同共同完成 AI 智能分析,使 6G 网络

89、能够按需调整、弹性伸缩、自主学习和自主演进,并赋能千行百业,构筑全行业的泛在智能生态系统。6G 网络分布式 AI 架构将支持各层级节点间的智能协同、数据和知识双驱动、算力资源灵活调配、数据和网络复杂异构等17。8.2 必要性分析 设计 6G 内生分布式 AI 总体网络架构需要从场景需求、业务要求、性能要求等多方面考虑,保证6G 网络中各节点具备数据感知和处理、知识加工和储备、信息传递和交互、模型训练和调度、策略制定和输出等能力。1)多态异构网络带来数据安全问题:一方面,6G 网络海量多态异构的网络设备接入给集中式的网络部署带来大量难题;另一方面,集中式 AI 管理不利于保护网络设备的数据安全;

90、2)各节点知识差异需要分享协作:6G 网络将存在大量智能节点,各节点可能需要具备知识加工或储备能力,即知识可能分布存储在各个智能节点中,各节点之间可能需要进行知识迁移,共同构建知识图谱,可使网络具备自我学习等能力;3)算力需求的增长需要资源的灵活调配:6G 内生智能网络中的计算需求将大幅度增长,由于云服务器的计算资源限制,可能较难满足需求,可能将云计算资源下沉到边缘侧和终端侧;采用云、边、端协同的分布式网络架构更加符合 6G 网络的总体愿景;4)模型训练对资源消耗压力更大:AI 模型规模变得越来越大,参数量越来越多,基于 AI 的应用程序的内存及功率等消耗也越来越大,通过模型拆分存储和训练的分

91、布式架构可以降低各节点或终端的存储、计算、功耗压力。8.3 可行性分析 目前业界已有很多分布式相关的 AI 学习方法,例如支持隐私保护及终端异构的联邦学习、更加安全及去中心化的群体学习、多节点协同的多智能体强化学习、小样本及适应性强的迁移学习和元学习等,均可考虑用于 6G 网络的分布式 AI 架构。不同的学习方式各有特点,可满足 6G 网络中的不同应用场景,因此 6G 网络的 AI 架构需要满足各种学习方法的需求,即可根据网络中不同节点的 AI 能力、AI 模型、数据样本、分析任务、算力资源、网络环境等因素,灵活选择恰当的学习方式。在多个分布式 AI 学习方法中,从网络架构角度可分为中央与本地

92、协同、去中心化两种方式,例如联邦学习主要为中央节点和本地节点协作方式,群体学习为多节点配合的完全去中心化方式,多智能体强化学习可能有中央节点参与也可能各节点协同完成,迁移学习和元学习更强调模型参数等在多节 37 点间的共享来辅助学习,可能需要管理和协调的中央节点。因此在网络架构中则需要考虑配备不同角色的节点,以及这些节点如何在满足 AI 训练及分析的任务下融入 6G 网络架构中,包括能力的要求、算力的要求、数据的要求、算法及模型的要求等。1)能力方面:6G 网络中的功能实体或终端应作为哪种角色,具备哪些能力,需要完成的 AI 任务有哪些等;2)算力方面:需要考虑对各节点算力资源的要求,对 AI

93、 任务的算力要求如何准确评估、确定算力要求后如何在节点间进行合理分配、如何满足实时性要求等;3)数据方面:从哪些可信终端或功能实体获取数据,如何获取 AI 分析所需的数据、如何满足模型训练和分析,数据的隐私保护及加密等问题、数据样本的采样方法和频率等;4)算法及模型方面:从分布式架构角度看,主要考虑实时性和传输压力等问题,因而更关注模型的共享效率、模型训练的灵活普适性、模型大小的选择、模型训练时间等。8.4 对网络架构的影响 6G 网络分布式 AI 架构包括横向多层、纵向多面、跨域协作,以及分级部署18。1.网络架构中的层主要从网络提供服务的视角阐述,不同层形态和功能不同,提供的服务也不同。目

94、前业界普遍认为 6G 网络架构可能包括以下几层:1)网络资源层,主要指基础设施,例如频谱资源、异构计算(CPU、GPU、TPU、FPGA 等)、硬盘、内存、传输网络等;2)网络能力层,主要指网络逻辑功能(NF),包含 6G 网络的主要能力,例如信息感知功能、数据处理功能、网络通信功能(移动性管理、会话管理、策略管理等控制面功能,路由转发等数据面功能)、计算功能等;3)网络运营管理层,主要指运营管理相关功能,例如网络监控管理、云网编排、业务受理、计费结算等。6G 网络还可能引入数字孪生网络管理功能、意图驱动网络智能中枢等功能;4)应用服务开放层,则功能/能力层提供的服务与应用,例如感知服务、位置

95、服务、低时延高可靠传输、确定性传输等。2.网络架构中的面是指纵向贯穿各层,为各层提供的基础能力。数据面、安全面、智能面是目前业界提及较多的能力。1)数据面实现资源状态感知(算力等)、网络状态感知、业务或场景感知、用户数据、数据仓库等;2)安全面提供安全服务及策略等;3)智能面则主要提供 AI 能力调用、知识构建、统一数据模型、大数据分析、算法、策略等;智能面为各层提供服务,例如向资源层提供资源分配建议,向功能/能力层提供数据处理、资源感知、特定功能分析等,向网络运营管理层提供意图转译、编排分析;向应用服务开放层提供辅助应用的网络分析、辅助训练模型、开放资源感知等。38 3.网络架构中的域主要是

96、用于区分不同专业领域,一般自成体系或网络,各域融合统一的难度较大,将来在 6G 网络也可能是分立的,可能涉及的域包括无线接入网域、核心网域、云网承载域、外部网络域、终端域等。目前各域均在研究 AI 能力,例如核心网域用于网络服务提升、网络优化等;无线接入网域用于资源优化、拥塞分析、节能等;云网承载域用于智能路由、资源调配等;外部网络域和终端域用于应用体验增强、配置管理等。4.网络架构中的级主要是网络服务的分级,即全国级、区域级、网元级、边缘级等。从部署角度,尤其是规模广域覆盖的网络,无论是对端侧实时性、海量计算、不同算法对模型训练的要求,还是对数据存储能力、通信传输压力等的考虑,完全扁平化部署

97、难度较大,将来 6G 网络仍可能包括全国级、区域级(也包含基于服务)、网元级、边缘级,考虑到 AI 还会涉及终端级,部署上可能会有集中、边缘和端侧等云边端协同场景。AI 可渗透到各级,每级能力各有差异,将来可能是独立智能功能实体和内嵌智能功能实体共存的模式,6G 网络分布式 AI 架构如图 8-1 所示:图 8-1:6G 网络分布式 AI 架构示意图 1)独立智能功能实体:指专用于进行 AI 分析的功能实体,依据 AI 系统特点设计,普遍具备算力和性能强、ML 模型丰富、数据和知识全面,支持节点管理协同等特点,因而能够提供更精准、更复杂、场景更丰富、覆盖范围更广的 AI 分析能力。独立智能功能

98、实体的具体功能可包括信息和资源状态等数据的收集、数据的预处理、知识构建及辅助分析、模型训练、推理或策略建议等。全国级、区域级和边缘级可以考虑部署独立智能功能实体。2)内嵌智能功能实体:为了达到 6G 智能内生的目标,已具备特定能力的功能实体或终端,也应设计 AI 能力,即内嵌智能功能实体,一方面根据自身需求完成 AI 分析和推理等,另一方面 39 可辅助独立智能功能实体提供数据感知、推理、辅助模型训练等能力,例如核心网会话管理功能实体内嵌 AI 能力进行会话相关信息感知和推理,终端内嵌 AI 能力辅助进行联邦学习等。内嵌智能功能实体在实时性、隐私保护和安全性方面可能更有优势,但往往因算力有限、

99、数据和模型单一等问题较难完成大型复杂的分析任务。内嵌智能功能实体的具体功能可包括数据或状态感知、小型的模型训练(用于联邦学习等)、知识存储、推理及反馈等。网元级和终端级等可考虑使用内嵌智能网元19。8.5 本章小结 8.5.1 观点 6G 网络及终端数据异构、服务场景更为复杂、算力及性能指标差异大、模型训练消耗大,分布式 AI 架构通过支持横向多层、纵向多面、跨域协作,以及分级部署等可更好的适应未来 6G 网络内生智能的需求。8.5.2 建议 6G 网络智能化的目标是满足内生 AI 的需求,则需要考虑 AI 如何融入网络,成为网络的一部分,例如各层、级、域等需要哪些 AI 能力,各节点之间如何

100、进行自主高效的互联共享等协同。中国电信李鹏宇、于梦晗、邢燕霞 北京邮电大学周凡钦、丰雷 重庆邮电大学徐勇军、大连海事大学杨婷婷 电子科技大学冯钢、秦爽、中国移动温子睿 40 9.问题九:分布式 AI 架构中不同节点如何协同?9.1 技术特征内涵 各层级节点 AI 功能不同是指在各层级节点部署不同的 AI 能力,其中所部署的 AI 能力可以从人工智能实现手段、算力供给需求、整体 AI 能力中的角色等多个角度加以区分。从人工智能实现手段角度看,可分为知识驱动和数据驱动等不同 AI 能力20;从算力供给需求角度,不同的 AI 能力一般具有不同的算力供给需求,需要具体问题具体分析;从整体 AI 能力中

101、的角色角度,不同层级的各节点按需具备 AI 能力,节点的 AI 能力角色可分为独立智能功能实体和内嵌智能功能实体。AI 节点间协同主要体现在 AI 节点之间进行数据和知识的协同、算力和资源的调配、算法和模型的共享等,从而增强网络功能、提升网络性能、优化网络和应用服务体验,提升 6G 网络整体的智能化水平。结合 6G 网络潜在的分布式 AI 架构,需要考虑域、层、级、面之间或其内部各节点的交互方式和数据传递,在满足实时性要求、减少传输压力、网络和算力资源分配最合理、隐私保护等前提下,选择最优方式完成 AI 任务。9.2 必要性分析 关于各节点 AI 功能不同的必要性,可以从以下三个角度分析:1)

102、从节点智能需求角度,各层级节点数据获取的全面性与时效性不同,例如靠近端侧的节点的网络数据获取时效性较好,全面性较差;靠近云侧的节点可获取全面性的网络数据,但时效性较差21;同时,不同人工智能实现手段下AI 能力具有不同特点,因此可在考虑不同网络优化目标问题时部署有差异的 AI 能力。2)从节点算力供给能力角度,各层级节点存在显著差别。终端节点计算资源有限且算力供给稳定性差,节点异构性强;边缘级节点计算能力差异性较大,节点供应商可能来源多样,异构性强,且数据和资源共享的难度大,成本高;全国级节点能够提供高质量强稳定的算力,但可能存在一定时延,对实时决策造成影响,因此可根据算力需求部署适当的 AI

103、 能力。3)从节点智能内生角色角度。内嵌智能功能实体的 AI能力嵌入在通信功能网元或终端等,更适合完成数据或状态感知、数据预处理与特征提取、小规模模型训练、本地知识抽取、存储、推理及反馈等任务,独立智能功能实体往往与多个节点存在数据交互接口,更适合完成大范围多维度知识融合、大规模模型训练、全局知识抽取、存储、推理及反馈等任务,从而整体实现更及时的数据处理和更少的传输开销。6G 网络分布式 AI 架构需要各节点之间协同完成 AI 任务,主要体现在以下几个方面:1)场景需求:当前通信网络中 AI 分析已需要各节点协同,例如网元或切片负载分析,需要从核心网域获取各网元或切片负载、状态、资源使用和流量

104、消耗,从终端域获取终端目的地、速率等,从外部网络域获取UE 群体行为信息等;未来确定性网络、算力网络、天地一体等新网络能力,万物智联、沉浸式 XR、数字孪生等新应用,更需要端到端、各域配合、资源和能力的统一调配和协同。2)性能要求:未来6G 网络提出超低时延高可靠、超大带宽、低成本大连接等愿景,随之产生的 AI 任务将变得越来越复杂,为了提供更优质的网络服务质量体验,各 AI 节点之间需要具备数据知识传递、算力资源分配、算 41 法模型共享等 AI 协同能力。3)分布式学习需求:海量异构的 AI 节点的涌现使得 6G 网络需要分布式AI 架构,分布式学习方式要求 AI 节点必须具备协同能力,例

105、如联邦学习、群体学习、多智能体学习等。9.3 可行性分析 AI 节点功能差异性可考虑以下几个方面:1)在架构设计中可能需要定义和增加新的 AI 节点,但随着 AI 技术向网络技术渗透,未来网络技术本身的智能方法和网络 AI 之间的界限可能变得模糊,进而可能造成网元的重复定义、责任边界的不清晰或节点资源的浪费,甚至导致决策冲突,可通过标准化工作进行分析和推动解决。2)目前的 AI 技术以数据驱动为主,如何获取大量实时的 AI 数据,对网络智能能力的上限存在决定性影响,网络架构可考虑预留开放的数据接口和专有信令用于支撑和赋能网络 AI,增强网络架构设计对 AI 的支撑能力。3)目前 AI 的可靠性

106、和解释性存在不足,无法保证新增的 AI 模型和方法能够稳定有效工作在网络中,在计算机操作系统上沙盒模式是一个常见的解决方案,网络架构上如何支撑网络沙盒对 AI 能力落地具有重要意义。6G 网络 AI 节点协同时可能需要考虑传输效率、实时性、移动性、鲁棒性、隐私性、能耗成本等因素,联邦学习、群体学习、多智能体学习等人工智能关键技术可作为 6G 网络各 AI 节点间的协同方式22。考虑到通信网络存在设备异构性问题,每个 AI 节点可能仅能处理小组高维模型的样本,因此,一方面需要学习架构可根据网络状况,优化参与模型上传的设备选择;另一方面,网络架构也需要灵活重配置异构网络资源,及时扩展容量,以处理更

107、多的模型;同时还需要灵活的网络管理规则,考虑多层结构的任务迁移、模型聚合的异步管理等,以协调网络不同层的节点。9.4 对网络架构的影响 9.4.1 不同节点的不同 AI 功能 在不同节点部署恰当的、差异化的 AI 能力,应该综合考虑其智能需求与算力特点,实现计算能耗、时延表现、传输开销三者之间的平衡。1)全国级节点、区域级节点可获取全局的网络数据,但可能无法准确获取实时数据,为全面参与网络的决策控制,对计算能力要求高,所需数据量大,更适合对全局性的策略或者算法模型集中进行训练和推理,建议部署包括知识分析推理、模型训练存储等知识驱动的 AI 能力,以独立智能功能实体的能力为主,具备支撑海量数据的

108、完整数据处理、模型离线训练、策略推理能力。2)边缘级节点、网元节点能够获取一定范围的网络数据,但数据时效性不如终端级节点,可为全国级节点、区域级节点提供数据预处理或者扮演 AI 推理执行的角色,对实时性有一定要求,而计算能力要求则满足业务需求即可,建议部署以数据驱动的内嵌智能功能实体能力为主,以知识驱动的 AI能力为辅,具备轻量级的 AI 推理和训练能力,可负责所在范围内的完整数据预处理、模型训练、策略推理,且具备存储能力以支撑异构边缘节点间的协同学习等。42 3)终端级节点可以实时获取端侧本地信息,但获取数据的范围很小,建议部署数据驱动的内嵌智能功能实体能力,侧重于具备策略应用能力,可参与本

109、地联邦学习在线训练,在算力富足时具备一定离线训练能力。9.4.2 节点间的 AI 协同 移动通信网络中的 AI 协同包括网络架构中域内域间、级内级间、层内层间、面内面间的 AI 协同,从差异性角度来说,域内域间、级内级间、层内层间与面内面间的 AI 协同方式四者之间差别不大,下文主要根据实际可能存在的差异性,从域内和域间角度分级进行分析。1)域内同级 AI 协同 主要涉及域内全国级、区域级、边缘级、网元级内部的横向 AI 协同,主要考虑采用群体学习等去中心化分布式架构或迁移学习方式等,例如同级不同覆盖范围或不同能力的 AI 节点协同进行分析、同级 AI 节点间通过共享模型加速学习等。同级 AI

110、 节点之间的协同可能主要考虑以下几个方面:1)模型共享:指级内同类型 AI 节点间可进行 AI/ML 模型共享,帮助其他节点进行学习和分析,需要考虑模型的准确性和可靠性等;2)模型拆分:可考虑采用多节点并行的纵向跨层模型拆分方式,需要考虑各节点的计算能力及传输效率等;3)协同学习:同级内的 AI 节点可能采用群体学习方式或通过迁移学习、元学习等技术进行知识迁移,需要考虑协同的场景和实时性等。2)域内不同级 AI 协同 主要涉及域内各级之间的纵向 AI 协同、横向和纵向混合的协同方式,主要考虑通过有中心的分布式架构或者迁移学习方式进行协同。有中心的分布式架构可将上一级的 AI 节点作为中心节点,

111、下一级的 AI 节点作为本地节点,例如不同级各 AI 节点之间可通过联邦学习进行协同,独立与内嵌智能功能实体之间协同采用以独立智能功能实体为中心节点,内嵌智能功能实体为本地节点的联邦学习等;域内不同级 AI 之间的迁移学习指域内某一级的 AI 节点中的预训练模型共享给其他级的 AI 节点,该节点根据需要仅用少量训练数据微调预训练模型即可得到最终模型。不同级 AI 之间的协同方式主要考虑以下几方面:a)数据协同:数据服务分布式协同可保证数据的一致性和有效性,网络数据可在多节点内均存有备份或每个节点存储部分数据,并需要备份数据的及时更新;b)算力调度:指算力资源可在不同级的 AI 节点之间进行合理

112、再分配;c)模型共享:指不同级之间的 AI 节点可共享 AI 模型,可直接用于任务推理或对模型进行再训练;d)模型拆分:可考虑采用各节点序贯式的横向按层模型拆分方式,需要考虑各节点的计算能力及实时性等;e)协同学习:不同级 AI 节点间可运用联邦学习、迁移学习进行共同训练或知识迁移,主要考虑实时性、学习效率等。3)域间 AI 协同 通信网络中不同域面向不同通信专业领域,提供能力的层面或范围存在较大的差异性,为了满足用户端到端的服务体验,6G 网络将不可避免的会涉及不同域间的协同问题。由于各域的复杂性、能力差异性、性能需求等,每个领域均有可能提供各自的 AI 能力,如果需要完成端到端或多域共同的

113、智能分析任务,则需要各域 AI 的合作和共享,即域间协同。43 域间协同的协同方式主要考虑以下几个方面:a)数据协同:各域 AI 从其他域获取分析所需的元数据或预处理后的数据或知识,用于本域的模型训练或分析,需要考虑数据获取的实时性、数据样本颗粒度等;b)模型共享:本域 AI 的 ML 模型可共享给其他域,辅助其他域 AI 进行模型训练或分析,需要考虑模型的准确性、时效性、鲁棒性等;c)协同学习:例如不同域为相同特征、同一地域用户群进行智能分析,可能采用联邦学习、迁移学习等,从而提升以用户为中心的服务体验。无论哪种域间协同方式,可能需要考虑统一的协作中心,例如支持联邦学习的中央服务器,选择针对

114、不同智能分析任务的域间协作方式等。6G 网络分布式 AI 节点间协同如图 9-1 所示。图 9-1:6G 网络分布式 AI 节点间协同示意图 9.5 本章小结 9.5.1 观点 1)分布式 AI 网络架构中,各层级 AI 节点具备不同的 AI 能力,服务于不同的业务需求。2)依据 AI 能力设计方案部署 AI 任务,采集类和感知类任务可部署到终端级节点、边缘节点和网元级节点,大时间尺度和知识化类任务可部署到区域级节点和全国级节点。3)在分布式 AI 架构中,为了高效实现不同需求场景的智能分析需求,需要各节点间相互协同,共同完成 AI 任务。4)各 AI 节点间需要协同,通过数据传递、算力调度、

115、模型拆分/共享以及协同学习等方式支持。9.5.2 建议 6G 网络应支持分布式 AI,支持 AI 节点间协同,但需要从本质上深入了解 AI 性能与资源消耗、通信开销等方面的关系,在提升资源利用率的同时保证模型学习和训练的性能,建议持续开展研究,在设计和实现方面提出创新方案。44 中国电信李鹏宇、于梦晗、邢燕霞 北京邮电大学周凡钦、丰雷 重庆邮电大学徐勇军、大连海事大学杨婷婷 电子科技大学冯钢、秦爽、中国移动温子睿 45 10.问题十:可以对外开放哪些 AI 能力?10.1 技术特征内涵 能力开放是移动网络的重要功能,5G 网络中就已经存在。到了 6G 时代,AI 相关的能力开放必然是 6G 网

116、络能力开放的重要组成部分,是实现移动网络 ICDT 融合的重要切入点。相比 5G 时代下的能力开放的同质竞争,AI 能力开放更着重于 6G 网络与第三方需求之间的优势互补,协作共赢23。AI 能力开放是指对于 6G 网络中的 AI 相关的资源包装成特定的能力向第三方开放、使用,主要表现在如下三个大方面:数据开放:数据开放是指将 6G 网络中可以获得的数据经过加工后共享给第三方使用,包括对于6G 网络内部的处理后的原始数据的开放以及基于原始数据分析后得到的有价值信息的开放。算力开放:算力开放是指网络可以充分利用算力资源对外提供计算服务。当收到外部的算力服务请求时,整个网络的云边端架构会整合网络中

117、的空闲算力,通过网络模型中的功能层实现算力的统筹调度,再结合云边端自身相应的通信功能来传输反馈任务数据,完成整个对外提供算力服务的功能。模型开放:模型即算法,是第三方实现 AI 服务的灵魂。6G 网络中可以向第三方提供 AI 模型/算法的开放服务,适用的 AI 模型不尽相同。利用 6G 网络的强大资源(包括数据、算力、通信等资源)打造诸如“AI 模型商店”的模型开放能力,可以服务于广大的第三方 Network for AI 市场。10.2 必要性分析 n 数据开放的必要性 数据开放可以让产业链所有参与者充分利用已有的数据资源,避免重复的数据采集处理操作。开放数据能够打破网络间、行业间的数据孤岛

118、和数据壁垒,并为第三方参与提供途径。数据开放丰富了数据类型,加强了数据之间的联系,拓展了数据应用空间,让数据服务更加智能化。数据开放为数据服务提供了数据价值的挖掘拓展和数据资产变现的更多可能。对于数据开放来说,AI 技术之所以能够大规模普及,其中一个重要的因素就是数据,对于第三方来讲,想要训练出好的模型、产生强大的推理能力,必然需要跨域的数据采集,这里主要指终端、移动网络和 OTT 三个不同域的数据在安全隐私可接受范围内的共享。就像人脑做决策一样,只有考虑的因素越全面,做出的判断才越合理。因此数据的开放是决定 6G 网络 AI 功能面强大与否的关键因素。46 图 10-1:从 QoS 到 Qo

119、I 5G 网络中,为了提升业务的体验,网络主要以提供和保障高质量的 QoS 为主,其中网络切片、TSN 等 5G 的关键技术均以提供最佳的 QoS 为目标。也就是说,只要能够提供最佳的 QoS,就可以足以为第三方的业务体验保障提供足够的支持。但是,到了 6G 时代,为了能够实现最佳的 AI/ML 操作价值,仅有极致的 QoS 是不够的,AI/ML 能够实现重要的价值更取决于数据/信息的共享。具体来说,高质量的信息共享可以为第三方提供有效的操作决策、加速训练过程、提升训练准确度。因此,在 6G 网络中,利用意图网络等技术,基于信息的能力开放可以以 Quality of Information 的

120、形式呈现给第三方,并与 QoS 一起为第三方 的 AI/ML 操作提升价值。n 算力开放的必要性 很多基于 AI 的服务需要耗费大量的算力资源,大多数的 OTT 厂家都不具有如此庞大的资源体量。运营商网络可以为 OTT 提供云资源服务,让 OTT 使用运营商的云资源执行相应的 AI 服务或为OTT 公司执行 AI 服务。人工智能的最新进展推动了网络边缘的智能应用,如智能家居、智能工厂和智能城市等等。为了在算力资源紧张的边缘设备上部署计算密集的深度神经网络,传统的方法是将部分神经网络模型上传至云端,云端将计算结果反馈回终端,但这种方式缺点是可靠性差且延迟高。因此利用网络中设备的空闲算力来帮助算力

121、不足设备或对网络外部提供算力服务是一种新的思路,即算力众筹/开放的概念。利用算力众筹可以将网络中设备闲置算力集中控制再根据网络中业务需求合理分配,并开放给第三方使用。n 模型(算法)开放的必要性 由于在不同时间、地点、环境、业务、用户等情况下对于 AI 模型的要求不尽相同,第三方需要按需获取最佳的 AI 模型进行使用。这里需要消耗大量的资源进行模型的训练、管理、匹配和调整等,这3 3rdrd partypartyQoS3 3rdrd partypartyQoS常规常规业务业务体验体验AI/MLAI/ML操作操作价值价值Q Qo oI I5G5G网络网络6G6G网络网络 47 无疑对于很多第三方

122、使用 AI 模型是难以克服的门槛。为此,6G 网络可以具体在如下几个方面向第三方提供按需、高效的模型开放:-由于第三方一般仅有少量的基于某个特定需求的样本,少量的样本无法支持第三方训练出一个收敛的 AI 模型。为此,通过 6G 网络提供的泛化能力强的基础模型,第三方可以在此基础上通过少量的样本继续训练,得到性能良好且适配于第三方特定需求的 AI 模型;-第三方算力受硬件条件、电量等因素的影响,对于模型选择和计算层数的分配需要根据算力要求进行确定,发送给第三方,并充分利用分布式算力的优势,共同承担 AI 计算需求;-此外,模型大小也是开放给第三方时的一个重要的考量目标,过大的模型不宜安装在算力和

123、存储受限得终端或服务器上,而过于简单地模型又会造成模型推理准确性的缺失,因此需要 6G 网络通过蒸馏、剪枝、量化等技术帮助第三方实现理想的模型尺寸。10.3 可行性分析 上述必要性分析中提到的 AI 能力开放已经在前面章节提到的问题中的分析中有了充分的理论支持。对于数据开放,在之前的问题六“6G 内生 AI 网络架构是否需要支持数据服务自生长技术特征?”中已经提到,通过数据的采集、汇聚、加工、训练、推理、分析等过程,可以对 6G 网络中获取的数据进行加工,并在可信开放的原则下按需开放给第三方使用。为此,涉及的数据元素包含业务数据、用户数据、网络数据、感知数据、外部数据、资源层数据等,网络的数据

124、服务能够实现可信的认证、授权、访问的功能,以及高效的数据存储和管理、按需动态的数据采集、数据预处理和聚合、对外能力开放和注入等功能。数据服务的可信开放特性主要体现在数据采集、数据存储、数据访问、数据共享与协同等阶段。同时,考虑到数据的隐私性问题,6G 网络可以通过定性方法和定量原则来保障,比如通过数据隐私保护法对数据保护影响进行评估,采用数据匿名化、差异隐私的方法定量证明数据的隐私性。对于算力开放,在之前的问题五“6G 内生 AI 网络架构是否需要支持算网融合技术特征”中已经提到,云、边、端多级算力结构和算力资源的按需流动不仅可用于 6G 网络自身的内生智能需求,同时可以用于向第三方进行算力开

125、放。为此,可以将神经网络计算任务拆分,拆分要根据当前的通信状况和可利用的算力来确定,包括对于神经网路的横向拆分(即按层拆分,拆分后前一部分的输出是后一部分的输入,计算需要从前到后)、纵向拆分(即快层拆分,将神经网络每层中的神经元分配到不同部分,拆分的部分彼此间既有并行关系也有串行关系,计算时需要不同拆分部分间信息交互)以及混合拆分(即横向和纵向拆分的组合)。48 确定拆分策略后,需要将拆分后的模型分配给不同的设备,同时需要对各设备的计算结果进行汇总以及必要的数据传输。通过目前流行的强化学习、联邦学习、去中心化分布式学习等机器学习方法可以有效实现多节点之间的协作和信息共享。对于模型(算法)开放,

126、在之前的问题七“6G 内生 AI 网络架构是否需要支持算法自生长和可信”中已经提到 6G 网络内生智能的算法/模型生成不再仅仅依靠基于大量训练数据的暴力计算模式,而是也能通过基于已有的算法/模型间的计算来生成新的所需算法/模型。同时,结合问题五和六中提到的数据服务和算网融合服务于 6G 网络,可以充分利用多级云资源为第三方提供模型存储、训练、下载等一系列服务,在这一过程中使用迁移学习中特有的元学习技术可以不断优化不同情况下的 AI 模型开放能力,为第三方按需提供最佳的预训练模型,并配以预训练-微调和知识蒸馏等迁移学习技术为第三方量身定制最佳的 AI 模型使用。在这一过程中,可以充分发挥运营商和

127、第三方各自的优势,即运营商具有的庞大基础设施资源得以更加有效地利用,第三方具备的灵活快速特点可以在运营商的基础设施资源上实现并迭代,形成优势互补的 AI Model as a Service 的效果。10.4 对网络架构的影响 为实现数据开放,数据服务要在安全管控、统一管理、可信环境和安全审计上实现可信可管可控。对数据服务,还需要构建整体的数据安全管理体系和提供贯穿数据全生命周期的数据安全防护能力,同时提供数据服务分类、统一标准接口及数据开放管控能力。如图 10-2 所示,为了实现最上层服务层的 AI 能力开放,对网络架构的影响可以包括如下几方面。首先资源层对网络内各个设备的算力,任务进程进行

128、实时管控。将异构时变的算力资源映射到资源抽象层来为功能层提供可量化的算力资源。功能层进一步将整个系统的各方面状态如控制面信息,用户面信息,数据面信息等等汇总并将资源层中的算力资源合理分配调度为最上层的服务层提供算力服务,提高整个系统的算力使用效率。并基于提供的算力实现面向应用的各种 AI/ML 操作 49 图 10-2:AI 能力开放基础架构示意 为此,在标准化角度上需要建立标准化的接口实现对外的能力开放,包括标准化的用于第三方的请求/回复流程,用于第三方以格式化的方式提供包括数据、算力、模型的具体条件要求,6G 网络按需完成资源的划分。同时,需要以 AI 域的形式对用于特定第三方的 AI 相

129、关资源进行划分,隔离可能来自于攻击者的非法资源占用和调取。10.5 本章小结 6G 内生智能网络包含 AI for Network 和 Network for AI 两大方面,前者侧重于为 6G 网络降本增效,后者则侧重于为借助 6G 网络的 AI 能力打开更广阔的第三方市场。问题十着重回答了Network for AI 方面,借助 AI 能力开放如何吸引第三方加入以 6G 网络为基础的 AI 生态,实现优势互补、合作共赢。本章阐述的 AI 能力开放问题与前面章节中对于 6G 内生智能网络的总体架构、特征密切相关。可以说,本章是向外呈现 Network for AI 功能的能力开放出口,而如何

130、实现这些能力是需要 6G 内生智能网络架构规划初期进行统筹考虑的问题,渗透在 6G 智能网络的各个方面,尤其会前面章节中的算网融合和数据服务章节的论述有密切联系。OPPO 许阳 50 11.总结 6G 要实现普惠智能愿景,从架构层面需要内生 AI 设计,这一点业界已达成共识。然而从端到端视角,包括网络 AI 用例的产生到网络的部署应用,其中的很多具体过程还有很多不清楚的地方,涉及的具体技术问题以及对架构的影响,虽然业界已有一些研究和讨论,但并未收敛形成有效共识。本白皮书审视网络 AI 完整的生命周期过程,挑选并重点分析了其中的十大技术问题,包括这些问题的主要技术特征、必要性分析、可行性分析和对

131、 6G 内生 AI 网络架构的影响,来推进大家对 6G 内生 AI 架构关键技术的理解,并通过讨论和碰撞,对齐理解,加速形成共识。然而我们也注意到,6G 内生 AI 网络架构涉及的内容相当广泛,是跨多个技术领域的融合创新,将引发网络架构的重大变革,涉及现有网络架构的所有层面,因此当前本白皮书版本分析的十大技术问题是无法完全覆盖全面的,从目前看,一些潜在的待未来进一步分析的技术挑战包括:1)从需求角度,用户真正需要的是什么 SLA?如何通过 AI 用例表示用户的需求?从可实现角度,哪些 QoAIS 是可保障的?2)如何将算法、数据、可编程能力集成到 AI 生命周期管理和自动化机器学习管道编排技术

132、之中,构建和管理可重现,可测试和可持续的 AI 能力?3)如何对大任务进行自动分解?如何进行实时协同和调配计算、算法、连接、数据,从而保障任务的 QoS、以及任务的顺利执行?4)为了适配边缘动态、复杂、异构的环境,算网融合控制系统如何实时调度边缘的异构资源?例如,终端信道状态快速变化,调度给终端的连接资源可以快速变化,那么算力资源是否也可以快速调整、如何快速生效?5)超大规模模型对网络架构的影响?移动通信网络是否需要通用的大规模模型?6)可信 AI 对网络架构的影响?6G 网络架构如何为可信 AI 提供支撑?7)AI 如何融入网络,各层、面、域、级需要哪些 AI 能力,各节点之间如何进行自主高

133、效的互联共享等协同?8)AI 能力开放在典型业务场景下如何具体落地?我们呼吁业界各方齐心聚力,针对上述技术挑战展开讨论和研究,进一步识别和聚焦对 6G 网络架构有重大影响的技术问题。同时,6GANA TG2 也将继续努力,希望在本白皮书下一个版本中能给出 6G 内生 AI 网络架构的可能答案。中国移动邓娟 51 参考文档 1 Liu G,Li N,Deng J,et al.6G Mobile Network Architecture-SOLIDS:Driving Forces,Features,and Functional Topology.2021.2 NGMN,6G DRIVERS AND

134、 VISION v1.0,2021 3 6GANA.6G 应用场景详解白皮书.2022 4 张彤,任奕璟,闫实,等.人工智能驱动的 6G 网络:智慧内生J.电信科学,2020,36(9):9.5 刘光毅,邓娟,郑青碧,等.6G 智慧内生:技术挑战,架构和关键特征J.移动通信,2021,45(4):11.6 Deng J,Zheng Q,Liu G,et al.A Digital Twin Approach for Self-optimization of Mobile NetworksC/2021 IEEE Wireless Communications and Networking Conf

135、erence Workshops(WCNCW).IEEE,2021.7 中国移动研究院,6G 无线内生 AI 架构与技术白皮书,2022 8 中国移动研究院,6G 物理层 AI 关键技术白皮书,2021 9 中国移动研究院,6G 至简无线接入网白皮书,2022 10 Wen C K,Shih W T,Jin S.Deep learning for massive MIMO CSI feedbackJ.IEEE Wireless Communications Letters,2018,7(5):748-751.11 IBM.AI Model Lifecycle Management.2020 1

136、2 Machine Learning Operations.https:/ml-ops.org/13 ONAP.https:/www.onap.org/14 中国移动研究院,6G 服务化 RAN 白皮书,2022 15 中移动研究院,基于数字孪生网络的 6G 无线网络自治,2022 16 Li B,Qi P,Liu B,et al.Trustworthy AI:From Principles to PracticesJ.2021.17 IMT-20306G 网络架构愿景与关键技术展望白皮书,202109 18 IMT-20306G 总体愿景与潜在关键技术白皮书,202106 19 IMT-20

137、30通信感知一体化技术研究报告白皮书,202109 20 张钹,朱军,苏航.迈向第三代人工智能J.中国科学:信息科学,2020,50(09):1281-1302.52 21 张嗣宏,左罗.基于人工智能的网络智能化发展探讨J.中兴通讯技术,2019,25(02):57-62.22 乔秀全,黄亚坤.面向 6G 的去中心化的人工智能理论与技术J.移动通信,2020,44(06):121-125.23 OPPO.6G AI-Cube Intelligent Networking.White paperR.2021.53 缩略语 缩略语 英文全称 中文全称 AI Artificial Intellige

138、nce 人工智能 ICT Information and Communications Technology 信息与通信技术 AIaaS AI as a Service AI 即服务 QoAIS Quality of AI Service AI 服务质量 KPI Key Performance Indicator 关键绩效指标 CBD Central Business District 中央商务区 SSB System Synchronization Block 系统同步块 ID Identity 标识 QoS Quality of AI Service 服务质量 NMSE Normalize

139、d mean square error 归一化均方误差 ML Machine Learning 机器学习 XR Extended Reality 扩展现实 MEC Mobile Edge Computing 边缘计算技术 UPF User Plane Function 用户面功能 CFN Computing First Network 算力网络 RAN Radio Access Network 无线接入网 NC x Computing Node 计算节点 RRC Radio Resource Control 无线资源控制 CRC Computing Resource Control 计算资源控

140、制 xRC x Resource Control 资源控制实体 UE User Equipment 用户端 2B To Business 面向行业 2C To customer 面向消费者 GFLOPS Giga Floating-point Operations Per Second 每秒 10 亿次的浮点运算数 54 GPT Generative Pre-trained Transformer 生成型预训练变换器 AutoML Automated machine learning 自动机器学习 FPGA Field Programmable Gate Array 现场可编程逻辑门阵列 TP

141、U Tensor Processing Unit 张量处理单元 OTT Over The Top 越过运营商管道的业务 QoS Quality of Service 业务质量 QoI Quality of Information 信息质量 55 附录 对其他 TG 工作的技术需求表:TG 组 技术需求 TG1 从需求层面,是否需要有这么多的 QoAIS 指标?从 TG1 的角度,对于服务的具体模式出现的可能性是否有一些研究?(比如 AI 训练服务中,模型导入网络的方式是应用层注入还是底层分割?是仅应用层提供服务的模式,还是需要网络架构改动来提供服务?)广泛收集各类智能应用场景需求,进一步研究完善智能应用场景与 AI 用例的关系、AI 用例的描述模板。对于 AI for Network 方面,是否对于 6G 内生智能网络下的 AI 能力开放有具体的业务场景?TG3 研究可支持 AI 用例自生成的数据采集、存储、治理、传输等数据面架构。与 TG3 联合,协同完成对数据服务架构和相关功能的研究。TG4 研究可支持 AI 用例自生成的智能算法。当前部分 QoAIS 指标尚无成熟的量化评估方式(如模型的泛化性、可解释性、可重用性),如何在起始阶段设计出足够开放包容的网络架构以便后续逐步引入上述指标的成熟量化技术?

友情提示

1、下载报告失败解决办法
2、PDF文件下载后,可能会被浏览器默认打开,此种情况可以点击浏览器菜单,保存网页到桌面,就可以正常下载了。
3、本站不支持迅雷下载,请使用电脑自带的IE浏览器,或者360浏览器、谷歌浏览器下载即可。
4、本站报告下载后的文档和图纸-无水印,预览文档经过压缩,下载后原文更清晰。

本文(6GANA:6G网络内生AI网络架构十问(56页).pdf)为本站 (卢旭先生) 主动上传,三个皮匠报告文库仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。 若此文所含内容侵犯了您的版权或隐私,请立即通知三个皮匠报告文库(点击联系客服),我们立即给予删除!

温馨提示:如果因为网速或其他原因下载失败请重新下载,重复下载不扣分。
会员购买
客服

专属顾问

商务合作

机构入驻、侵权投诉、商务合作

服务号

三个皮匠报告官方公众号

回到顶部