《亚信科技&清华大学:2023年AIGC(GPT-4)赋能通信行业应用白皮书(132页).pdf》由会员分享,可在线阅读,更多相关《亚信科技&清华大学:2023年AIGC(GPT-4)赋能通信行业应用白皮书(132页).pdf(132页珍藏版)》请在三个皮匠报告上搜索。
1、 1 AIGC(GPT-4)赋能通信行业应用白皮书 A White Paper of AIGC(GPT-4)Empowering Telecom Sector 联合发布:AIGC(GPT-4)赋能通信行业应用白皮书 2 作者 亚信科技 欧阳晔 博士、IEEE Fellow 叶晓舟 博士 边森 宋勇 蒋勇 王宗学 刘志勇 张联华 赵立勋 杨川 罗峰 清华大学智能产业研究院 张亚勤 博士、中国工程院院士 刘云新 博士 刘洋 博士 詹仙园 博士 李元春 博士 李元哲 博士 张策 致谢 感谢王鹏、杜大江、张峰、英林海、李源林博士、陆由、阎华东、经琴等同仁对本白皮书编写做出的贡献。引用本白皮书 AIGC
2、(GPT-4)赋能通信行业应用白皮书,欧阳晔、张亚勤等,2023 年 3月。A White Paper of AIGC(GPT-4)Empowering Telecom Sector,Ye Ouyang,Ya-Qin Zhang,et al.2023.3.AIGC(GPT-4)赋能通信行业应用白皮书 3 亚信科技控股有限公司(股票代码:01675.HK)亚信科技是中国领先的软件产品及服务提供商,拥有丰富的软件产品开发和大型软件工程实施经验。公司深耕市场 30 年,在 5G、云计算、大数据、人工智能、物联网、数智运营、业务及网络支撑系统等领域具有先进的技术能力和众多成功案例,客户遍及通信、广电、
3、能源、政务、交通、金融、邮政等行业。2022 年,亚信科技完成收购商业决策服务领域的领先企业艾瑞市场咨询股份有限公司(艾瑞咨询),并整合形成新的“艾瑞数智”品牌。通过此次收购,亚信科技的核心能力从产品研发、交付服务、数据运营、系统集成延伸至咨询规划、智能决策,成为领先的数智化全栈能力提供商。亚信科技始终致力于将 5G、AI、大数据等数智技术赋能至百行千业,与客戶共创数智价值。公司以“产品与服务双领先”为目标,产品研发围绕数智、云网、IT及中台产品休系持续聚焦,实现行业引领,其中云网产品保持国际引领,数智产品实现国内领先,部分国际先进,IT 领域产品处于国内第一阵营。面向未来,亚信科技将努力成为
4、最可信赖的数智价值创造者,并依托数智化全栈能力,创新客户价值,助推数字中国。AIGC(GPT-4)赋能通信行业应用白皮书 4 清华大学智能产业研究院 清华大学智能产业研究院(Institute for AI Industry Research,Tsinghua Uni-versity,英文简称 AIR)是面向第四次工业革命的国际化、智能化、产业化研究机构。AIR 的使命是利用人工智能技术赋能产业升级、推动社会进步。通过大学与企业创新双引擎,突破人工智能核心技术,培养智能产业领军人才,推动智能产业跨越式发展。AIR 由多媒体及人工智能领域的世界级科学家、企业家张亚勤博士于 2020年 12 月
5、1 日创建。经过近两年的发展,研究院已汇聚了一批既懂科研又懂产业的人工智能领域学者,目前已初步形成了国际顶尖科学家、产业变革领袖、学术潜力骨干、交叉创新人才“四位一体”的人才布局,其中中国工程院外籍院士 1人、ACM Fellow 2 人、IEEE Fellow 5 人,各类学术人才荣誉 26 人次、59%的教师具有海外学历背景,78%的教师具有一线产业研发经历,59%的教师在 40岁以下。AIR 未来将持续引进人工智能与生命科学交叉领域尖端人才,构建具有交叉背景和人才梯度的高水平科研团队。AIGC(GPT-4)赋能通信行业应用白皮书 5 目录 一.前言.11 二.GPT-4研究.13 2.1
6、 AIGC与GPT-4.13 2.2 GPT-4的能力分析.16 2.3 GPT-4的技术原理.28 2.4 GPT-4的应用.34 2.5 下一个GPT是什么?.38 三.GPT-4赋能通信行业应用.41 3.1 通信IT领域的典型应用场景.41 3.1.1 智能开发.42 3.1.2 智能运维.52 3.1.3 智能营销.57 3.1.4 智能计费.65 3.1.5 智能客服.70 3.1.6 智能客户关系管理.75 3.1.7 商业智能.81 3.2 通信网络领域的典型应用场景.86 3.2.1 智能网络规划.86 3.2.2 智能网络部署.89 3.2.3 智能网络维护.92 3.2.
7、4 智能网络优化.96 3.2.5 智能网络运营.99 四.构建通信行业TelcoGPT.102 4.1 GPT-4的构建和应用问题.102 4.2 通信行业TelcoGPT.107 4.3 TelcoGPT如何构建?.108 4.4 亚信科技TelcoGPT实践.112 4.4.1 TelcoGPT文本大模型构建实践.112 4.4.2 TelcoGPT跨模态大模型构建实践.114 4.4.3 亚信科技AIGC平台实践.116 4.5 亚信科技可基于GPT类大模型赋能的产品系列.118 4.5.1 超级开发平台.118 AIGC(GPT-4)赋能通信行业应用白皮书 6 4.5.2 IT运维套
8、件.119 4.5.3 全域智能运维平台.120 4.5.4 通用人工智能平台.120 4.5.5 AI数智运营平台.121 4.5.6 场景计费产品.122 4.5.7 智能化客服系统.123 4.5.8 客户关系管理系统.124 4.5.9 数据探索分析产品.124 4.5.10 知识图谱产品.125 4.5.11 智能化网络规划优化平台.126 4.5.12 网络和业务编排系统.126 4.5.13 5G网络故障管理系统.127 4.5.14 智能用户体验管理平台.128 五.总结和展望.129 参考文献.131 AIGC(GPT-4)赋能通信行业应用白皮书 7 图目录 图 2-1 Ch
9、atGPT 发展历程.16 图 2-2 GPT-4 解释复杂名词.17 图 2-3 GPT-4 简化概念,解释复杂名词.17 图 2-4 GPT-4 以专业人士身份,解释复杂名词.18 图 2-5 GPT-4 根据特定要求或主题创作文章.19 图 2-6 GPT-4 与用户多轮对话进行推荐.20 图 2-7 GPT-4 智能生成代码.21 图 2-8 GPT-4 智能解释代码.22 图 2-9 GPT-4 智能修正代码.23 图 2-10 GPT-4 抽取文本中关键信息.24 图 2-11 GPT-4 智能分析文本和数据并制表.24 图 2-12 GPT-4 分析解决复杂问题.25 图 2-1
10、3 GPT-4 处理文本图片混合输入.26 图 2-14 Transformer 架构.29 图 2-15 RLHF 训练方法.33 图 3-1 GPT-4 对于软件研发生命周期的变革.42 图 3-2 GPT-4 帮助分析业务需求.44 图 3-3 GPT-4 辅助界面设计.45 图 3-4 引入 GPT-4 后开发人员日常工作场景.48 图 3-5 GPT-4 智能辅助编码.48 图 3-6 GPT-4 提升持续集成效能.50 图 3-7 GPT-4 快速生成单元测试用例.52 图 3-8 智能运维工作台运维协作场景.54 图 3-9 GPT-4 帮助分析故障.55 图 3-10 GPT-
11、4 智能修复 Kafka 配置错误.56 图 3-11 GPT-4 智能生成 ansible 程序代码.57 图 3-12 如何策划产品的回答.59 图 3-13 产品功能设计的进一步建议.60 图 3-14 关于产品广告词的问答.61 图 3-15 关于产品广告词的古诗词形式的问答.61 图 3-16 关于主动营销推荐的问答.62 AIGC(GPT-4)赋能通信行业应用白皮书 8 图 3-17 关于不同产品特性分析比较的问答.63 图 3-18 关于帮助客户产品下单的建议.63 图 3-19 关于产品营销分析的问答.65 图 3-20 GPT-4 根据计费数据给出情况解释.67 图 3-21
12、 GPT-4 智能将企业业财融合助力运营.68 图 3-22 GPT-4 举例风险交易行为.69 图 3-23 GPT-4 基于意图的算网方案推荐.70 图 3-24 GPT-4 基于客户情绪,智能化处理客户请求.72 图 3-25 GPT-4 根据客户提问,智能化生成解决方案.73 图 3-26 GPT-4 与客户交互式对话能力展示.75 图 3-27 GPT-4 人性化提问方式进行问卷调查.76 图 3-28 GPT-4 结合知识图谱信息进行推理,为客户经理挖掘潜在客户77 图 3-29 GPT-4 智能文本处理实现多源地址合并.78 图 3-30 GPT-4 智能文本处理实现用户地址匹配
13、.79 图 3-31 GPT-4 虚拟智能同伴应用案例 1.80 图 3-32 GPT-4 虚拟智能同伴应用案例 2.80 图 3-33 智能 BI 增强分析 VS 敏捷 BI 自助分析.82 图 3-34 BI 集成 GPT-4 实现数据问答.83 图 3-35 BI 集成 GPT-4 实现数据洞见.84 图 3-36 BI 集成 GPT-4 生成洞见报告.85 图 3-37 GPT-4 根据专业需求,生成无限网络规划方案.88 图 3-38 GPT-4 实现切片自动勘察.89 图 3-39 GPT-4 基于意图的传输专线网元配置激活.91 图 3-40 GPT-4 生成 5G 基站质检方案
14、.92 图 3-41 GPT-4 针对 PON 链路故障提供的解决方案.93 图 3-42 GPT-4 日志异常检测.95 图 3-43 GPT-4 智能网络能耗优化应用 1.97 图 3-44 GPT-4 智能网络能耗优化应用 2.97 图 3-45 GPT-4 关于云网优化的专业知识储备.98 图 3-46 GPT-4 实现云网业务融合运营.100 图 3-47 GPT-4 面向客户投诉的智能问答.101 图 4-1 GPT-4 生成事实性错误案例.104 图 4-2 GPT-4 知识库信息的时效性不强,缺乏分析时政能力.104 AIGC(GPT-4)赋能通信行业应用白皮书 9 图 4-3
15、 GPT-4 缺乏一些专业领域的相关知识.105 图 4-4 通信行业 TelcoGPT.108 图 4-5 Ernie-3.0-xbase 模型结构.112 图 4-6 OFA-large 模型结构.114 图 4-7 亚信科技 AISWare AI GC 产品功能架构图.116 图 4-8 超级开发平台架构.119 图 4-9 IT 运维套件整体架构.119 图 4-10 全域智能运维平台架构.120 图 4-11 通用人工智能平台架构.121 图 4-12 AI 数智运营平台架构.122 图 4-13 场景计费系统架构.123 图 4-14 智能化客服系统架构.123 图 4-15 客户
16、关系管理系统架构.124 图 4-16 数据探索分析产品架构.125 图 4-17 知识图谱产品架构.125 图 4-18 智能化网络规划优化平台架构.126 图 4-19 网络和业务编排系统架构.127 图 4-20 5G 网络故障管理系统架构.127 图 4-21 智能用户体验管理平台架构.128 AIGC(GPT-4)赋能通信行业应用白皮书 10 表目录 表 4-1 使用数据及算力资源.113 表 4-2 通信运营商客户投诉工单多分类和工单层级分类任务对比.113 表 4-3 图像文本数据样例.115 表 4-4 图像描述任务资源使用情况.115 表 4-5 图像描述任务效果对比.116
17、 AIGC(GPT-4)赋能通信行业应用白皮书 11 一.前言 2022 年被认为是人工智能生成内容(AIGC)元年。作为 AIGC 在自然语言领域的代表,ChatGPT 在 2022 年年底一经推出,就掀起了一场可能涉及所有人和所有行业的“大火”,2023 年 3 月 GPT-4 的发布则进一步推动了“态势升级”。由 ChatGPT/GPT-4 引发的全球关注,令许多人回忆起 2016 年 AlphaGo战胜人类围棋世界冠军的时刻。如果说 AlphaGo 代表了 AI 在专业领域战胜人类的起点,ChatGPT/GPT-4 似乎迈出了通用人工智能的第一步。这是第三次 AI 浪潮以来所有积累产生
18、的硕果,AI 技术到了一个即将大规模产业化的临界点。ChatGPT 将单调呆板的人机通信演进到前所未有的自然、高效、有创造力的人机协作,代表了生产力的提升。ChatGPT 有多重要?埃隆马斯克评价:“好得吓人,我们离危险的强人工智能不远了”。黄仁勋评价:“这是 AI 界的iPhone 时刻”。比尔.盖茨表示“和个人电脑和互联网的出现一样重要。是当前最重要的创新,将改变世界”。在 ChatGPT 的基础上,GPT-4 进一步在各种专业和学术基准测试中表现出“人类水平”的性能,在事实性、可引导性和可控制方面取得了“史上最佳结果”。当然,GPT-4在不是无所不能的,仍具有与早期GPT 模型相似的局限
19、性,如:犯常识性的错误、缺乏对新世界知识的了解、存在社会偏见、产生幻觉、推理错误等。但是我们看到其技术背后却具有一直优化、学习和进步的能力。在 ChatGPT/GPT-4 席卷全球的热潮中,人们已经深刻认识到人工智能作为经济社会发展中一项变革性技术与关键性力量,将为全球产业带来的巨大飞跃和突破式发展,深刻影响未来世界竞争格局。通信行业作为信息通信基础设施的建设者和运营者,既为 AI 的发展提供基础设施支撑,又是 AI 应用落地的领先者。AIGC(GPT-4)赋能通信行业应用白皮书 12 AIGC(GPT-4)如何赋能通信行业应用,通信行业如何落地 AIGC,这是通信业者必须要思考和回答的问题。
20、本白皮书通过对 AIGC 的典型代表 GPT-4 的研究,以场景化的形式对 GPT-4 如何赋能通信行业进行了分析,并针对通信行业如何构建行业 GPT 进行了初步探讨和实践。期待行业同仁围绕通信和人工智能协同创新,构建开放共享的创新生态,促进人工智能与通信产业的深度融合,加速构建下一代信息基础设施,助力经济社会数字化转型。AIGC(GPT-4)赋能通信行业应用白皮书 13 二.GPT-4 研究 2.1 AIGC 与 GPT-4 AIGC是继专业生成内容(PGC)和用户生成内容(UGC)之后,利用人工智能技术自动生成内容的新型生产方式。AIGC 根据其内容模态不同可分为文本、视频、图像,音频与跨
21、模态生成。文本方面,例如文本创作、代码生成、问答对话等;视频方面,例如视频画质增强、视频内容创作、视频风格迁移等;图像方面,例如图片编辑、图片生成、3D 图像生成等;音频方面,例如文本合成语音、语音克隆、音乐生成等;跨模态方面,如文字生成图片、文字合成视频、图像描述等,而且在不同内容模态的技术应用场景也有着各自的细分品类。ChatGPT 是 AIGC 发展的第一个丰碑。ChatGPT 是由人工智能研究公司OpenAI 在 2022 年 11 月发布的一个对话型大语言模型,是人工智能技术驱动的自然语言处理工具和应用。ChatGPT 的全称是 Chat Generative Pre-trained
22、 Transformer,顾名思义,就是以 Transformer 为基础架构,采用预训练和生成式方式构建的面向对话的大语言模型,是 AIGC 在文本方面的典型代表。ChatGPT 的主要用途是生成对话,它能够通过学习和理解人类的语言来进行对话,根据聊天的上下文进行自然、流畅的互动,还能完成邮件撰写、文案编写、文本翻译、代码生成等任务。ChatGPT 提供了前所未有的高效、自然的人机交互体验和极富创造力的内容生成能力,成为了 AI 时代的第一个“杀手级”应用。以 ChatGPT 为代表的生成式 AI 工具将使机器可以大规模参与知识类和创造性工作,极大提升生产力,涉及数十亿人方方面面的工作,可能
23、产生数万亿美元的经济价值。ChatGPT 覆 AIGC(GPT-4)赋能通信行业应用白皮书 14 盖了 NLP 所有领域,其所代表的大规模预训练语言模型(LLM)或基础模型已成为工业界和学术界最为关注的研究热点,并引领近期自然语言处理(NLP)乃至人工智能领域的研究范式的转变,对人工智能的技术发展可能产生重大影响。相距 ChatGPT 发布仅仅 4 个月,OpenAI 在 2023 年 3 月正式发布了多模态预训练大模型 GPT-4。GPT-4 支持图片和文本输入并生成文本输出,相比ChatGPT 增加了识图能力,并能够生成歌词、创意文本、学习用户的写作风格等,更具创造力和协作性。GPT-4
24、的输入限制提升至 2.5 万字,处理能力是 ChatGPT 的八倍,可用于长篇内容创作、扩展对话以及文档搜索和分析等应用场景,并可以用所有流行的编程语言写代码。GPT-4 的回答准确性大幅提高,性能优于现有的大型语言模型、以及当前最先进(SOTA,State Of The Arts)模型,虽然在许多现实场景中不太聪明,但在各种专业和学术基准上表现出了人类水平。ChatGPT 存在一定局限,如逻辑处理能力不够强,对上下文的理解仍然有限,多轮对话可能失控,缺乏一些通识能力,可能会出现创造不存在的知识,或者主观猜测提问者的意图,对 2021 年后的世界和事件了解有限。GPT-4 相较于ChatGPT
25、,不合规内容的响应请求降低了 82%,响应准确度提高了 40%,具备了更高的理解能力。但是 GPT-4 仍然具有与早期 GPT 模型相似的局限性,如:犯常识性的错误、缺乏对新世界知识的了解、存在社会偏见、产生幻觉、推理错误等。总的来说,ChatGPT 和GPT-4 是NLP 和人工智能领域划时代的标志,也昭示着人类向通用人工智能或强人工智能迈出了尝试性的一步。GPT-4 基于 Transformer 架构演进发展,其发展历程如下:l 2017 年 6 月,Google 发布论文Attention is all you need1,首次提出 Transformer 模型,成为 GPT 发展的基础
26、;AIGC(GPT-4)赋能通信行业应用白皮书 15 l 2018 年 6 月,OpenAI 发布论文Improving Language Understanding by Generative Pre-Training2(通过生成式预训练提升语言理解能力),首次提出 GPT-1 模型(Generative Pre-Training);l 2019 年 2 月,OpenAI 发布论文Language Models are Unsupervised Multitask Learners3(语言模型应该是一个无监督多任务学习者),提出 GPT-2 模型;l 2020 年 5 月,OpenAI 发布
27、论文Language Models are Few-Shot Learners4(语言模型应是一个少量样本(few-shot)学习者),提出 GPT-3 模型;l 2022 年 2 月底,OpenAI 发布论文Training language models to follow instructions with human feedback5(使用人类反馈指令流来训练语言模型),公布 Instruction GPT 模型;l 2022 年 11 月 30 日,OpenAI 推出 ChatGPT 模型并提供试用,自发布两个月内月活跃用户数已达 1 亿,成为史上用户数增长最快的消费者应用;l O
28、penAI GPT-4 模型于 2023 年 3 月 14 日发布,并已在微软的新版搜索引擎必应(Bing)上运行。AIGC(GPT-4)赋能通信行业应用白皮书 16 图 2-1 ChatGPT 发展历程 2.2 GPT-4 的能力分析 NLP 领域研究包括了众多子领域,从任务角度看可分为两大类:一类是中间任务,即自然语言理解任务,如中文分词、词性标注、句法分析、指代消解等;另一类是最终任务,即自然语言生成任务,如文本分类、文本摘要、机器翻译、文本对话等。随着 GPT 等 LLM 的出现,自然语言生成任务兼容覆盖了自然语言理解任务,中间任务逐渐退出,LLM 可以直接端到端实现最终任务。而Cha
29、tGPT/GPT-4 则用自然对话的人类表达的方式,提供了 LLM 与人的新型交互接口,以统一的接口方式支撑 NLP 的所有领域端到端最终任务。在日常对话中,ChatGPT 和 GPT-4 之间的差异很小。但是当任务的复杂性超过了某一阈值时,GPT-4 的表现则要优于 ChatGPT。此外,GPT-4 不仅能接受纯文本输入,还可以接受图片作为输入来完成图片描述、图片分类和图片分析任务,但该功能暂未对外开放,仍处于内测阶段6。下面以 GPT-4 对话接口的方式,通过示例进行GPT-4 端到端任务能力分析。多种风格解释复杂名词 多风格复杂名词解释指人工智能在解释一个名词时使用多种不同的风格或方式,
30、包含严谨、科技、幽默、简单易懂等风格。这种能力可以在不同的场景中得 AIGC(GPT-4)赋能通信行业应用白皮书 17 到应用,例如学术知识科普、复杂概念简化等。GPT-4能够以各种风格来扮演各种角色,向各种类型的用户解释一些复杂的名词。例如,向 GPT-4 询问通信行业的 5G 网络技术时,它所产生的回答如下图 2-2。图 2-2 GPT-4 解释复杂名词 上述 GPT-4 对于5G 网络的解释,可能很难让一个5 岁的孩子快速理解。当告诉 GPT-4,需要 GPT-4 简化概念,向一个 5 岁的孩子介绍时:图 2-3 GPT-4 简化概念,解释复杂名词 AIGC(GPT-4)赋能通信行业应用
31、白皮书 18 而对于一些想深入了解 5G 网络其中所运用到的技术的用户而言,GPT-4 能够以一个通信网络工程师的身份,向用户介绍 5G 网络的概念:图 2-4 GPT-4 以专业人士身份,解释复杂名词 特定要求或主题创作文章 AI 写作根据用户给定的输入生成符合语法和语义要求的文本内容,包括新闻报道、技术介绍、小说、商业信函等等。在 AI 写作的应用场景中,人们通常会提供一些初始的输入,例如主题、文章结构等等特定要求,AI 会根据这些输入自动生成对应的文本内容。与传统的人工撰写相比,AI 写作可以大大提高工作效率,同时还可以生成更加多样化和精准的文本内容,因此越来越受到各行各业的关注和应用,
32、图 2-5 为 GPT-4 所撰写的关于 AIGC 的文章:AIGC(GPT-4)赋能通信行业应用白皮书 19 图 2-5 GPT-4 根据特定要求或主题创作文章 对话机器人 对话机器人要求人工智能理解用户的语言输入,并根据用户需求和问题生成相应的回答。用户可以通过对话机器人进行语音或文字交互,就像与真人交谈一样,从而获得所需的信息和服务。对话机器人可以应用于多种场景,例如客户服务、虚拟助手等。在客户服务领域,对话机器人可自动回答客户的常见问题,解决客户的问题,减少客服工作量,提高客户满意度;在虚拟助手领域,对话机器人可以帮助用户完成日常任务,如提醒、查询、推荐、预定等,图 2-6 为 GPT
33、-4根据用户的具体需求而推荐的购机指南:AIGC(GPT-4)赋能通信行业应用白皮书 20 图 2-6 GPT-4 与用户多轮对话进行推荐 辅助进行代码编写、Debug 及解释 GPT-4具有非常强大的代码生成能力,可以生成、修正各种编程语言的代码片段。具体而言,GPT-4的代码生成能力主要基于两个方面:一是其能够理解并生成自然语言描述的程序逻辑;二是其能够生成符合编程语言语法规则的代码。GPT-4通过对大量程序源代码和自然语言描述的语料进行训练,学习到程序的逻辑结构和语义含义。当输入一段自然语言描述的程序逻辑时,GPT-4可以理解其 AIGC(GPT-4)赋能通信行业应用白皮书 21 中的含
34、义并生成对应的代码。GPT-4的训练数据也包括大量的符合编程语言语法规则的代码片段,因此它可以很好地遵循编程语言的语法规则生成代码。GPT-4还可以结合常见的编程库和框架生成相应的代码,比如生成使用 Scikit-learn 进行机器学习训练的 Python 代码。图 2-7 为 GPT-4 使用 Python 编程语言和机器学习框架 Scikit-learn 进行机器学习训练的代码:图 2-7 GPT-4 智能生成代码 AIGC(GPT-4)赋能通信行业应用白皮书 22 GPT-4 具备代码解释能力。对于一些缺少注释的代码,GPT-4 也能够自动识别代码块的编程语言,代码块的缩进等,以代码注
35、释的方式向用户解释每行代码的具体作用:图 2-8 GPT-4 智能解释代码 AIGC(GPT-4)赋能通信行业应用白皮书 23 GPT-4 具备代码修正能力。GPT-4 能够自动识别代码块中所存在的错误并给出合理的解释并修正:图 2-9 GPT-4 智能修正代码 文本知识抽取 文本知识抽取是指人工智能从自然语言文本中提取结构化或半结构化的信息或知识。对于 GPT-4 而言,用户仅需要输入特定的文本抽取任务和待抽取的文本,GPT-4 就能够抽取出文本中的关键性实体,对于苹果即将上市的iPhoneSE4 智能手机配置信息,GPT-4 的抽取结果如下图 2-10:AIGC(GPT-4)赋能通信行业应
36、用白皮书 24 图 2-10 GPT-4 抽取文本中关键信息 阅读理解与分析 阅读理解与分析任务要求人工智能不仅仅能理解和抽取文本中的关键字词,还能够推理出更加深入的信息和数据。对于 2022 年亚信科技公司的年中财报数据,GPT-4 不仅仅能够将文本中的关键数字提取并列表,还能够推理出 2021 年的三新业务收入、三新业务收入占比等:图 2-11 GPT-4 智能分析文本和数据并制表 AIGC(GPT-4)赋能通信行业应用白皮书 25 复杂问题分析 GPT-4具有更渊博的知识和更强大的解决问题的能力,它可以以更高的精度分析解决复杂的问题:图 2-12 GPT-4 分析解决复杂问题 AIGC(
37、GPT-4)赋能通信行业应用白皮书 26 图文分析 GPT-4可以同时接受文本和图片输入,通过分析图片内容,结合输入文本作出合理回复6:图 2-13 GPT-4 处理文本图片混合输入 AIGC(GPT-4)赋能通信行业应用白皮书 27 从上述分析示例看,GPT-4 展示了四个极为重要的能力:l 为人类提供世界知识:GPT-4 拥有庞大的世界知识,包括事实性知识和常识,相比之前的 LLM 覆盖了更多的主题和知识。不仅可以提供知识的查询和检索,而且可以进行知识的归纳和总结,甚至提供简单的知识推理和证明能力。l 为人类与 LLM 之间提供了符合人类习惯的交互方式:以遵循提示(prompt)并生成补全
38、提示词的句子的语言生成方式,通过上下文学习保持对话一致性,能理解人类意图并用自然语言回答问题、生成内容和解决问题,改变了现有人机互动方式及人类获取世界知识的方式。l 为人类提供了跨语言及多模态交流能力:不仅可以处理多种人类语言,还可以理解图片内容,为人们提供更加便捷的交流,此外还可以将人类语言与机器语言进行相互翻译,促进了人机物三元世界的融合。l 具备了自我学习,自我进化的能力:能够自动从海量数据和人类指令中学习到其中的世界知识,学习过程不需要人的介入,而且可以自行检查学习成果并不断优化迭代,能灵活应用所学知识来解决实际问题。当然,我们也看到,由于 GPT-4 是基于通用公开数据进行训练,缺少
39、各行业领域的非公开的专业数据。这就造成其世界知识中缺乏深度的专业知识。因此,虽然在与人类进行沟通中,可以进行百科全书式的回答,但距离真正满足专业场景,还有相当大的差距。AIGC(GPT-4)赋能通信行业应用白皮书 28 2.3 GPT-4 的技术原理 GPT-4 是第四代 GPT 模型,但是技术原理上与 GPT-3.5 版本的 ChatGPT更为接近。ChatGPT 的技术特征已经包含在其全称 Chat Generative Pre-trained Transformer 中,是针对对话(Chat)进行的专门优化,GPT-4 全部保留了上述技术特征。Transformer 是 GPT 系列的基
40、础架构,预训练和生成式是其成功之匙。本节通过 Transformer、GPT-1、GPT-2、GPT-3、InstructGPT、ChatGPT等一系列 GPT 技术的演进脉络分析,阐述 GPT-4 的技术原理。2017 年,谷歌大脑团队在机器学习与人工智能领域顶会 NeurIPS 发表了“Attention is all you need”论文,首次提出了基于自注意力机制(self-attention)的变换器(Transformer)模型并用于自然语言处理。相比于传统的循环神经网络(RNN)或卷积神经网络(CNN),Transformer 采用自注意力机制、多头注意力机制、前馈网络、残差连
41、接等技术,具有更好的长距离特征捕获能力、特征提取能力和并行运行效率1。这些能力使 Transformer 可以处理更大量的数据,形成更大规模的网络,从而引发了预训练模型的形成,并进一步使其在自然语言处理任务中获得出色表现。Transformer 的诞生,深刻地影响了接下来几年人工智能领域的发展,标志着预训练大模型的开始7。在不同的场景中,Transformer 衍生出了不同架构。例如,在生成性任务中,GPT-3 是基于自回归序列思路的模型8;在自然语言理解任务中,BERT 是基于 Transformer+Mask的自编码序列思路的模型9;在条件文本生成任务中,T5 使用 Encoder-dec
42、oder架构,利用双向或单向 attention 来解决条件文本生成任务 10。AIGC(GPT-4)赋能通信行业应用白皮书 29 图 2-14 Transformer 架构 GPT-1 模型基于 Transformer 解决了顺序关联和依赖性的问题,并采用生成式方式,重点考虑了从原始文本中有效学习的能力。在 GPT-1 中,采用了 12 个Transformer 块的结构作为解码器,每个 Transformer 块是一个多头的自注意力机制,然后通过全连接得到输出的概率分布2。GPT-1 的训练分为无监督的预训练和有监督的模型微调,这对于减轻自然语言处理中对监督学习的依赖至关重要。但是,GPT
43、-1采用的是自回归序列的架构,难以处理过长的文本。在生成长文本时,GPT-1会出现信息遗忘和重复等问题。在某些特定任务上,如机器翻译等,其表现并不如其他特定领域的模型表现出色。GPT-2的目标是训练一个泛化能力更强的词向量模型,通过使用无监督的预训练模型做有监督的任务,尝试解决 zero-shot(零次学习问题)3。GPT-2 没有对 AIGC(GPT-4)赋能通信行业应用白皮书 30 GPT-1的网络进行过多的结构创新与设计,只是使用了更多的网络参数和更大的数据集。GPT-2的最大贡献是验证了通过海量数据和大量参数训练出来的词向量模型可以迁移到其他任务中,而不需要额外的训练。然而实验表明,G
44、PT-2的无监督学习和零次学习结果未达预期。GPT-3 在 GPT-2 追求无监督和零次学习的特征基础上进行了改进,转而追求无监督模式下的 few-shot(少量学习)。GPT-3 在网络容量方面有了巨大提升,基于 45TB 的文本数据训练,在多个 NLP 数据集上实现了出色的性能4,具体来说:采用了 96 层的多头 Transformer,每层有 96 个头;词向量长度为 12888;上下文窗口大小提升至 2048 个 token;采用 alternating dense 和 locally banded sparse attention。GPT-3 能够生成高质量的文本,但有时在编写长句并
45、反复重复文本序列时可能会失去连贯性。而且无监督模式下的 few-shot 效果仍然略逊于 fine-tuning 监督微调的方式。InstructGPT 是基于 GPT-3 的一轮增强优化,所以也被称为 GPT-3.5。In-structGPT 采用了人类反馈的强化学习方案(RHLF),对 GPT-3 增加了监督微调,进一步增加了奖励模型,通过训练出的奖励模型指导语言模型的学习即增强学习优化5。这个过程是可以多次迭代优化的,因此 InstructGPT 自动化的实现了比 GPT-3 更好的性能,同时减少了参数的数量。ChatGPT 采用 InstructGPT 相同结构的模型,针对 Chat
46、进行了专门的优化,同时开放到公众测试训练,以便产生更多有效标注数据。基于人类反馈的强化学习(RLHF)方法的使用是 ChatGPT 区别于其他生成类模型的最主要原因,该方法帮助模型尽量减少有害的、不真实的及有偏见的输出,提升自然沟通效果。同时,为了更好地支持多轮对话,ChatGPT 引入了一种基于堆栈的上下文管理的机制,帮助 ChatGPT 跟踪和管理多轮对话中的上下文信息11。ChatGPT 将上 AIGC(GPT-4)赋能通信行业应用白皮书 31 下文压入堆栈,并通过堆栈中的上下文信息使用注意力机制对齐用户的意图和之前的对话内容,并根据对话历史生成响应,从而在多轮对话中生成连贯自然的回复。
47、GPT-4 与之前的 GPT 模型一样,是一个基于 Transformer 的预训练模型,使用公共可用数据(如互联网数据)和第三方提供商许可的数据来预测文本中的下一个词。然后使用人类反馈强化学习(RLHF)对模型进行微调。在此基础上GPT-4 使用了更多的数据,基础模型的训练数据包括数学问题的正确和错误解决方案、弱推理和强推理、自相矛盾和一致的陈述,以及各种各样的意识形态和想法,同时建立了一个可预测扩展的深度学习堆栈6,为了解决对于像 GPT-4这样的大型模型训练,对特定任务微调是不可行的问题,这也是 GPT-4 的一大重点,OpenAI 团队开发了基础设施和优化方法,通过使用自回归生成模型的
48、缩放定律12,对大规模语言模型最终损失进行预测,增加可预测扩展,减少计算量。GPT-4 涉及到技术重点包括:指令微调(Instruction Fine-Tuning,IFT)、有监督微调(Supervised Fine-tuning,SFT)、人类反馈强化学习(Reinforce-ment Learning From Human Feedback,RLHF)、思维链(Chain-of-thought,CoT)等,下述对这些关键技术做进一步介绍:IFT 是为了解决基础模型未遵循用户的指令时,对基础模型的微调。在基础模型的语言建模目标不足以让模型学会以有用的方式遵循用户的指令,IFT 方法除了使用
49、情感分析、文本分类、摘要抽取等经典 NLP 任务来微调模型外,还在非常多样化的数据集上向基础模型示范各种指令及输出,从而实现对基础模型的微调14。指令示范主要由指令、输入和输出组成,输入是可选的,一些任务只 AIGC(GPT-4)赋能通信行业应用白皮书 32 需要指令,例如 ChatGPT 和 GPT-4 做开放式文本生成任务,当存在输入时,输入和输出组成一个实例,给定指令可以有多个输入和输出实例。IFT 的训练数据通常是人工编写的指令或用语言模型生成的实例,在语言模型生成中,先使用少样本技术输入一些样本给 LM 用户提示它,然后要求 LM 生成新的指令、输入和输出,每一轮都会从人工编写的样本
50、和模型生成的样本中各选择一些送给模型。经过 IFT 的 LM 生成的结果并不一定是有帮助的或安全的,比如通过给出诸如“对不起,我不明白”的模棱两可的或者无益的结果,为了减轻这种行为,需要在高质量的人类标注数据上微调基础的语言模型,以提高有用性和无害性。SFT 和IFT 联系非常紧密,IFT 可以看作是SFT 的一个子集,模型开发人员在开发过程中,常把 SFT 阶段用户提高生成的安全性,而不是接在 IFT 后面提高指令相应的具体性13。RLHF 是 InstructGPT、ChatGPT、GPT-4 成功的关键之一。在 RLHF 中,根据人类反馈来对模型的响应进行排序标注(如,根据人类偏好选择文
51、本简介)。然后,用这些带标注的响应来训练偏好模型,该模型用于返回 RL 优化器的标量奖励。最后,通过强化学习训练对话代理来模拟偏好模型。基于 RLHF 的 GPT-4 训练方法由三个不同的步骤组成11,如图 2-15 所示。AIGC(GPT-4)赋能通信行业应用白皮书 33 图 2-15 RLHF 训练方法 步骤 1:对基于监督学习获取的 GPT-3.5 模型进行微调,得到 SFT 模型。微调是使用问题/答案对完成的。首先会在数据集中随机抽取问题,由人类标注人员,给出高质量答案,然后用这些人工标注好的数据来微调 GPT-3.5 模型,通过对输入和输出数据的拟合来改进网络,调整模型的参数。此时的
52、 SFT 模型在遵循指令/对话方面已经优于 GPT-3,但不一定符合人类偏好。步骤 2:标注排序数据集,训练奖励模型 RM:这个阶段的主要是通过人工标注训练数据,来训练回报模型。在数据集中随机抽取问题,使用第一阶段生成的模型,对于每个问题,生成多个不同的回答。人类标注者对这些结果综合考虑给出排名顺序。这一过程类似于教练或老师辅导。接下来,使用这个排序结果数据来训练奖励模型。对多个排序结果,两两组合,形成多个训练数据对。RM 模型接受一个输入,给出评价回答质量的分数。这样,对于一对训练数据,调节参数使得高质量回答的打分比低质量的打分要高。AIGC(GPT-4)赋能通信行业应用白皮书 34 步骤
53、3:使用强化学习方法 PPO 进一步微调 SFT:PPO 的核心思路在于将Policy Gradient 中 On-policy 的训练过程转化为 Off-policy,即将在线学习转化为离线学习,这个转化过程被称之为 Importance Sampling。这一阶段利用第二阶段训练好的奖励模型,靠奖励打分来更新预训练模型参数。在数据集中随机抽取问题,使用 PPO 模型生成回答,并用上一阶段训练好的 RM 模型给出质量分数。把回报分数依次传递,由此产生策略梯度,通过强化学习的方式以更新 PPO 模型参数。其中,步骤 1 只进行一次,步骤 2 和步骤 3 可以进行多次迭代以得到效果更好 RM 和
54、 SFT 模型。CoT 提示15是指令示范的一种特殊情况,它通过引发对话代理的逐步推理来生成输出。使用 CoT 微调的模型在涉及常识、算术和符号推理的任务上表现得更好14,CoT 微调也显示出对无害性非常有效(有时比 RLHF 做得更好),而且对于敏感提示,模型不会回避并生成“抱歉,我无法回答这个问题”这样的无益回答13。总的来看,GPT-4 的世界知识能力来源于大数据和大模型,预训练大模型和指示学习的泛化能力,带来了模型强大的理解能力,可以显著降低人工智能应用门槛。同时,IFT、SFT、RLHF、CoT 的极致应用使 GPT-4 的输出与人类的意图对齐,带来了自然、客观、翔实的交互。2.4
55、GPT-4 的应用 在 ChatGPT 和 GPT-4 相继公布后,这一波由深度学习驱动的人工智能技术长驱直进,对人类社会产生了巨大影响。据报道1617,89%的美国大学生已经 AIGC(GPT-4)赋能通信行业应用白皮书 35 在用 ChatGPT 写作业,ChatGPT 通过职位年薪 18 万美元的谷歌 L3 工程师入职测试,也通过了美国执业医师资格考试。微软已经迅速将 Bing 搜索接入了GPT-4。在为人类设计的学术专业考试上,测试模型理解能力,GPT-4 能排到TOP10%,GPT-3.5 排在尾部 10%6。在传统 NLP 测评数据集上,GPT-4 超越了所有语言模型与大部分 SO
56、TA 模型,在其他语言上测试结果:26 个测试语言中,24 种语言 GPT-4 优于 GPT3.5 与其他语言模型6。可以预见,基于前述分析展现出来的 GPT-4 的强大生产力和巨大潜力,GPT-4 与各行各业应用相结合,将在多领域、多功能应用中密集落地18。l 传媒领域:提升新闻效率,促进网络媒体安全 GPT-4 可以帮助新闻媒体工作者智能生成新闻报道,通过智能方式优化重复劳动性的采编工作。过往新闻智能写作的成功案例众多,例如中国地震网的写稿机器人在九寨沟地震发生后 7 秒内就完成了相关信息的编发;美联社使用的智能写稿平台 Wordsmith 可 以 每 秒 写 出 2000 篇报道。同时
57、GPT-4 强大的看图说话能力,整合互联网信息采集技术及信息智能处理技术,可以形成简报、报告、图表等分析结果,为全面掌握传媒思想动态,做出正确舆论引导,提供分析依据。l 影视领域:拓宽创作素材,降低后期优化成本 GPT-4 可以为剧本素材的创作提供新思路,创作者可根据大众兴趣使用GPT-4 生成内容,再进行筛选和二次加工,从而激发创作者的灵感,开拓创作思路,缩短创作周期。还可以根据长篇小说、传记、诗歌定制影视内容,从而更有可能吸引爱好者的注意力,获得更好的收视率、票房和口碑。2016 年,纽约大学利用人工智能编写剧本Sunspring,经 AIGC(GPT-4)赋能通信行业应用白皮书 36 拍
58、摄制作后入围伦敦科幻电影 48 小时前十强;国内海马轻帆科技公司推出的“小说转剧本”智能写作功能,服务了包括你好,李焕英流浪地球等爆款作品在内的剧集剧本 30000 多集、电影/网络电影剧本8000 多部、网络小说超过 500 万部。l 营销领域:打造虚拟客服,提升品牌形象和服务态度 GPT-4 可以打造虚拟客服,助力产品营销,GPT-4 虚拟客服可以 24 小时不间断的提供服务,而且不会像人类客服一样产生疲劳。同时,虚拟人客服可以同时处理多个用户的问题,不会像人类客服一样需要等待处理完一个用户的问题后才能接待下一个用户。这使得虚拟客服在高峰期能够更好地应对客户的需求。此外,虚拟客服还可以自我
59、进化和优化自己的服务,提高自己的准确性和服务质量。同时随着 GPT-4 在多模态、复杂计算、多语言理解等方面的提升,使得虚拟客服的服务水平可以为客户提供更加优质的服务。l 文娱领域:加强人机互动,丰富虚拟现实趣味 GPT-4 可以讲故事、创作小说;可以生成歌词,增加音乐创作的灵感;可以解读图片,满足探索未知渴望;可以作为闲聊机器人,尤其图文交互,增加趣味性;可以作为知识检索库,增强对未知的理解,尤其在游戏方面,GPT-4 作为一种基于自然语言处理的人工智能技术,可以帮助游戏开发人员制作出更加智能的游戏。它可以在游戏中生成任务描述,并帮助玩家解决游戏中的问题。此外,GPT-4 还可以用于生成 N
60、PC 的对话,从而让游戏的故事更加生动。AIGC(GPT-4)赋能通信行业应用白皮书 37 l 教育领域:激发教材活力,释放孩子探索天性 GPT-4 能够帮助研究人员撰写连贯、(部分)准确、信息丰富且系统的论文,写作效率极高(2-3 小时),而且不需要作者有丰富的专业知识。即使作者改变了主题,GPT-4 也能给出完全相同格式的回答。除了直接作用于文案本身,在接入 GPT-4 以后,在线教育的模式和质量也会有明显的变化。比如,在教学过程中,老师往往会面临跨学科教学,学生的一些问题也需要老师长时间思考才能解答,但如果使用 GPT-4,就可以第一时间为学生提供快速简便的问题答案;一些重复性的问题,G
61、PT-4 就可以直接代替老师回答,让老师腾出大量时间在思想创造力上发挥更大价值;尤其是对不知道如何描述问题或者问题本身就是一些图片,GPT-4 可以从多个维度给出问答答案。l 金融领域:促进风控安全,保驾金融科技稳步发展 GPT-4 在金融领域的应用范围非常广泛,包括且不限于:欺诈检测和风险管理、客户服务与支持、客户意图识别及精准营销,对金融市场的信息处理和决策辅助等。反欺诈 GPT-4 可以快速识别和分析怀疑欺诈的数据,并在接收到异常请求时进行快速反应,以确保客户在资金交易过程中的安全;金融风险控制金融机构需要不断地进行风险评估和风险控制,GPT-4 可以通过对历史数据的学习,生成预测模型,
62、帮助机构进行风险评估和风险控制;金融舆情分析金融机构需要对市场和客户的情绪进行分析,以便做出正确的投资决策,GPT-4 可以通过对大量社交媒体和新闻数据的学习,生成情感分析模型,帮助机构了解市场和客户的情绪变化;充当研究助理 GPT-4 可以结合金融行业的信息,构建知识库问 AIGC(GPT-4)赋能通信行业应用白皮书 38 答系统。对于一些初级的资料信息和数据分析提取,使用者通过询问可以快速找到相关问题的答案。l 医疗领域:提高诊断能力和效率,减负医护人员 GPT-4 的复杂名词解释、知识抽取能力、多轮对话能力、复杂问题分析、图文分析能力等,可以在医学影像诊断、临床辅助决策、精准医疗辅助、健
63、康管理、医疗信息化、医药研发以及医疗机器人等细分场景中全面开花,以助力降本增效、提升医疗水平、改善患者体验、降低患病风险等为目的,全面赋能院前、院中、院后各个环节。哈佛大学一项研究表明:在不同严重性的 45 个真实病例中,ChatGPT 能够对 39 个病例(87%)做出正确的诊断,而同样的病例,人类医生的准确性可达84%,其他工具准确率只有 51%,GPT-4 预计会达到更高的诊断精确率。2.5 下一个 GPT 是什么?ChatGPT 属于 AIGC 的范畴,代表了文本生成领域的最新进展。GPT-4 则增加了图到文的生成,具备了图片识别的能力。下一个 GPT 预计将支持更多模态的 AIGC,
64、即除文本生成之外,还可以生成图片、视频、音频等模态。与仅使用语言或仅使用视觉相比,构建良好的多模态模型更是一项极具挑战性的任务。但如同 Transformer 架构从语言走向视觉领域,下一个 GPT 或者 LLM 模型,必将向文本、图片、音频、视频等跨领域多模态 AIGC 不断发展演进。AIGC(GPT-4)赋能通信行业应用白皮书 39 Google、Stability AI、OpenAI、百度、阿里等公司已经开始多模态内容生成模型研发,并开源部分模型,比如图片生成的 Stable Diffusion19、音乐生成的 MusicLM20、视频生成的 Dreamix21等。在文本生成场景中,可以
65、分为非交互式生成和交互式生成。非交互式文本生成场景中,结构化写作其形式相对固定,生成难度较小,商业化应用较为广泛,例如公司财报简讯、新闻简讯、专业文书等,而创作型写作开放性较大,在长文本生成中难度较大,仍需技术进一步发展,相比于结构化的文本,创作型文本具有更高的开放度与自由度,需要一定的创意与个性化22,如营销文案、广告语、客服话术等。交互式文本生成场景主要以聊天机器人为代表,在基于上下文中信息进行文本交互,如客服问答、闲聊机器人、知识检索库等。在图像生成场景中,模型结构不断进化提高了 AIGC 生产图像的多样性,但要求较高的功能实现还有待于技术的进一步提升。“图像编辑”难度低于“图像生成”与
66、“2D-3D”转换,目前已存在多款产品支持“图像编辑”,而对于“图像生成”任务,由于图片相较包含更多元素,其生成效果仍存在不稳定性,对于要求较高的功能类图像生成仍需要技术上的提升23。音频生成场景中,文本到语音任务已比较成熟,语音质量已达到自然的标准,未来将朝更富情感、富韵律的语音合成以及小样本语音学习方向发展。但音乐生成任务中仍需解决音乐数据难以标注的问题,数据标注的颗粒度大小影响音乐生成任务的可控性。若可控性得以解决,则可指定风格、情绪等因素的音乐生成任务有希望在影视、游戏等场景下得到大量应用24。视频生成场景中,视频生成本质上与图片生成类似,通过对视频进行帧数级别的切割,实现对每一帧的处
67、理。视频生成过程包括三个阶段:数据的提取、训练和转换,当前技术正在着重提升视频修改精准度和实时性两个维度。鉴于视频 AIGC(GPT-4)赋能通信行业应用白皮书 40 本身的文本、图像和音频的综合属性,视频生成也是跨模态生成领域的重要应用场景。跨模态生成场景中,现实世界的信息是文本、音频、视觉、传感器以及人类各种触觉的综合体系,要更为精准地模拟现实世界,就需要将各种模态能力之间打通,例如文字-图像、文字-视频等跨模态生成能力 大型预训练模型的发展使得跨模态逐步成熟,“文本-图像”生成正在快速落地,“文字-视频”的实验效果也已较为理想(视频时长、清晰程度、逻辑等还有较大提升空间)。AIGC(GP
68、T-4)赋能通信行业应用白皮书 41 三.GPT-4 赋能通信行业应用 通信技术与人工智能技术在 3G 阶段开始融合发展,到 5G 阶段开始深度融合发展。“5G 与人工智能”已被业界视为一组最新的通用目的技术组合,对垂直行业的发展起到提振生产力与赋能的作用。亚信科技携手中外运营商、清华大学智能产业研究院等工业和学术界伙伴,陆续发布了通信人工智能的下一个十年25、通信人工智能赋能自智网络26、算力网络的第一个十年、BSS/OSS 融合的下一站27、下一代电信 IT 架构初探:业务功能虚拟化(BFV)28等著述,介绍了通信人工智能及其方法主旨、路径与框架。人工智能赋能通信行业已在产业界的努力下取得
69、了丰富的实践成果。随着 GPT-4 带来更加先进的生产力,人工智能将进一步从各个层面深度赋能通信业,推动我国智能通信网络的演进升级和落地应用。本章将重点通过 ChatGPT/GPT-4 所采用的对话框方式进行其赋能通信行业应用的场景化分析。由于 GPT-4 尚未开放“图到文”的测试,以下场景分析以“文到文”方式为主进行展现。可以想象,后续多模态(图像识别)的 GPT-4商用版本,将为通信行业应用带来更加丰富的赋能场景。3.1 通信 IT 领域的典型应用场景 通信 IT 域覆盖范围非常广泛,以下将从智能开发、智能运维、智能营销、智能计费、智能客服、智能客户关系管理、商业智能等方面,针对 GPT-
70、4 如何赋能通信 IT 域进行分析。AIGC(GPT-4)赋能通信行业应用白皮书 42 3.1.1 智能开发 每个 IT 组织都不遗余力的关注研发效能提升,十多年来智能开发不断迭代演进,对研发生命周期的需求、设计、开发、集成、测试、发布等关键阶段进行了不断实践。随着人工智能技术的发展,研发工作已经不再是传统的代码编写和测试工作,越来越多的研发人员需要处理大量的文本、语言数据和自然语言处理的任务。在研发领域中,GPT-4可以作为一种辅助工具,帮助研发人员更快速、更高效地进行开发和测试工作,从而提高研发效率和质量。此外,GPT-4还可以用于智能化的文档生成、自动化测试用例生成、智能化代码审查和优化
71、、智能化项目管理等领域,为研发团队提供更全面、更高效的支持和帮助,从而提高整个研发流程的效率和质量。借着 GPT-4 的东风,通过其对软件研发各个阶段的全面赋能,软件研发也将进入一个新的智能研发时代。图 3-1 GPT-4 对于软件研发生命周期的变革 场景一:GPT-4 赋能需求研究、分析和处理 在需求阶段,为了更好地理解和管理需求,优化研发流程,减少重复工作和错误,提高研发效率和质量,相关研发效能提升适用的场景主要有:1.用户研究:在需求阶段进行用户研究,了解用户需求和痛点,以此来确定产品或系统的功能和特性,从而确保产品或系统能够满足用户需求,避免开发出无用或者不受欢迎的功能。GPT-4 引
72、入可以很大程度的提升 AIGC(GPT-4)赋能通信行业应用白皮书 43 用户研究的效率,提升需求的理解;可以更好地处理自然语言输入,使得需求文档的编写更加自然和简单;可以理解文本中的上下文、语义和逻辑关系,从而更好地理解需求。2.需求文档:采用产品化思维,将需求阶段看作产品开发的一部分,强调需求的用户价值和商业价值,以此来提高产品的市场竞争力和用户满意度,从而提高研发效能。GPT-4 可以在自动化生成、智能协助方面提升需求文档的质量和编写效率。基于 GPT-4 的技术,可以通过输入简单的文本或问题,自动生成相关的需求文档、用例和其他文档。这样可以节省研发人员的时间和精力,同时减少文档编写的错
73、误。GPT-4 可以智能地协助需求编写和管理。例如,它可以根据之前编写的需求文档或历史数据,提供自动建议或纠错建议,使得需求文档的编写更加准确和高效。3.需求管理:使用需求管理工具,对需求进行统一管理、跟踪和分析,以便研发团队能够更好地理解需求,掌握需求状态和变化,从而更好地管理需求和优化研发流程。GPT-4 的引入,更好的管理需求相关的知识。GPT-4 可以将需求阶段的知识整合、管理和归档,使得知识能够得到更好的传承和沉淀。这样可以提高研发团队的知识共享和协同效率,同时也能够更好地应对团队流动性和知识遗漏的问题。此外,还可以提升可视化呈现的效果。GPT-4 可以将需求文档和其他相关文档进行可
74、视化呈现,例如生成流程图、状态图等,使得需求文档更加易于理解和使用。这样可以提高需求文档的可读性和易用性,从而更好地支持研发流程。AIGC(GPT-4)赋能通信行业应用白皮书 44 需求分析人员,借助GPT-4,可以快速沟通澄清需求,需求文档可读性大大增强,需求变更管理将变得更加轻松。集成协同音视频的能力,拉通上下游的沟通,随时随地的发起快速沟通。需求分析,从原先以周为单位,降低到以小时为单位,人员效能提升 100 倍以上。图 3-2 GPT-4 帮助分析业务需求 场景二:GPT-4 辅助原型设计 在设计阶段,帮助设计师快速构建设计原型和模型,可适用的场景主要有:1.设计原型:采用设计原型工具
75、,如 Sketch、Figma、Axure 等,快速构建交互原型,提高设计效率和设计质量。设计原型可以在设计初期帮助设计师与相关方进行充分的沟通和交流,减少后期的设计修改,提高设计效率。引入 GPT-4 可以提升快速原型构建的能力。GPT-4 可以生成交互原型,提高原型构建效率。设计师可以将自然语言描述输入 GPT-4,生成相应的交互原型,避免手动构建原型的繁琐和耗时,同时提高 AIGC(GPT-4)赋能通信行业应用白皮书 45 原型的质量和准确性。同时,GPT-4 也可以实现智能化辅助设计,通过理解自然语言描述,生成相应的设计方案或 UI 元素,提升设计效率和准确性。设计师可以通过与 GPT
76、-4 交互,快速得到可行的设计方案或 UI元素,避免重复的设计过程。2.可视化建模:采用可视化建模工具,如 UML,快速建立模型,简化建模过程,提高建模效率。采用可视化建模可以将抽象的概念用可视化的方式呈现出来,便于沟通和交流,同时可以减少重复的设计和提高设计效率。GPT-4 可以实现自动化原型验证。设计师可以将设计方案或 UI 元素交给 GPT-4 进行测试用例的生成,避免手动编写测试用例的繁琐和耗时,同时提高测试的覆盖率和准确性。图 3-3 GPT-4 辅助界面设计 AIGC(GPT-4)赋能通信行业应用白皮书 46 设计人员,借助GPT-4,可以根据输入的需求,快速生成界面原型,原型快速
77、验证,确保需求场景覆盖完善。从原先以周为单位,降低到以小时为单位,人员效能提升 100 倍以上。场景三:GPT-4 助力智能编码 在开发编码阶段,当前通过采用集成开发环境、使用开发框架和库、采用代码审查等措施,能够提高研发效率,减少重复工作,降低代码出错率,提高代码质量和可维护性。可适用的场景主要有:1.使用集成开发环境(IDE)和开发框架:使用集成开发环境可以提高开发效率。IDE 通常集成了代码编辑器、调试器、自动补全、版本控制等工具,使得开发人员可以更加高效地编写代码、测试代码和维护代码。使用开发框架和库可以减少开发人员编写重复代码的工作量,提高开发效率。开发框架和库如 Spring、Re
78、act、Vue 等,可以提供一系列的组件和函数,帮助开发人员更快地构建应用程序。GPT-4 未来甚至可以颠覆开发编码的工作方式,即通过自然语言编程接口,让开发人员使用自然语言描述所需功能,然后将其转化为代码实现,降低代码实现的门槛和难度,提高开发效率。2.代码审查:采用代码审查可以帮助开发人员发现代码中的问题,提高代码质量和开发效率。代码审查可以由其他开发人员或专业的代码审查工具进行,发现问题后及时进行修改和优化。GPT-4 可以自动代码补全和纠错、智能重构和优化,大大提升代码审查的效率。GPT-4 可以根据已有的代码和上下文,提供自动代码补全和纠错的功能,帮助开发人员更快速地编写代码,并避免
79、常见的语法错误和拼写错误。GPT-4 可以分析 AIGC(GPT-4)赋能通信行业应用白皮书 47 代码并提供智能重构和优化的建议,帮助开发人员优化代码结构、提高代码可读性和可维护性,从而减少后期的维护成本。3.代码生成:作为代码生成工具。Copilot 是由 OpenAI 和 Github 合作研发并商用的基于 GPT 模型的代码自动补全工具,可以根据上下文和用户输入自动生成代码片段。Copilot 可以快捷的集成到自己的 IDE 中,以便更高效地编写代码。GPT-4 可以根据给定的场景或需求,自动生成相关的代码文本,例如自动生成 API 文档、自动生成注释等,减少手动编写文档的时间和精力。
80、与 Copilot 不同,GPT-4 更注重用户和模型的交互,它可以与用户进行多轮对话,通过询问和解释来更好地理解用户的意图。在代码开发方面,GPT-4 可以根据用户的需求和上下文生成相应的代码,并可以与用户进行交互以获取更多信息和反馈。GPT-4 的优势在于可以生成更加个性化和灵活的代码,但是也需要更多的交互和反馈,对用户的技能和经验要求更高。开发人员,通过云IDE快速拉起预置的场景化的应用开发环境,开发小组内通过工作空间的共享,实现开发的快速协作,如结对编程、远程联调、单元测试等。GPT-4智能辅助编程,结合代码辅助生成的能力,通过聊天的方式,轻松完成代码编写,输出高质量的业务代码。懂代码
81、,更懂业务。数字人助手和鼓励师,结合程序员的编码习惯,情绪等,不定时的通过鼓励的方式,调动程序员工作的积极性。编码效率从以天为单位,降低到以小时为单位,甚至分钟级的完成开发,开发人员更聚焦核心代码编写,效能提升 100 倍以上。AIGC(GPT-4)赋能通信行业应用白皮书 48 图 3-4 引入 GPT-4 后开发人员日常工作场景 图 3-5 GPT-4 智能辅助编码 AIGC(GPT-4)赋能通信行业应用白皮书 49 场景四:GPT-4 赋能持续集成与持续交付 在集成与发布阶段,当前借助自动化构建和测试、持续集成和持续交付、持续部署等措施可以在集成和发布阶段提高研发效能,从而加快软件交付的速
82、度和质量。引入 GPT-4 在可以带来进一步的提升。可适用的场景主要有:1.自动化构建和测试:通过使用自动化构建和测试工具,可以快速、可靠地构建和测试软件,减少手动操作和人为错误,从而提高软件交付的质量和效率。GPT-4 可以用于自动化测试中,自动生成测试用例和测试数据,并自动执行测试用例,从而减少测试人员的工作量,提高测试的覆盖率和准确性。2.持续集成和持续交付:通过持续集成和持续交付的实践,可以实现快速、频繁地将软件集成和交付给用户,从而及时地获取反馈,提高软件的质量和响应能力。GPT-4 可以用于自动化部署中,自动生成配置文件和部署脚本,并自动执行部署过程,从而减少手动操作和人为错误,提
83、高部署的速度和可靠性。3.持续部署:通过使用容器化部署技术,可以将软件打包成轻量级、可移植的容器,并在不同的环境中快速、一致地部署和运行,从而提高软件的可靠性和可移植性。GPT-4 可以用于预测性维护中,通过分析日志和监控数据,预测系统可能出现的问题并提出解决方案,从而避免系统故障和停机时间的损失,提高系统的可靠性和稳定性。平台人员,借助GPT-4,无需进行复杂的构建、部署配置,集成和发布活动变得更将轻松。应用的构建部署配置从以天为单位,降低到以小时为单位,集成和部署效率提升 10 倍以上。AIGC(GPT-4)赋能通信行业应用白皮书 50 图 3-6 GPT-4 提升持续集成效能 场景五:G
84、PT-4 提升自动化测试效能 在测试阶段,自动化测试工具(例如接口、UI、性能等),以及代码染色、流量复制等自动化测试能力,一定程度上提升了测试的效能。引入 GPT-4 可以通过自动生成测试用例、智能缺陷检测、智能精准测试、以及智能代码染色,大幅提升测试效能。可适用的场景主要有:1.自动化测试:使用自动化测试工具进行自动化测试,包括单元测试、集成测试、功能测试、性能测试、接口测试、UI 测试等,可以减少测试时间,提高测试覆盖率和准确性。GPT-4 可以帮助自动生成测试用例,特别是在一些较为简单的场景中,可以避免手动编写重复的测试用例,提高测试的自动化程度,从而提高测试效率。GPT-4 可以通过
85、学习历史缺陷数据,识别并智能检测出潜在的缺陷,减少漏测和误测的情况。同时,GPT-4 还可以根据缺陷类型和严重程度进行排序,提高缺陷修复的 AIGC(GPT-4)赋能通信行业应用白皮书 51 优先级和效率。GPT-4 可以基于领域知识和历史测试数据,辅助测试人员制定更加精准的测试计划,包括测试范围、测试用例设计、测试覆盖率等方面,以提高测试的效率和覆盖度,减少漏测和误测的情况。2.代码染色:指利用静态代码分析工具,对代码进行自动化检查和诊断,以发现潜在的问题和漏洞。静态代码分析工具可以帮助开发人员快速发现代码中的错误和安全隐患,同时可以提供详细的代码质量报告,帮助开发人员优化代码质量和可维护性
86、。此外,代码染色还可以结合自动化测试工具,自动化执行测试用例,并对测试结果进行反馈和调整,从而提高测试效率和准确性。GPT-4 可以分析代码库中的代码结构、变量名、注释等信息,为测试人员提供更智能的代码染色功能,相比于基于传统静态代码扫描的代码染色,可以让代码可读性更高,使得测试人员更容易理解和编写测试用例,提高测试效率。测试人员,借助GPT-4,实现自动生成测试用例,智能代码染色等,让测试人员更容易理解和编写测试用例。AIGC(GPT-4)赋能通信行业应用白皮书 52 图 3-7 GPT-4 快速生成单元测试用例 综上所述,通过引入GPT-4,可以对软件研发全生命周期全面赋能,无论是需求分析
87、阶段的需求沟通,还是设计阶段的原型设计,亦或开发人员的编码,测试人员的测试执行,都能够有较大程度的效能提升。3.1.2 智能运维 智能运维 AIOps(Artificial Intelligence for IT Operations)是一种基于人工智能技术的运维自动化解决方案,它利用机器学习、深度学习、模式识别等人工智能技术,对 IT 系统的运行数据(包括日志、指标、事件)进行分析和处理,自动识别和分析故障,快速定位问题,并自动推荐或执行解决方案,以提高 IT 运维团队的效率和响应速度。AIGC(GPT-4)赋能通信行业应用白皮书 53 智能运维 AIOps 作为一个新兴的技术领域,目前正在
88、快速发展,越来越多的研究者将机器学习、自然语言处理、数据挖掘等技术应用于智能运维AIOps领域。学件是一种性能良好的预训练机器学习模型,其具有一套解释模型意图和/或特性的规约,亚信科技 AIOps 运维学件已经在智能运维领域得到了广泛应用和快速发展,在通信领域已经沉淀出了像指标异常检测、日志异常检测等可复用、可演进的成熟运维学件。此外,早在 10 年前 Github 提出了 ChatOps 的概念,它是一种实时聊天驱动型的运维模型,可以“用聊天的方式来做运维工作”,通过将机器人植入聊天会话,形成人、机器、数据的自动化、透明化的联动,使运维团队能够高效执行任务和沟通协作,可以认为 ChatOps
89、 是 GPT-4 在运维领域的一个雏形。目前随着 GPT-4 及其相关技术的出现和普及,可以在智能运维领域进一步加强“ChatOps”的运维能力。下图提供了智能运维 AIOps 工作台中的运维协作、智能运维相关问题的快速问答以及运维人员确认后的快速执行等场景。GPT-4与智能运维 AIOps 可以协同助力运维人员快速识别系统故障类型、高效提供故障处置策略并生成自动化脚本实现故障自愈。AIGC(GPT-4)赋能通信行业应用白皮书 54 图 3-8 智能运维工作台运维协作场景 场景一:快速识别故障类型 当系统出现故障时一般会伴有很多错误类型的日志输出。在智能运维领域,目前主要是通过机器学习、聚类、
90、频繁模式挖掘、NLP 等技术对日志的模式进行识别以及检测日志量的异动情况来进行日志的异常检测。GPT-4基于对日志模式的识别能力,可以帮助运维人员提供系统故障关键日志的分析。运维人员可以将系统故障对应的关键日志和相关信息发送给GPT-4,GPT-4 通过 NLP 自然语言处理能力尝试识别和分析日志的问题,并给出日志对应的故障类型及原因。如将一段 Kafka 的错误日志:“2022-01-25 09:09:14,930|FATAL|main|kafka.Kafka$(Log-ging.scala:113)java.lang.IllegalArgumentException:requirement
91、 failed:rep-lica.fetch.max.bytes should be equal or greater than message.max.bytes at scala.Predef$.require(Predef.scala:233)at kafka.server.KafkaConfig.validateValues(KafkaConfig.scala:959)at kafka.server.KafkaConfig.(KafkaConfig.scala:944)at kafka.server.KafkaConfig$.fromProps(KafkaConfig.scala:70
92、1)at kafka.server.KafkaConfig$.fromProps(KafkaConfig.scala:698)at kafka.server.KafkaServerStartable$.fromProps(KafkaServerStarta-ble.scala:28)AIGC(GPT-4)赋能通信行业应用白皮书 55 at kafka.Kafka$.main(Kafka.scala:60)at kafka.Kafka.main(Kafka.scala)”发给 GPT-4,经 GPT-4 识别分析后发现是 Kafka 配置的错误并给出错误的原因,帮助运维人员快速发现定位该类型的问
93、题。进一步的 GPT-4 可以与智能运维 AIOps 中的日志异常检测等运维学件能力进行结合,如将 GPT-4 识别的故障类型作为运维专家经验与学件中智能算法检测的结果进行融合,以数、知双驱动能力提升运维效率。图 3-9 GPT-4 帮助分析故障 场景二:高效提供处置策略 运维过程中当故障发生后,先经过分析诊断定位故障的根因,然后如何快速的找到故障修复的方案是至关重要的。在智能运维领域目前的实现思路是希望提供行业知识图谱或运维知识库,但由于运维经验相对分散不集中导致运维知识的沉淀不足,大多数情况下还需要依靠专业的运维人员通过自身的经验来提供故障的解决方案,对人员的依赖程度较高。AIGC(GPT
94、-4)赋能通信行业应用白皮书 56 GPT-4基于大量运维知识的学习与沉淀,可面向运维人员提供运维行业知识库能力,运维人员可以将故障的类型或故障的描述发送给 GPT-4,GPT-4 通过其 NLP 自然语言理解能力和丰富的运维知识库能力提供相应故障的解决方案或修复策略,如可以直接提问“Kafka 配置错误 replica.fetch.max.bytes should be equal or greater than message.max.bytes,如何修复”,GPT-4 会给出解决该问题的方法及相关步骤,以帮助运维人员对该类故障作出快速响应。另外 GPT-4支持多国语言,对一些中文运维知识
95、库不能覆盖的部分,可以查找英文或其他语言的运维知识库。图 3-10 GPT-4 智能修复 Kafka 配置错误 场景三:故障自愈 在智能运维领域,当发现并识别出故障类型后,需进一步结合专家经验或运维知识库等匹配对应故障的处置策略,然后如何能快速的达到故障自愈的目的,一般来说需要运维人员编写一些程序或脚本来完成故障的自动修复。AIGC(GPT-4)赋能通信行业应用白皮书 57 GPT-4 可以自动生成脚本以及 ansible 等自动化运维工具需要的程序代码。如结合上述 Kafka 的错误信息自动生成 ansible 自愈程序的代码,帮助运维人员能快速恢复故障,实现故障自愈。图 3-11 GPT-
96、4 智能生成 ansible 程序代码 3.1.3 智能营销 营销系统是指一套针对企业销售和市场营销活动进行规划、执行和监控的系统化工具和流程。营销系统的目标是提高营销效率、减少浪费、提高收益。通过数据分析和自动化流程,营销系统可以帮助企业更好地了解其客户,定制个性化的营销方案,并跟踪和分析营销活动的结果,以便随时调整和改进营销策略。智 AIGC(GPT-4)赋能通信行业应用白皮书 58 能营销是利用 AI 技术和大数据分析来优化市场营销策略的方式,将智能的技术与营销策略相结合,实现更高效、精准和个性化的营销。GPT-4之前,关于智能营销方面的问题,如果要寻求网络的帮助,只能就一些关键词进行搜
97、索,再对根据关键词搜索到的结果进行甄别分析,看是否有些有助于制定或实施营销的内容。GPT-4可以理解自然语言,能够理解输入的背景信息,并准确了解整体需求,因而可以结合背景和需求,针对性地找到解决方案或建议。可以在产品策划、营销方案策划、主动营销、产品订购、营销分析等营销相关的整个闭环场景中帮助通信企业实现更高效、更精准和个性化的营销。场景一:基于 GPT-4 的产品策划增强 GPT-4可以帮助收集和分析市场数据:在产品策划过程中,了解市场需求是至关重要的。GPT-4可以帮助企业收集和分析大量的市场数据,包括竞争情况、目标用户、市场趋势等等。这些数据可以为企业的产品决策提供基础和参考。GPT-4
98、可以提供创意和灵感:在产品策划过程中,创意和灵感是非常重要的。GPT-4可以生成有关市场和用户的文本信息,这些信息可以激发企业的创意和灵感,帮助企业创造出更有吸引力的产品。产品经理根据初步的产品创意想法,让 GPT-4 列出业界相关的产品及特点,结合相关统计数据(GPT-4同时也可参与数据统计分析),不断加入自己的要求,和 GPT-4 一起头脑风暴,调整优化产品的创意,形成产品策划的初步方案。泛在智能感知被广泛认为是 6G 的一个重要特性。在居家环境中,可以用无线信号非侵扰地获悉人员的健康状况和生活规律:如老人跌倒不起等异常事件发生,都可以通过无线信号识别后再发送给家人、医院、社区护理人员等。
99、运营商 AIGC(GPT-4)赋能通信行业应用白皮书 59 如果想根据 6G 和 Wi-Fi 智能感知能力,策划一个老人跌倒监控相关的产品,可以让 GPT-4 提供产品策划方面的一些思路:图 3-12 如何策划产品的回答 AIGC(GPT-4)赋能通信行业应用白皮书 60 根据 GPT-4 提供的建议,可以进一步沟通,让 GPT-4 对产品功能设计提供进一步建议。GPT-4 在下图 3-13 回答中,提到了智能学习用户习惯、用户隐私保护等在产品设计中容易忽略的问题,可以帮助产品经理完善产品的设计。图 3-13 产品功能设计的进一步建议 场景二:基于 GPT-4 的营销方案策划增强 类似于产品策
100、划场景,营销经理让 GPT-4 列出业界关于此类产品的营销特点与优选的方案列表,结合相关产品销售和使用统计数据(GPT-4同时也可参与数据统计分析),分析比较各种营销方案的优劣,并和 GPT-4 一起头脑风暴,形成营销方案策划的初步方案。GPT-4也可以生成文本和语音内容,包括文章,视频,音频等,为企业提供内容营销的基础。AIGC(GPT-4)赋能通信行业应用白皮书 61 比如可以请 GPT-4 帮助设计与产品相关的广告词:图 3-14 关于产品广告词的问答 图 3-15 关于产品广告词的古诗词形式的问答 场景三:基于 GPT-4 的主动营销增强 GPT-4可以处理大量的文本数据,并通过自然语
101、言处理和机器学习技术提取有用的信息和趋势。这可以帮助企业了解客户需求和行为。GPT-4可以集成到营 AIGC(GPT-4)赋能通信行业应用白皮书 62 销自动化平台中,根据用户行为和需求提供个性化的推荐和建议,增强客户参与度,提高转化率。客户和 GPT-4 在聊天过程中,可结合以往的聊天记录,根据客户和运营商的交互历史,综合分析客户需求,主动寻找商机,并适时向客户推荐合适的产品:图 3-16 关于主动营销推荐的问答 场景四:基于 GPT-4 的产品订购增强 客户不再需要和客户经理、话务员、营业前台等各个渠道的不同运营商员工打交道,GPT-4 成为客户在运营商的专职助理。客户用自然语言向 GPT
102、-4 提出产品需求,就像和朋友聊天一样,聊聊当前手机的最新机型,有什么特点,有什么好的应用,网络流量需求等等,GPT-4会根据客户需求提出可选的方案,比较每种方案的优缺点,并根据客户实际情况,推荐最优方案。客户确认后 GPT-4可以帮助下单订购,并随时询问订单进展。下图是在销售过程中 GPT-4 帮助客户进行产品比较、推荐最佳方案、帮助订购的示例。可以看到,GPT-4抓住了运营商这款产品的非侵入式、实时监控、自动报警等其他产品不具备的特点。AIGC(GPT-4)赋能通信行业应用白皮书 63 图 3-17 关于不同产品特性分析比较的问答 图 3-18 关于帮助客户产品下单的建议 AIGC(GPT
103、-4)赋能通信行业应用白皮书 64 场景五:基于 GPT-4 的营销分析增强 GPT-4 可以在以下方面帮助进行营销分析:l 收集数据:搜集产品销售数据和其他相关数据,如推广方式、渠道、竞争对手的营销活动等。l 分析数据:对收集到的数据进行分析,包括统计销售数据、计算 ROI、分析销售趋势、比较销售数据与预期等。l 评估营销策略:根据分析结果,评估各个营销策略的效果,看哪些策略比较成功,哪些策略需要优化或调整。l 制定新的营销计划:根据评估结果,制定新的营销计划和战略,包括改进现有的营销策略、增加新的营销渠道和方式等。l 迭代优化:根据新的营销计划,再次进行营销活动,并收集数据和分析结果,以此
104、不断优化营销策略,从而提升产品的销售情况。通过以上的分析方法,可以对产品的销售情况进行全面的评估和优化,从而提升产品的市场占有率和竞争力。以下是请 GPT-4 帮助进行营销分析的示例:AIGC(GPT-4)赋能通信行业应用白皮书 65 图 3-19 关于产品营销分析的问答 综上所述,GPT-4可以在产品策划、营销方案策划、主动营销、产品订购、营销分析等整个闭环中帮助通信企业实现更高效、更精准和更个性化的营销。3.1.4 智能计费 计费系统作为电信运营企业核心 IT 系统,承担了从用户使用记录采集与预处理、计费、帐务处理与管理、多方结算、风险控制,以及业财合拢等核心工作,是确保电信企业健康运营的
105、基础设施。从计费系统服务的业务角度来看,计费系 AIGC(GPT-4)赋能通信行业应用白皮书 66 统需要满足电信自有按量计价的语音、短信、流量等业务的费用处理,订阅制与点播制的云计算、长途租用、内容与服务等业务的费用处理,还要逐步探索面向算力网络等未来业务的方案推荐与费用处理,是助力电信企业打造可持续发展的引擎。电信运营企业从传统 ToC 通信业务的利基市场逐步向未来算力网络的多边平台市场发展过程来看,随着业务发展,可以逐步在计费系统的应用场景中引入GPT-4 相关的技术,以使得计费系统更加智能。场景一:计费系统的可观测性与可解释性提升 电信运营企业从其国企定位来看,有较强的社会责任与企业责
106、任。让客户每一笔通话、每一笔订阅都能做到明明白白消费是非常重要的。而随着业务复杂程度的不断提升,用户的资费、优惠等约来约复杂,进而造成计费系统在进行批价、优惠的过程中需要花费很大的成本来为客户提供使用与消费过程的说明。引入GPT-4相关技术,将用户的计费数据(使用记录)、优惠数据,以及资费信息等数据建立分析,同时配合 NLP 实现自然语言交互情景下的消费情况解释,有助提升客户消费的满意度。例如:传统上,当客户对消费情况提出质疑的情况下,通常通过IVR等渠道录入客户服务工单,经专家分析、批价过程重现等手段分析消费记录后,再向客户提供解释说明。引入 GPT-4 相关技术,可以为客户提供基于自然语言
107、的解释手段,降低成本的同时,提升客户满意度。AIGC(GPT-4)赋能通信行业应用白皮书 67 图 3-20 GPT-4 根据计费数据给出情况解释 场景二:业财合拢助力精益企业运营 电信运营企业是典型的重资产投入企业,在整个“资金-资产-资源-服务-资金”的过程中,由于网络投资与用户收入的财务统计方法和口径的天然差异,很难做到资源的精准投放,进而影响电信运营企业的运营效率。引入GPT-4相关技术,将用户的计费数据(使用记录)与网络资源投资情况(利用效率)相结合,建立多类、多模数据的融合分析,可以帮助电信运营企业实现更加精准的资源投放,进而提升运营效率。例如:传统上,由于网络建设是基于网络规划、
108、监测、优化等数据通过项目方式推进建设,而设备采购是按照财务预算投资节奏进行采购,用户收费又是基于用户单笔使用记录,因此在统计口径上很难形成一致。将网络数据、用户使用及费用数据导入,通过建立企业财务数据、用户使用及费用数据与网络数据之间的概率关系,实现财务与业务的有效结合,提高企业的盈利能力和市场竞争力,从而实现可持续发展。AIGC(GPT-4)赋能通信行业应用白皮书 68 图 3-21 GPT-4 智能将企业业财融合助力运营 场景三:多边平台模式下的风险控制 电信运营企业随着业务发展,无论在基于内容与服务业务的多边平台,还是在未来的算力网络的多边平台模式下,要想建立一个健康的平台生态,就需要建
109、立以足够强大的风险控制体系以确保整个多边平台的信用基础。引入 GPT-4 相关技术,针对多边平台的合作方建模超长历史交易行为,充分利用每次交易记录信息,利用思维链进行多步推理,逐步完善一种低成本的风控体系,可以有效确保多边平台下的信用基础。例如:基于 SP/CP 的业务,对所有最终用户、SP/CP 等各合作方的基础信息、内容与服务产品信息建立标注,同时对每一笔交易记录建立跟踪说明,基于最终用户与合作伙伴在申请、鉴权、使用、分摊、结算等过程建立风险控制判断,AIGC(GPT-4)赋能通信行业应用白皮书 69 在 GPT 中训练风险控制评价模型即对风险控制判断进行奖励优化。正式使用中可以将每一笔交
110、易请求通过模型评估该笔交易的风险等级,进而规避风险。图 3-22 GPT-4 举例风险交易行为 场景四:基于意图的算网方案推荐 随着运营商在算力网络方向的努力,传统基于简单资源成本及服务水平的定价模式很难适应算力网络中复杂场景下,多资源、多服务的融合服务模式。引入GPT-4相关技术,以具体使用场景为意图基础,同时整合各类资源、各类服务能力的信息,利用思维链进行多步推理,给出符合客户场景意图、电信运营企业效益的最佳建议方案,可以帮助电信运营企业建立可持续性发展的算网生态。例如:在算网资源管理阶段,对每一个节点的算力和网络资源、服务能力、成本、预期收益等建立标注,同时基于客户在不同场景(基于六何分
111、析法构建场景模型)下的资源、服务请求建立跟踪说明,基于客户在不同场景的跟踪说明,AIGC(GPT-4)赋能通信行业应用白皮书 70 以及算力、网络资源的标注,建立同时满足运营商成本、效益、客户预期的调度方案与资费方案,在 GPT 中训练最优解评价模型即对调度方案与资费方案进行奖励优选。正式使用中可以根据算网请求识别客户意图(成本最优、效率最优、效能最优等)自动推荐算网资源调度方案并形成自动化订购、分摊、结算等过程。图 3-23 GPT-4 基于意图的算网方案推荐 3.1.5 智能客服 客服系统旨在为通信运营商的客户提供一种高效、灵活、可定制的解决方案,用于管理、维护运营商与客户之间的交互和支持
112、。包括一个集成的多渠道服务平台,支持通信运营商在多个渠道(例如电话、邮件、短信、社交媒体和在线聊天)上与客户进行互动。智能客服系统可以通过自动化处理、智能机器人和自助服务等方式来降低人工客服中心的负载,减少客服中心的成本,提高客户满意度。此外,系统还提供 AIGC(GPT-4)赋能通信行业应用白皮书 71 实时分析和监控工具,以便电信运营商可以追踪客户反馈和服务质量,及时解决问题并改进服务质量。将智能客服系统和 GPT-4 结合起来,可以发挥两者的技术优势,在智能语音助手、坐席助理、智能推荐、自助服务、社交媒体管理、个性化服务等多个场景方面,提高客户服务的质量和效率,满足客户日益增长的个性化需
113、求,从而帮助企业更好地服务客户,提高竞争力和盈利能力。场景一:增强智能客服的语义理解、情感识别 智能客服系统在处理客户请求方面具有很大的优势,可以自动分析和处理大量的客户请求,提高客户服务的效率和质量。然而,智能客服系统有时可能难以理解和回答复杂的问题,或者无法识别客户的情感和语气,导致客户体验下降。因此,结合 GPT-4 这种自然语言处理技术,可以弥补智能客服系统的不足之处。GPT-4可以识别用户提问的主题和关键词,并将其转化为机器可读的形式,帮助智能客服系统更好地理解用户的需求,从而提供更准确、个性化的服务,也可以帮助智能客服系统识别用户的情感状态。GPT-4可以分析用户输入的语言,判断其
114、中的情感色彩,比如是否表达了愤怒、焦虑或快乐等情感状态。通过分析用户情感状态,智能客服系统可以更好地理解用户的情感需求,并提供更加智能化、贴心的服务。例如:当一个用户在智能问答系统中输入“我的账单有误,这已经是第三次了”,GPT-4可以识别到用户的不满和不满意情绪。这时,智能客服系统可以自动回应,并表达理解和同情,并提供更快速和有效的解决方案,以缓解用户的不满和不满情绪。AIGC(GPT-4)赋能通信行业应用白皮书 72 图 3-24 GPT-4 基于客户情绪,智能化处理客户请求 结合 GPT-4 的智能客服系统可以更好地理解用户的问题和需求,识别用户的情感状态,并提供更智能化、贴心的服务,从
115、而提高客户的满意度和忠诚度。场景二:使智能客服知识搜索定位更精确 有时候客户可能并不清楚如何描述他们所遇到的问题,或者他们可能使用了不正确的词汇来描述问题。这时,智能客服系统也会出现困惑,无法找到准确的解决方案。结合 GPT-4 后,GPT-4 可以帮助智能客服系统在这种情况下提供更精确的搜索定位,用户提供最相关和精确的回答和解决方案。例如:客户向智能客服系统中提出了“我的电脑无法上网了,什么情况?”。由于客户的输入比较简略,智能客服系统可能会出现困惑,无法准确理解用户的问题,也无法为用户提供最准确的解决方案。通过与 GPT-4 的结合,智能客服系统可以更好地理解用户的问题并提供更精确的搜索定
116、位。GPT-4可以利用上下文和历史数据生成更准确的问题描述,针 AIGC(GPT-4)赋能通信行业应用白皮书 73 对“我的电脑无法上网了,什么情况?”问题,智能客服系统可以将这个更加准确的问题描述用于搜索相关解决方案,为用户提供更具体、个性化的建议和指导。图 3-25 GPT-4 根据客户提问,智能化生成解决方案 GPT-4 还可以通过理解用户的意图,进一步优化搜索结果。如果 GPT-4 理解到用户需要的是如何解决电脑无法启动的问题,而不是如何更换硬件设备,那么智能客服系统就可以提供更准确的解决方案,使客户更容易找到所需的帮助和支持。结合 GPT-4 的智能客服系统可以更好地理解用户的问题和
117、意图,提供更精确、个性化的搜索结果和解决方案,从而提高客户的满意度和忠诚度。场景三:增强智能客服的交互式服务体验 智能客服系统结合GPT-4,可以为客户提供更加个性化、准确和自然的回答和解决方案,从而增强智能客服系统的交互性和用户体验。在智能客服系统中,客户可以通过语音或文本与机器人进行交互。机器人通过分析客户的问题,自动检索相关信息,并生成回答或解决方案。然而,机器人有时无法理解或解决复杂的问题,或者无法识别客户的情感和语气,导致客户体验下降。在这种情况下,GPT-4可以理解客户的意图和语境,生成更加个性化、准确和自然的回答和解决 AIGC(GPT-4)赋能通信行业应用白皮书 74 方案。G
118、PT-4还可以识别和回应客户的情感和语气,以提供更加细致的服务。另外,GPT-4还可以通过学习历史对话和客户信息来持续优化智能客服系统,提高回答准确率和交互性。通过这种方式,智能客服系统可以不断适应和优化自己,提供更好的服务体验,增强客户满意度,维护客户关系,提高企业的竞争力和盈利能力。智能客服系统与 GPT-4 结合,提供更加个性化、准确和自然的回答和解决方案,以解决客户的投诉问题。假设 GPT-4 担当通信运营商的客服代表,一个客户通过智能客服系统投诉手机质量问题,GPT-4为这个客户提供服务。客户可能会表达情绪,描述手机的故障和影响,提供订单号码和其他相关信息等等。智能客服系统可以分析客
119、户提供的信息,自动识别问题,并通过事先编写好的规则或模板,生成一份回答或解决方案。然而,如果问题比较复杂或客户的情感比较激烈,没有 GPT-4 支持的智能客服可能难以理解和回答客户的问题,导致客户体验下降。结合 GPT-4 的智能客服系统可以提供更加个性化、准确和自然的回答和解决方案,以解决客户的投诉问题,并提高客户满意度和忠诚度。AIGC(GPT-4)赋能通信行业应用白皮书 75 图 3-26 GPT-4 与客户交互式对话能力展示 3.1.6 智能客户关系管理 客户关系管理系统(Customer Relationship Management,CRM),是企业为提高核心竞争力利用软件、硬件和
120、网络技术,建立的一个客户信息收集、管理、分析和利用的信息系统。以客户数据的管理为核心,记录企业在市场营销和销售过程中和客户发生的各种交互行为,以及各类有关活动的状态,提供各类数据模型,为后期的分析和决策提供支持。在客户关系管理系统中,引入 GPT-4 可以更好地协调企业与顾客间在销售、营销和服务上的交互,从而提升管理方式,向客户提供创新式的个性化的客户交互和服务的过程。促进最终目标“吸引新客户、保留老客户以及将已有客户转为忠实客户,增加市场”的达成。AIGC(GPT-4)赋能通信行业应用白皮书 76 场景一:人性化智能的交互方式,促进客户信息收集 CRM 系统通过客户注册、客户主动填写个人资料
121、、问卷调查等方式收集客户信息,虽然可以通过奖励积分等方式激励客户填写个人资料或进行问卷调查,但传统冗长的表单填写模式会让很多人望而却步。GPT-4采用更为人性化的提问方式进行问卷调查,同时可以根据客户的给出的答案,更为智能地选择向客户询问的问题,在问卷调查的过程中,若发现客户出现不满情绪,能及时进行安抚,最大程度保证问卷调查的顺利完成。例如:为了解 5G 网络用户普及和使用情况,收集对 5G 发展的建议,开展了 5G 服务的问卷调查活动,根据客户是否使用了 5G 网络,GPT-4 会聪明地选择不同的问题进行调研。图 3-27 GPT-4 人性化提问方式进行问卷调查 AIGC(GPT-4)赋能通
122、信行业应用白皮书 77 场景二:知识图谱与 GPT-4 结合,更深入的分析,提供更准确的推理 GPT-4是一个强大的语言模型,但它在上下文、背景知识和推理方面存在局限性。知识图谱本质上是语义网络,把所有不同种类的信息连接在一起而得到的一个关系网络,因此知识图谱提供了从“关系”的角度去分析问题的能力。两相结合,一方面可以弥补 GPT-4 推理方面的局限性,另一方面可以用更人性化、友好且智能的方式将知识图谱的分析结果呈现给用户。例如:知识图谱根据收集到的某客户购买的电信套餐、消费记录、社交圈(通过分析话单获取)、调查问卷结果等信息,通过数据挖掘、信息处理、知识计量等处理,推理出此客户现在虽然使用的
123、是 4G 网络,但对 5G 网络有一定兴趣,并且与之通话频繁的三个用户最近均开始使用 5G 网络,GPT-4 提醒客户经理,可联系此客户,推荐使用 5G 业务。图 3-28 GPT-4 结合知识图谱信息进行推理,为客户经理挖掘潜在客户 AIGC(GPT-4)赋能通信行业应用白皮书 78 场景三:GIS 与 GPT-4 的结合,提供智能化地址管理与服务 客户地址信息是客户关系管理的基础性关键信息,可以利用 GPT-4 辅助对地址进行采集、治理和管理,结合了 GIS 技术和 GPT-4 的优势,可在多个应用场景下实现智能化的地址管理与服务,提高数据准确性、业务效率和用户满意度。例如:多源地址合并:
124、在采购的地址库与运营商自有地址库合并任务中,可以利用 GPT-4 的强大文本逻辑推理能力及地理知识库,辅助地址清洗人员实现地址库的准确合并,而不必出门踏勘。这一应用场景充分发挥了 GPT-4 的智能文本处理能力,减轻了地址清洗人员的工作负担,提高了地址库合并的准确性。图 3-29 GPT-4 智能文本处理实现多源地址合并 例如:用户地址匹配:在用户报装过程中,当用户口头报出自家地址时,可以利用 GPT-4 的能力,将其识别匹配为标准地址,从而快速实现报装地址的精确选择,提高业务办理速度和用户满意度。这一应用场景充分发挥了 GPT-4 的智能文本处理和地理知识库能力,实现了对用户需求的快速响应和
125、解决。AIGC(GPT-4)赋能通信行业应用白皮书 79 图 3-30 GPT-4 智能文本处理实现用户地址匹配 场景四:GPT-4 虚拟智能同伴,促进客户关系的建立与维系 利用 GPT-4 创建一个虚拟的智能同伴,能够帮助客户经理以更加智能、自然和快速的交互方式分析潜在客户群和预测市场发展需求,为寻找新客户提供商业策略。GPT-4虚拟智能同伴基于收集、整理和分析的客户信息,在客户经理与目标客户交流的过程中,通过客户对话内容和说话语气,识别客户情绪,为客户经理提供可使用的对话策略,可推介的产品信息,可激发客户兴趣的话题以及可激发购买冲动的建议,并提醒调整交谈的语气和方式,从而更好了解客户的需求
126、,进行响应,达到拓展新客户、维系老客户的目的。例如:一个新入职的电信政企客户经理,使用 GPT-4 了解工作职责,获取近期需要拜访的客户信息。AIGC(GPT-4)赋能通信行业应用白皮书 80 图 3-31 GPT-4 虚拟智能同伴应用案例 1 例如:为维系客户关系,客户经理通过电话交流的方式,主动为客户提供积分兑换服务,GPT-4虚拟智能同伴从旁协助,根据双方对话内容,及时提供应对策略。图 3-32 GPT-4 虚拟智能同伴应用案例 2 AIGC(GPT-4)赋能通信行业应用白皮书 81 3.1.7 商业智能 商业智能(Business Intelligence,简称 BI),又称商业智慧或
127、商务智能,指用现代数据仓库技术、线上分析处理技术、数据挖掘和数据展现技术进行数据分析以实现商业价值。1996 年,BI 的概念被 Gartner 提出,并前后经历了三代发展。BI1.0 即传统BI 诞生于上世纪 90 年代。作为面向 IT 侧的报表平台,传统 BI 技术门槛较高,以 IT 为主导,业务需求匹配度较低。BI2.0 即敏捷 BI,以自助式分析为卖点,在2010 年以后进入快速发展阶段。敏捷 BI 面向业务人员提供自助式分析服务,但仍然存在一定技术门槛,需要耗费较大的时间和人力成本,不利于知识的沉淀和经验分享。2020 年以后,国外头部厂商掀起 BI3.0 浪潮,即智能 BI,结合人
128、工智能技术,打造一种纯业务侧主导,基于自然语言处理能力的数据搜索与分析平台,开启报表零门槛、人人都是分析师的时代。国内商业智能市场经历十来年的发展,目前正处于敏捷 BI 的阶段。敏捷 BI提供包括图表模板、分析函数、可视化组件在内的部分工具供用户选择,虽较传统 BI 在自助化方面有所提升,但完全依靠人工经验进行选择和判断,费时费力。运营商在产品服务和渠道运营方面呈现出多元化的发展趋势,敏捷 BI 已无法满足数据分析诉求在数量、频率、交付周期、场景化的广度和深度以及准确性等方面的要求,亟需向智能 BI 演进。AIGC(GPT-4)赋能通信行业应用白皮书 82 图 3-33 智能 BI 增强分析
129、VS 敏捷 BI 自助分析 增强分析是智能 BI 的核心能力,支持更多不同的业务角色全程参与数据分析,并结合实际业务诉求把关分析质量与效率。BI 系统通过集成 GPT-4 能力,将从以下几个环节实现增强分析:1.需求输入方式的变更:基于 GPT-4 的自然语言理解和多轮对话能力,支持用户通过文字描述或语音输入的方式替代传统的手动拖拽。在大幅提升 Text2SQL 的准确性和及时性的基础上,自动将用户输入的自然语言转化为查询 SQL。2.分析方式的变更:结合业务需求,基于大模型对运营商私有数据进行训练,针对指标异常检测、多维度和多指标关联分析、根因分析、趋势和结果预测等细分领域生成场景化模型,开
130、展自动数据洞察。3.可视化呈现方式的变更:将可视化比作是一种数据到设计的翻译,好的可视化也需要符合“信达雅”的标准。BI 系统基于 AIGC 的能力,结合用户意图和分析结果,自动生成并推荐可视化方案。一方面可以根据用户语言描述自动化生成报表,尤其是复杂的财务报表。另一方面 GPT-4 结合图形语法学,支持用户自定义任意图形,将自然语言所描述的绘制理 AIGC(GPT-4)赋能通信行业应用白皮书 83 念通过语法规则和复杂的语法结构生成代码表达;随着 AIGC 能力进一步发展,支持根据用户意图自动生成自定义的可视化结果。4.报告交付方式的变更:基于 GPT-4 的自然语言生成能力,对分析过程中获
131、得的现象、原因、预测等要素进行文字描述,并结合可视化的图表进行合理布局,自动生成可交付使用的书面报告。场景一:GPT-4 赋能增强分析,实现智能化经营分析 以经营分析场景为例展示基于 GPT-4 的增强分析能力,面向业务人员和经营管理者提供数据问答服务。1.问题输入 用户通过文本或语音描述问题:“近半年上午流量收入平均值趋势情况”。BI 系统集成 GPT-4 能力,在准确理解用户意图的基础上,自动执行 Text2SQL 转换,查询相关报表,以折线图的方式反馈流量收入指标的波动趋势,并支持筛选运算方式和统计周期。图 3-34 BI 集成 GPT-4 实现数据问答 AIGC(GPT-4)赋能通信行
132、业应用白皮书 84 2.数据洞见 系统提供数据洞见服务,支持同比、环比分析和异常检测,并通过GPT-4 对异常问题进行提示。图 3-35 BI 集成 GPT-4 实现数据洞见 3.洞见报告 结合 GPT-4 对异常现象、基本分析和原因探索的描述,系统自动生成洞见报告,以图文并茂的方式分章节进行详细阐述。AIGC(GPT-4)赋能通信行业应用白皮书 85 图 3-36 BI 集成 GPT-4 生成洞见报告 需要强调的是在增强分析场景中,全流程自动化是核心优势,将为运营商带来全新的体验和价值:l 以数据搜索或者数据问答的方式替代现阶段繁琐的人工操作,在数据分析过程中降本增效。l 最大程度降低 BI
133、 使用门槛,彻底摆脱 IT 不懂业务、业务不会分析的窘境,让更多业务角色参与分析,为各类经营决策提供公正客观的数据依据。AIGC(GPT-4)赋能通信行业应用白皮书 86 l 随着数据民主化的推进以及分析和预测准确性的提高,无论是对内支撑还是对外合作变现,数据价值将进一步被挖掘。3.2 通信网络领域的典型应用场景 随着 5G 网络建设和业务发展逐步加速,在网络运营与运维领域,运营商正在面对巨大挑战。一方面,5G 在网络基础设施中引入 NFV、SDN、云原生架构等新技术,运营商的网络运营与管理工作的技术对象已经与传统的 2/3/4G 时代大不相同。另一方面,纷繁的业务场景组合要求 5G 能够提供
134、按需分配,实时响应、端到端保障的网络体验,运营商的网络管理目标也已从“确保网络运行稳定”向“高效支撑业务发展”转变。这些变化为网络运营管理工作带来了前所未有的复杂度。电信网络运营商需要面向消费者和垂直行业客户提供全自动、零等待、零接触、零故障的创新网络服务与 ICT 业务,打造自服务、自修复、自优化的自智网络。但是由于通信网络数据海量多维异构、数据质量不高;知识领域较多、规则多,专业化程度复杂,缺乏知识提炼或表达;网络复杂、动态可靠性要求极高导致目前基于图像视觉及自然语言处理的 AI 技术距离 L5 级的网络智能仍有较大差距,因此以 GPT-4 为代表的 LLM 技术,在融合多模态后可能成为网
135、络智能化实现革命性突破的重要机会,能够大幅提升网络自治的水平,助力 L5 级自智网络达成,同时也将为 6G 网络技术研发注入新的范式。下文围绕网络规建维优营全生命周期各领域梳理了 GPT-4 的一些应用场景。3.2.1 智能网络规划 网络规划包括规划目标建立、规划方案设计、规划仿真的全流程管理工作。涵盖从网络整体表现、产品运营战略、业务使用体验提升等角度建立规划目标。AIGC(GPT-4)赋能通信行业应用白皮书 87 通过连通规划目标和规划方案的能力(包括拉通环境数据、业务需求数据、资源数据的多维度分析能力),实现业务覆盖、容量、带宽等规划目标。通过仿真能力,实现规划目标的仿真验证。传统网络规
136、划较为聚焦于网络覆盖、网络容量、拓扑结构、路径路由,缺乏对于网络价值、网络业务发展预测等多维度的综合分析,同时需要规划人员掌握较多的专业工具,如覆盖仿真工具、容量建模工具等。GPT-4知识引擎可以提供一站式综合性网络规划。规划人员仅需通过输入简单的规划意图并通过多轮交互的方式,较为高效的实现不同要求的网络规划,同时 GPT-4 也可给出专业规划工具的代码、脚本等,大幅提升工作效率。场景一:无线网络规划 无线网络规划是无线网络全生命周期管理中极为重要的一环,需要通过无线环境数据(如覆盖地形地貌,建筑物特征等)、业务需求数据、频谱数据等多维数据来规划目标区域的覆盖、容量等。现有常规无线网络容量规划
137、方法数据来源单一,且不能根据用户需求意图及现有网络情况、用户价值及网络口碑等多种因素综合进行自动化网络容量规划。通过 GPT-4 可以将网络规划意图较为便捷转换为对区域覆盖、容量、价值收益的综合指标,从而得出规划方案。AIGC(GPT-4)赋能通信行业应用白皮书 88 图 3-37 GPT-4 根据专业需求,生成无限网络规划方案 场景二:切片自动勘察 5G 网络切片是为了达成对客户承诺的个性化 SLA 需求,对无线、传输和核心网等多个子域的网络资源进行隔离、预留、独占和配置的端到端网络。目前运营商评估网络能否满足用户对切片的要求,是通过开通前的资源勘查来完成的。现有常规的切片资源勘查,是通过人
138、工方式将用户对切片的 SLA 需求转换为初步的切片方案后,通过系统派单给相应的专业的负责人(可能是大区核心网的运维人员,也可能是地市公司的无线和传输负责人),人工或半人工的确认资源满足情况。无线专业负责人需要确认业务区域相关基站和小区是否具备切片要求的能力,如信号覆盖情况、基站能力(是否支持切片、是否支持 RB 预留能力等等)、上下行容量等等,核心网专业则需要检查 AMF 的用户容量、SMF 的会话数、UPF 的吞吐量、UDM 的开卡容量等是否满足需要。人工勘查的工作非常繁琐,而且容易出错,常导致勘查环节占用时间从几天到十几天不等,严重拖慢业 AIGC(GPT-4)赋能通信行业应用白皮书 89
139、 务开通过程。通过 GPT-4 能够通过多轮问答的方式对无线、传输和核心网等子域网络设备的配置数据、容量数据、性能统计数据的采集和分析,以及无线栅格数据、MR 测量数据的实时深度分析,配合不同切片类型的评估模型,实现自动化的资源勘查。图 3-38 GPT-4 实现切片自动勘察 3.2.2 智能网络部署 网络部署(建设)包括建设项目的立项、设计、验收的全流程管理工作。根据规划设计完成交付、配置、以建设目标为基准完成网络能力、可用性等具体指 AIGC(GPT-4)赋能通信行业应用白皮书 90 标的验收。除以上整体流程外,相关环节也可以通过自动化工具实现能力提升,包括自动化交付配置、自动化验收测试和
140、闭环调整。在网络部署建设的各个环节借助 GPT-4 技术均可以实现工作效率的大幅提升,例如可通过专业领域知识模型以及网络设备专有知识实现包括 5G 专网、云网业务、边缘计算、SPN 专线、SD-WAN 等各类网络开通时间的大幅缩减,这对运营商提升市场竞争力至关重要。同时在结合多模态技术后,可以实现网络建设后质检验收的进一步自动化,节省大量人力资源。场景一:基于意图的传输专线网元配置激活 随着 AI/ML 基于与网络运营运维结合的愈发紧密,基于意图驱动的网络成为网络自智发展的重要关键技术。在传统的网络管理中,运维人员员需要手动配置和管理网络设备,例如路由器、交换机等。而在意图驱动网络中,运维人员
141、员只需要指定网络的目标和目的,而不需要关注底层设备的具体配置和操作。在意图驱动网络中,只需要指定网络的目标和目的,而不需要关注底层设备的具体配置和操作。其核心理念是将网络管理与业务需求相结合。通过 GPT-4 知识引擎网络运维人员能够通过简单对话轻松实现设备开通或一键生成网元配置模板,通过与网管系统的集成实现自动配置激活。此外通过多轮对话可以高效查询网络资源位置、状态等信息降低操作门槛。AIGC(GPT-4)赋能通信行业应用白皮书 91 图 3-39 GPT-4 基于意图的传输专线网元配置激活 场景二:基站验收质检 同时由于 5G 基站站型种类多,施工验收较 4G 基站更为复杂。传统的人工验收
142、方式,验收的周期长,同时由于验收标准不一致,很难做到统一的质量管控。随着网络的大规模建设,基站验收的工作量将急剧增长,需要智能化的站点验收方式提高工作效率和质量。在融合多模态数据后,可以方便的将包括前端图片、各类测试数据、各类性能告警数据统一输入至智能引擎中,通过智能分析工程验收标准、各类质检标准比对核查,按照基站入网验收的要求,对数据进行自动解析并生成基站入网验收报告。AIGC(GPT-4)赋能通信行业应用白皮书 92 图 3-40 GPT-4 生成 5G 基站质检方案 3.2.3 智能网络维护 网络维护包括对网络整体表现、产品运营表现、业务使用体验、资源健康度进行管理、监控、分析。通过被动
143、的监控和处理,或者通过对故障告警和性能劣化的主动感知分析以及自动化的资源调整实现网络、业务的恢复。通过售前、售中、售后的端到端支撑能力,提供贯穿于运维各项生产环节的自动化运维感知和决策信息的流转能力。在网络故障诊断中可使用 GPT-4 生成故障诊断报告,提供对网络故障的快速分析。在告警、性能分析中可使用 GPT-4 生成告警、性能、日志等关键网络 AIGC(GPT-4)赋能通信行业应用白皮书 93 数据分析,帮助网络运维人员快速识别告警的重要性并给出处理建议;可快速自动生成各类报告及数据可视(代码),帮助运维人员更好的理解网络数据。场景一:家宽网络维护 装维人员在客户现场说明遇到的问题,如“无
144、空闲端口”等,产生工单,利用 GPT 形成的专家知识,给出解决该问题的推荐解决步骤,并结合运营商内部系统,自动分析出各个步骤所需的相关信息,如对应的 ONU、分光器、PON 口、OLT、是否欠费、账号状态、账号流量等等各种信息,推荐已离网但尚未释放的端口信息,并且自动调用资源接口修改装机单对应端口。利用 GPT-4 能增强一线装维弱光分析、设备激活、资源端口自动更改等智能处理问题,可以大大降低综调人员学习成本,减少人工查询、人工定界定位的时间消耗,提升运维效率。图 3-41 GPT-4 针对 PON 链路故障提供的解决方案 AIGC(GPT-4)赋能通信行业应用白皮书 94 场景二:基于 GP
145、T-4 的日志异常检测增强 借鉴 GPT-4 的模型训练方法,可以对目前网络设备日志异常检测算法进行增强,主要步骤包括:1.结合专家经验选取部分日志数据,做出总结,构建提示符(Prompt)并给出答案。采用上述专家数据,在预训练语言模型的基础上,有监督地微调模型(SFT);2.将日志数据输入 SFT 中,根据提示符,生成答复,基于专家经验对SFT 生成答复进行排序;使用有序答复,在 SFT 模型上训练奖励模型(RM);3.采用奖励模型,构建策略优化的强化学习模型,训练,并最终生成日志总结。AIGC(GPT-4)赋能通信行业应用白皮书 95 图 3-42 GPT-4 日志异常检测 AIGC(GP
146、T-4)赋能通信行业应用白皮书 96 3.2.4 智能网络优化 网络优化指规划部门、市场部门、服务部门、运维部门的需求建立优化目标、输出优化方案、执行优化流程。支持基于网络整体表现、业务使用体验、资源健康度等不同维度设定优化目标。主要手段包括通过优化方案设计能力输出常态化或专题类优化方案、通过优化分析工具执行优化方案等。基于网络设备硬件告警、性能指标、用户投诉等多维数据,通过 GPT-4 知识引擎给出隐患预警及并识别网络存在的问题;对于无线网络覆盖、容量、干扰、能耗、IP 路由及业务路径调整、网络云计算存储优化等常见问题根据网络的各类数据通过知识引擎给出较为精确智能的优化方案。场景一:网络能耗
147、优化 网络优化的一项重要工作是通过用户业务的潮汐效应及网络覆盖的结构分析,完成网络结构的动态控制,进行单基站不同层级的资源休眠(如芯片级、板卡级、站点级)以及多模多制式网络的协同节能,达到网络降本增效的目标。但是在动态跟踪用户分布,跨设备厂家、多制式网络协同等方面存在较大挑战,通过GPT-4智能引擎可以通过问答方式,或数据交互方式快速得到网络节能优化策略,以及网络能耗 VS 网络性能 VS 用户感知的分布地图,帮助运营商有效决策改如何动态调整网络资源达到能效&性能最优。AIGC(GPT-4)赋能通信行业应用白皮书 97 图 3-43 GPT-4 智能网络能耗优化应用 1 图 3-44 GPT-
148、4 智能网络能耗优化应用 2 AIGC(GPT-4)赋能通信行业应用白皮书 98 场景二:优化专业问答及培训 随着运营商业务种类的激增,以及网络结构日趋复杂,5G 以及后续的网络中,网络优化工作,以及面向不同业务的端到端质量分析、优化的难度将成倍增加,需要运维工程师一专多能,具备较宽的知识面,GPT-4可以较为完美的代替目前的知识百科、专家经验库、甚至知识图谱等系统及技术。通过问答的方式展示云网优化的专业知识和优化案例,用户可以自由就关心的问题提问,并得到较为准确的回答。同时可以较为高效的成为专业技能培训系统,短时间快速提升员工技能。图 3-45 GPT-4 关于云网优化的专业知识储备 AIG
149、C(GPT-4)赋能通信行业应用白皮书 99 3.2.5 智能网络运营 网络运营指支持市场部门设定的优化市场战略,支持产品设计、订单接收、流程分析以及业务在网络中的配置、激活、上线、扩缩容以及变更等全生命周期管理业务工作,同时也包含业务上线、变更带来的业务保障、端到端测试、质量监控、投诉预处理、客户服务、用户满意度保障等工作内容,保障网络资源对业务的诉求提供可靠的能力支撑。新基建背景下,垂直行业对 5G 专网需求迫切,行业客户会出现建设需求井喷。结合后续建网技术瓶颈降低,建网模式出现多样化。随着 UPF 接口开放,企业对于用户面下沉,MEC 建设需求突增。针对业务上云及业务中台建设成为后续行业
150、专网应用主要目标,这些新兴业务都需要运营商更加智能的动态高效的进行网络运营。GPT-4可以有效管理各类用户需求,并及时导入专网运营平台,提升用户感知。面向来自客户域的投诉工单,基于 GPT-4 形成面向投诉的智能问答处理系统,识别用户投诉的语义、情感并形成处理策略,结合 RPA 技术进入后续处理、关闭等自动化流转。场景一:云网融合业务运营 随着网络演进,在多业务、跨领域的环境中形成了多样化的应用场景,网络业务调度开通环节多导致个性化业务需求匹配程度低、流程中存在人工操作的断点、业务端到端监控及可视化不足、定界定位能力不足等问题,难以满足用户“零等待”的诉求。通过 GPT-4 知识引擎可以较为方
151、便的实现云网用户意图的转译、理解和分析将业务订单自动转化为网络认知的 SLA 需求以工单的形式发送到各个网络环节。根据业务意图,自动识别并进行应用场景、内容、SLA等规格的配 AIGC(GPT-4)赋能通信行业应用白皮书 100 置并进行编排、创建、激活以及测试,完成云网业务的生成、部署和调测,确保上线质量。图 3-46 GPT-4 实现云网业务融合运营 场景二:网络投诉处理 随着网络的变化以及业务运维模式的更新,网络投诉问题也将随之增多,且随着 NFV、切片等技术的应用,投诉问题的定界和处理的难度也必然增大,所以投诉预处理对自动化和智能化的需求更加强烈。现有的投诉处理流程着重在投诉发生后的一
152、线应对,从分析和管理层面应对客户的原始投诉,减少后续一线运维团队的维护工作量。面向来自客户域的投诉工单,基于 GPT-4 形成面向投诉的智能问答处理系统,识别用户投诉的语义、情感并形成处理策略,结合 RPA技术进入后续处理、关闭等自动化流转。根据客户投诉内容安抚客户。对于用户 AIGC(GPT-4)赋能通信行业应用白皮书 101 的投诉,识别出网络问题后给出较为精确的定界定位的分析。并进行针对性的处理,如派单修复,套餐推送等,切实解决问题的投诉问题。图 3-47 GPT-4 面向客户投诉的智能问答 AIGC(GPT-4)赋能通信行业应用白皮书 102 四.构建通信行业 TelcoGPT GPT
153、-4具备通用知识,但缺少通信业的行业专有训练数据,难以满足专业场景。大模型深度赋能通信业,就需要构建通信行业的 GPT。通信是为了实现互联互通,因此标准化是通信业的行业特征。标准化的体系结构为通信业 GPT 构建提供了相对高质量的数据,有助于行业知识构建。通信业拥有大规模的信息通信基础设施,也为行业 GPT 构建提供了算力基础优势。4.1 GPT-4 的构建和应用问题 GPT-4 代表了 LLM 的先进形态,在 LLM 构建的理念和技术方面已经领先了一大步。人工智能的三大核心要素是数据、算力和算法。GPT-4 在构建 LLM 所需的数据、算力、算法等方面,已经形成了巨大的壁垒,掌握了话语权。l
154、 数据要求高 数据是预训练大模型的原材料,高质量的数据则保证 GPT-4 的输出质量。大规模数据获取难、高质量数据保障更难。GPT-3 的原始数据规模达 45TB,ChatGPT/GPT-4 在 GPT-3 大规模语料训练的基础上,又增加了人为打标的数据,对数据的质量做了进一步优化。l 算力成本高 ChatGPT 训练使用了微软专门建设的 1 万个 V100 GPU 组成的高性能网络集群,总算力消耗约 3640PF-days(即每秒一千万亿次计算,运行 3640 个整日)。据报道,其前代 GPT-3 的训练单次成本就高达 460 万美元,预计 ChatGPT/GPT-4 训练成本更高。AIGC
155、(GPT-4)赋能通信行业应用白皮书 103 l 算法模型不开源不开放 本次 AI 浪潮的蓬勃发展依赖于开源开放。而 OpenAI 自 GPT-3 开始模型已不开源。虽然 2023 年 3 月 1 日,OpenAI 开放了 API 接口调用,但不支持微调,且未对中国大陆开放注册。上述问题体现了直接使用 GPT-4 赋能通信业存在极大不确定性。而 GPT-4在实测与应用过程中也还存在多类问题,比如事实性错误、答复的生成内容时效性差、专业程度不足等问题。l 事实性错误问题 对于某些确定的事实,GPT-4 给出的答案无法达到较高的置信度,对于常识性的知识问题不能高效地给出符合日常认知的答案。大模型训
156、练所需语料涉及面非常广,仅就人文学科而言,就存在非常庞杂的知识的语料,因此,在标注过程中,相关任务对标注人员的知识面、逻辑思考能力等都有极高的要求。在此基础上,还需要针对更多语料中提及的知识进行自动抽取,反复校验,才可一步步改进上述错误。例如下文示例,唐代崔颢写的是黄鹤楼,而没有登黄鹤楼的诗,但是 GPT-4 却给出了违反事实的答案。AIGC(GPT-4)赋能通信行业应用白皮书 104 图 4-1 GPT-4 生成事实性错误案例 l 知识库信息的时效性不强 由于 GPT-4 目前的版本仅支持 2021 年 9 月之前的语料信息提问,其回答的内容没有进行实时信息关联。训练一个模型的人力成本较大、
157、时间周期较长,短期内难以有效地更新学习即时性的知识信息。例如下述提到俄乌克战争情况时,给出的答案明显时 2021 年之前的信息,对 2022年的信息却提示时未来事件。图 4-2 GPT-4 知识库信息的时效性不强,缺乏分析时政能力 AIGC(GPT-4)赋能通信行业应用白皮书 105 l 专业程度不足的问题 GPT-4 能力覆盖广,但专业深度不足。模型复杂度,丰富性和通用性足够高,但对于某个专业领域方向的资深知识信息结构认知不足。下属例子对中国移动两款套餐的对比,套餐中包含的通话分钟数和流量及限定要求都给出错误答案。图 4-3 GPT-4 缺乏一些专业领域的相关知识 GPT-4 在不同的场景中
158、展示出其应用之便利、性能之强大、前景之广阔,同时也凸显出一些值得关注的隐忧。从某种意义上而言,GPT-4 的出现让诸多领域面临新的挑战,若未引起足够重视,可能会引发负面的社会效应。l 在公共安全方面 公共安全领域主要涉及社会治安和信息安全。就社会治安而言,利用 GPT-4 模仿不同人员的对话习惯,再结合语音合成功能,进而实现高仿 AIGC(GPT-4)赋能通信行业应用白皮书 106 真的人类交流和互动。相关功能如果应用在诈骗等场合,助长违法犯罪,影响社会稳定。就信息安全而言,数据治理面临更大风险,特别是关涉国家安全、商业机密、个人隐私等多方面的敏感数据。GPT-4 模型训练所使用的数据一般为大
159、量可公开的数据和知识,但基于现有的技术研发数据管理体制,不一定能保证直接相关的敏感数据或基于公开数据研究所得的敏感数据不被泄露。l 在道德伦理方面 在伦理道德方面,无论是个人还是社会或国家同样受到一定的影响。从个人的角度来看,对于大多数未成年人,甚至部分成年人,尚未形成成熟且稳定的心智,在使用 GPT-4 的过程中,个人想法很容易被直接或间接地带偏,进而做出不合适的行为;从社会或国家的角度来看,GPT-4 如果作为一个文化冲击的工具,对整个社会和国家将有可能产生不良影响。l 在教育教学方面 在教育教学方面,最为直接的影响是学生在学习过程中,缺乏足够的思考,直接询问 GPT-4,轻松地获取到相关
160、的知识和解答,特别是在论文的写作过程中,直接查询或生成相关内容,不仅不利于学生有效掌握相关知识,无法锻炼问题研究能力,甚至会形成过度依赖,影响学生的创造力,不利于教育的发展。AIGC(GPT-4)赋能通信行业应用白皮书 107 4.2 通信行业 TelcoGPT GPT-4具有优异的通用场景支撑能力,但是对于行业专业知识掌握不足。结合通信行业的特点优势,构建通信行业GPT 大模型(简称TelcoGPT),才能够深度赋能通信行业。通信行业构建 TelcoGPT 具有以下优势:l 行业数据的优势 通信行业基于标准化的体系架构,已经沉淀历史多年的数据,经过场景业务梳理和对数据的处理,可以转化为大规模
161、、多样性、高质量的有效训练数据集,能够更好的提升行业应用模型的精度。l 行业算力的优势 通信行业负责信息通信基础设施的建设和运营,具有云计算、数据中心、边缘计算等一些列算力设施,承载海量数据,在构建大模型方面具备显著的算力资源行业优势。l 行业算法模型的优势 通信行业是新型信息技术的重要策源地和率先应用领域。在 ChatGPT/GPT-4 公布之前,通信行业在网络智能化、营销、计费、客服等方面已经具备大量的 AI 模型沉淀,涵盖文本生成、图片生成、图像生成、视频生成以及多模态生成等场景,标注数据和模型方面的沉淀为通信行业GPT 的构建提供了基础。AIGC(GPT-4)赋能通信行业应用白皮书 1
162、08 l 行业专家的优势 行业 GPT 更需要业务专家的参与,在通信行业拥有大量具备行业知识的 AI 科研工作者,有利于深度打造适合行业场景的大模型。针对通信业务的多样场景,通信行业 GPT 应是包含文本、语音、图像等的跨领域多模态大模型,可帮助通信行业内 IT 域、网络域、政企等不同的业务领域实现自动化与智能化的生产力提升。4.3 TelcoGPT 如何构建?构建 TelcoGPT 需要大量的通信行业多模态数据,在基础大模型上进行继续训练得到,以不同的应用方式赋能通信行业应用场景,如下图所示:图 4-4 通信行业 TelcoGPT 通信行业多模态数据准备 通信行业数据来自于内部收集、公共数据
163、集和第三方数据提供商。在确保数据隐私安全前提下,需要关注数据的准确性和可靠性。数据准备的过程包括数据清洗、标注和格式化,以便于后续的处理。需要准备的数据主要包括:基础大模型BSSGPT通信行业TelcoGPT多模态数据客服文本数据在线音频数据巡检图像数据渠道多模态数据 赋能通信行业应用智能运维智能营销智能计费智能开发智能客服智能CRM商业智能智能网络规划智能网络部署智能网络维护智能网络优化智能网络运营OSSGPT智能路由智能政务语义通信GPTErnieOFAStable DiffusionViLT智能金融NetGPTVerticalGPT AIGC(GPT-4)赋能通信行业应用白皮书 109
164、l 通信行业属性数据:这包括通信行业的新闻报道、行业报告、技术文档、产品说明书、用户手册等。这些数据可以帮助 TelcoGPT 学习通信行业的术语、概念和业务流程。l 客户服务对话数据:这些数据包括客户与通信公司之间的对话,例如客户支持和销售交互。这些数据可以帮助 TelcoGPT 理解客户的需求和问题,并为他们提供解决方案。l 行业标准和法规文件:这些文件包括通信行业的标准规范和法规文件,如电信法规、通信行业标准等。这些数据可以帮助 TelcoGPT 了解通信行业的规范和要求。l 通信技术数据:这些数据包括通信技术的白皮书、技术手册、标准规范等。这些数据可以帮助 TelcoGPT 了解通信技
165、术的原理和应用场景。l 社交媒体数据:这些数据包括用户在社交媒体平台上的对话和反馈。这些数据可以帮助 TelcoGPT 了解用户对通信服务的看法和意见,并提供相应的解决方案。l 语音识别和文本转换数据:这些数据包括通信服务中使用的语音识别和文本转换技术的数据集。这些数据可以帮助 TelcoGPT 学习如何正确地理解和处理客户的语音和文本输入。l 运维装维日志数据:包括在 IT 设备运维、基站巡检、装维等方面的系统日志数据。这些数据可以帮助提升 TelcoGPT 对半结构化日志数据的理解和推理能力。AIGC(GPT-4)赋能通信行业应用白皮书 110 l 研发开发代码数据:包括 IT 软件开发代
166、码、数据库 SQL、业务规则等代码数据。这些数据可以帮助提升 TelcoGPT 在理解并生成自然语言描述的程序逻辑,以及生成符合编程语言语法规则的代码。基础(base)模型选择 受限于从零开始训练一个大模型需要大量的数据资源和算力资源,行业大模型通常基于已有的通用大模型继续训练得到。除了 GPT-4,TelcoGPT 可基于开源开放的通用大模型进行继续训练,例如文心大模型、OFA(One-For-All)多模态大模型、Stable Diffusion 图像生成模型、ViLT(Vision-and-Language Trans-former)多模态视觉-语言模型等。预训练 TelcoGPT 大模
167、型构建,通信行业GPT 的训练仍需要大量的计算资源,尤其对 GPU 资源要求较高。为满足训练要求,不仅需要大量 GPU 资源,还需要考虑分布式训练的实现,以加快训练速度和提高模型性能。此外,为了让模型深入学习到通信行业的知识,不仅要引入通信行业积累的样本数据,还要结合模型与通信领域业务经验设计针对性的预训练任务,如通信领域实体判别、通信领域客服问答匹配、IT 运维日志类别识别等,并需要考虑数据标注问题。模型精调和压缩 在大模型训练完成后,对特定任务和场景,需要考虑模型精调和压缩。在微调过程中,需要根据待标注数据量、数据与 base 大模型数据集相似度进行灵活适配,比如数据量少但是相似度较高情况
168、,需要做的仅是修改模型结构的最后基层即可;在数据量少,但是相似度低的情况,可以考虑冻结模型的初始若干层,并在此训练剩余的层次;在数据量大,数据相似度低的情况下,可以考虑重新训 AIGC(GPT-4)赋能通信行业应用白皮书 111 练;对数据量大,相似度高的情况下,可以保留模型的体系结构和模型的初始权重进行微调即可。在训练过程中,需要对模型进行不断的调优,以提高模型的准确性和性能。调优的方法不仅包括学习率调整、批归一化等算法层面的优化,还需要在模型任务层面针对通信行业做进一步优化,且在调优过程中需要进行实验并记录每个实验的结果,以便于后续分析和决策。学习率,过大会导致模型发生震荡或发散,过小会导
169、致模型收敛缓慢,因此选择合适的学习率是微调模型中非常重要的一步。常用的学习率选择方法分为固定学习率和动态调整学习率。固定学习率是指在微调的整个过程中使用一个恒定的学习率,这种方法简单易行,但需要对不同的任务和模型进行不同的尝试,找到最合适的学习率。动态调整学习率可以在训练的不同阶段采用不同大小的学习率,如在训练初期采取较大学习率快速收敛,在后期选择较小学习率保持稳定,是模型训练中常用的学习率调整策略。批归一化,旨在解决内部协变量偏移(Internal Covariate Shift)的问题,同时也可以提高网络的泛化能力。在神经网络中,每一层的输入分布可能会随着网络参数的变化而变化,这种现象称为
170、内部协变量偏移。当网络的输入分布发生变化时,网络需要不断地调整参数以适应新的输入分布,这会导致训练过程变得困难和缓慢。批归一化通过对每一层的输入进行归一化,将其缩放到均值为 0,方差为 1 的标准正态分布中,从而解决了内部协变量偏移的问题。AIGC(GPT-4)赋能通信行业应用白皮书 112 4.4 亚信科技 TelcoGPT 实践 亚信科技始终跟进大模型、AIGC 等技术发展趋势和成果。在预训练模型出现起就将其作为实现自然语言处理各种任务的基础能力注入到了公司的通用人工智能平台产品,并在通信智能客服、智能营销等领域开展了丰富的应用。随着AIGC 技术的演进,亚信科技正在基于通信行业数据和专业
171、知识,研发通信行业GPT 大模型,发展文本、图片、音频、视频等跨领域多模态内容生成能力,打造新一代的AIGC平台产品,提供高效率的一站式虚拟内容制作和AI内容生成,构建虚拟数字人、数字孪生、虚拟商品、内容生产等典型应用样板间,打造AIGC 生产和产品工程化两量大核心能力。4.4.1 TelcoGPT 文本大模型构建实践 在开源模型 Ernie-3.0-xbase 的基础上使用通信领域客服工单数据继续预训练,得到通信领域的 NLP 行业大模型,该模型应用在通信行业的下游任务中的时候能够更快的收敛且取得更好的效果。图 4-5 Ernie-3.0-xbase 模型结构 AIGC(GPT-4)赋能通信
172、行业应用白皮书 113 l 继续预训练数据准备:清洗通信领域客服工单数据,去除敏感信息及无效信息。将清洗后的数据按行整理为文本文件待使用。使用数据处理脚本将上述文本文件处理为 npz 格式文件,供后续模型训练。l Ernie-3.0-xbase 继续预训练:基于Ernie-3.0-xbase,使用通信领域客服工单数据继续训练,形成该行业领域的预训练大模型,提升大模型对行业应用的适配性。使用数据及算力资源如下表:表 4-1 使用数据及算力资源 训练行业大模型数据量 显存使用(支持单机多卡)训练时长 200 万条 55G(batch_size=64,max_seq_len=512)约 2 周 l
173、效果对比:分别使用 Ernie-3.0-xbase、继续预训练后得到的模型、以及使用自研 MF-ALMA29的非预训练模型完成通信运营商客户投诉工单多分类和通信运营商客户投诉工单层级分类任务,并进行了效果对比。表 4-2 通信运营商客户投诉工单多分类和工单层级分类任务对比 下游任务类型 自研 MF-ALMA 文心 Ernie-3.0-xbase 通信领域 NLP 大模型 平均训练时长 推理精度 平均训练时长 推理精度 平均训练时长 推理精度 文本多分类 13h 85.2%22h 90.8%16h 92.1%文本层级分类 45h 66.7%110h 75.5%80h 77.8%客户来电表示铁通固
174、话无法主叫,前台查询并解释,客户不认可,要求安排 客户来电反映和家固话之前坏了送去维修,现在修好了,但是拿回去线无法接上,要求派工 AIGC(GPT-4)赋能通信行业应用白皮书 114 4.4.2 TelcoGPT 跨模态大模型构建实践 在开源模型 OFA-large 的基础上,使用通信运营商智慧机房、基站巡检、智能安防等场景下的图片文本对数据进行模型微调,得到通信运营商领域的图像描述模型。相较于通用模型,该模型可以更为准确地生成图像描述,以满足客户的需求,提升服务效率。图 4-6 OFA-large 模型结构 l 微调数据:微调数据形式为图像文本对数据,去除敏感图片/文本信息,将数据保存为
175、tsv 文件。其中每一行为一个图像文本对样本,图像以base64 格式存储。图像文本数据样例如下。AIGC(GPT-4)赋能通信行业应用白皮书 115 表 4-3 图像描述任务数据样例 机场内人流量较大,有一些人在行走,有人在看手机 位于草原上的信号塔,有位工人正在信号塔上进行检修工作 l OFA-large 模型微调:基于 OFA-large,使用通信运营商智慧机房、基站巡检、智能安防等场景的图文数据进行模型微调,形成该行业领域的多模态大模型,提升大模型对行业应用的适配性。使用数据及算力资源如下表:表 4-4 图像描述任务资源使用情况 训练通信领域多模态大模型数据量 显存使用(支持单机多卡)
176、训练时长 2 万条 20G(batch_size=8,max_seq_len=512)约 48 小时 l 效果对比:基于通信领域数据微调后的通信多模态模型与通用场景OFA-large 模型的效果对比。AIGC(GPT-4)赋能通信行业应用白皮书 116 表 4-5 图像描述任务效果对比 通信多模态模型 位于山坡上的信号塔严重弯折,存在重大安全隐患,需尽快维修 通用 OFA-large 山顶上的信号塔 4.4.3 亚信科技 AIGC 平台实践 亚信科技 AISWare AI GC 产品面向多模态内容生成,通过预集成文本生成、图像生成、数字人形象生成、交互动作生成、语音生成、素材生成、3D 驱动生
177、成等生成式 AI 工具集,可对外提供虚拟人生产、虚拟商品生产、虚拟场景制作、文案/图片/语音生产等智能内容生产能力。这些能力将成为公司“数智化全栈能力”基座的重要组成。图 4-7 亚信科技 AISWare AI GC 产品功能架构图 AISWare AI GC 产品是有效实现多种生成式 AI 技术能力、多类虚拟资产复用和共享的 AIGC 平台,支持通过标准化的方式,有效地纳管客户已有的三方能力和资产。以上功能架构图分五个层次,描述了各类功能的解耦和组织方式。渲染引擎UEUnityWebGLz智能对话引擎任务型对话知识型对话跨模态理解(图片、视频、行为)闲聊型对话多模态交互zz资源配额管理容器调
178、度资源监控镜像仓库GPU调度虚拟人资产2D真人3D类真人3D卡通3D超写实场景类型场景资源数字身份人物数据虚拟场、虚拟物品文字音乐数字媒体AIGC场景开发与业务编排中心预集成引擎能力统一管理形象生成AI 捏脸人像驱动引擎3D 换装语音交互引擎全双工ASR个性化TTS变声控制面部驱动肢体驱动真人动捕驱动形象创建服务开放能力纳管视频内容制作人机交互管理虚拟人直播工具AIGC Studio数字人播报视频SaaS工具用户化身UGC制作工具人机交互助手超写实数字人直播工具AIGC内容生成 Studio3D模型生成引擎3D场景模块生成3D物品生成数字媒体生成引擎数藏产品生成AI音乐生成文字、图片、视频数字
179、身份人物动画视频图片虚拟资产导入和统一纳管虚拟资产互操作管理虚拟资产导入虚拟资产市场虚拟资产动态预览虚拟资产导出 AIGC(GPT-4)赋能通信行业应用白皮书 117 l 弹性计算层:基于云原生的方式提供资源配额管理、容器调度、资源监控、镜像仓库管理、异构 AI 计算资源调度的能力,为上层提供高安全、高效率的计算资源管理;l 资产层:提供了一整套标准化的,面向各类虚拟资产的数据文件格式定义,包括各类 2D、3D 虚拟人资产;各类虚拟场景、虚拟物品的资源和资产;文字、音乐、图片、视频在内的各种数字媒体资产。同时提供了虚拟资产互操作管理,各类虚拟资产导入导出,虚拟资产市场以及各类虚拟资产动态预览的
180、能力。通过这种资产层开放和标准化的方式,能够有效地帮助客户扩充资产库,保障客户的已有资产投资;l 能力层:研发并预集成了各类上层业务编排和应用所需要的,业界领先的原子能力,包括各类面向驱动、对话、语音、3D 建模、数字媒体生成和渲染引擎等,并可通过开放 API 的方式对上层提供开箱即用的服务能力。同时可以有效支持对 API 的权限管控、访问认证、流量控制,以及对真实服务地址的屏蔽等;l 业务编排层:业务编排层可以通过低代码的方式,面向特定 AIGC 应用场景的需要,灵活组装和调用底层的各项能力,实现应用的快速打造。目前已经预置的业务模板包括形象创建服务、视频内容制作、人机交互管理、虚拟人直播工
181、具。此外在业务编排层还支持开放能力纳管功能,方便用户在进行编排时灵活引入自身已有的或成熟的第 3 方基础能力;l 应用层:当前重点打造的开箱即用的样板间主要有数字人播报视频SaaS 工具、具备 3D 虚拟人形象的人机交互助手、用户可以自服务订制 AIGC(GPT-4)赋能通信行业应用白皮书 118 的数字化身制作工具、超写实数字人直播间以及 AIGC 内容生成 Studio。更多更丰富的 AIGC 应用场景还将进一步陆续推出。4.5 亚信科技可基于 GPT 类大模型赋能的产品系列 面向通信运营商 IT 领域,亚信科技可基于 GPT-4、文言一心等 GPT 类大模型赋能的产品系列,主要包括:超级
182、开发平台、IT运维套件、全域智能运维平台、通用人工智能平台、AI 数智运营平台、场景计费产品、智能化客服系统、客户关系管理系统、数据探索分析产品、知识图谱产品等30。面向通信运营商网络领域,亚信科技可基于 GPT 类大模型赋能的产品系列,主要包括:智能化网络规划优化平台、网络和业务编排系统、5G 网络故障管理系统、智能用户体验管理平台等30。文心一言(英文名:ERNIE Bot)是百度基于文心大模型技术推出的生成式对话产品。亚信科技已成为百度文心一言首批生态合作伙伴。亚信科技的通信人工智能产品体系、数据产品体系、网络智能化产品体系、算力网络产品体系、5G 专网产品体系等可与百度文心一言深度融合
183、,拓展智能服务的新边界,为行业数智化转型进一步提速增效。4.5.1 超级开发平台 超级开发平台(AISWare AiDO-SuperD)提供一站式集成应用开发能力,打通包括有码、低码、无码的各种开发工具,融入软件开发标准流程,让开发者可以一站式完成应用搭建和组装。平台专注于业务场景层的实现,同时也支持能力组件的不断沉淀和面向业务场景的模板构建,建立组件生态大大降低了前台业务创新的成本和门槛。AIGC(GPT-4)赋能通信行业应用白皮书 119 图 4-8 超级开发平台架构 4.5.2 IT 运维套件 IT 运维套件(AISWare AiDO-ITOps),围绕运维产品能力模型,聚焦可观测性、自
184、动化能力、元宇宙运维、大数据实时计算引擎四大场景提供整体运维解决方案。底层 AIOps 通过消息中间件提供学件服务,大数据平台通过 API 方式提供算力和存储服务。图 4-9 IT 运维套件整体架构 运营管理开发执行开发任务开发集成(资产、环境、资源)开发工具(有码、低码、无码)开发工作台开发看板协同开发智能辅助开发基础功能登录管理场景市场组件工厂组件商店权限管理模板市场IT运维套件IT应用系统基础平台运维可视化大屏自动化运维平台可观测性平台MetaOps学件服务算力服务存储服务大数据平台全域智能运维平台数字体验应用性能平台设施可观测性数据 AIGC(GPT-4)赋能通信行业应用白皮书 120
185、 4.5.3 全域智能运维平台 全域智能运维平台(AISWare AIOps)基于已有的运维数据,调用人工智能平台的 AI 能力,围绕故障发现、诊断、处置、预防以及决策支持、资源优化等共性运维场景和需求建设智能运维学件能力,以 API 等方式为各域运维系统注智和赋能。图 4-10 全域智能运维平台架构 4.5.4 通用人工智能平台 通用人工智能平台(AISWare AI)是亚信科技全力打造的面向 5G 的人工智能产品,是提供通用人工智能服务支撑企业智慧中台搭建,支持数据科学家针对业务需求利用 AI 能力挖掘数据资产价值,为全业务域的数据驱动型应用提供认知模型实现注智服务,助力企业完成智能化转型
186、的使能平台。智能运维能力中心学件构建AI平台服务及算法库API Gateway运维监控运维数据学件运营基础设施运维监控云平台运维监控网络运维监控应用运维监控性能数据日志数据告警数据工单数据业务数据资源数据运维数据管理学件管理业务运维监控 AIGC(GPT-4)赋能通信行业应用白皮书 121 图 4-11 通用人工智能平台架构 4.5.5 AI 数智运营平台 AI 数智运营平台是一个场景式精准营销平台,在用户洞察、产品适配、渠道协同、时机推荐、监控评估等营销全流程提供数字化智慧服务。通过自主研发标签 DNA 技术和“人-货-场-时”适配的 AI 算法封装,有效支撑实时场景营销,大大提升企业在互联
187、网时代、新零售时代的营销竞争力;通过 AI 数智运营平台的产品库模块,统一接入企业全量产品、主题内容、促销资源等;提供强大的渠道接入能力,包括企业内部全渠道和互联网主流渠道,甚至可以提供第三方渠道的定制化接入;从条件输入到动作输出的极简编排流程,支撑广泛行业的实时营销开展;提供整体的运营效果大屏展示,并可从多个维度进行深入的效果评估,包括地域、渠道、产品、效益等。AI基础设施云(大数据平台、流计算平台、X86集群、ARM集群等)边(X86/ARM一体机)端(摄像头等传感器)AI模型管理AI2使能推理部署模型开发数据准备API GatewayAI2应用商业运营网络商业智能计费物联网客户体验/管理
188、垂直切片 AIGC(GPT-4)赋能通信行业应用白皮书 122 图 4-12 AI 数智运营平台架构 4.5.6 场景计费产品 场景计费产品是亚信科技基于多年运营商计费系统最佳实践,开发出的稳定、灵活、技术领先的计费/算费系统。功能上支持事件交互、计量管理、计价管理、策略管理以及帐务等关键性事务操作的全覆盖。采用弹性云化架构,通过容器化技术,提供组件化、服务化能力,实现业务灵活编排,应对高并发、多样性场景的业务特性,使能行业数字化;通过注智/融智,AI 能力在智能定价、智能策略、智能信控、出账自动化、稽核等核心模块中得到广泛应用,提升了场景计费系统自动化水平和运维运营效率提升。营销策划活动审批
189、活动管理模板管理监控中心货-产品中心人-用户标签中心AB测试策略综合预演多波次营销时-事件中心场-渠道中心效-效果评估活动部分暂停智慧大脑营销策划中心网格轻便营销CHBN场景营销全空间洞察AI数智运营平台智慧营销策略引擎客户多维分析 AIGC(GPT-4)赋能通信行业应用白皮书 123 图 4-13 场景计费系统架构 4.5.7 智能化客服系统 智能化客服系统,客服中心通过智能化应用建设,以辅助或替代人工客服进行客户接待、咨询答复、电话回访,在服务的实时性、准确性、稳定性等方面实现全面提升。面向高速行业业务场景,通过对智能能力的组装与结合,输出定制化智能场景,以吻合实际业务需求,包括基于语音机
190、器人的智能外呼、基于虚拟人及 5G 视频的无人营业厅、基于情感分析及机器人的座席助手等。图 4-14 智能化客服系统架构 NFV/SDN/ResourceCRM大数据/BI能力开放平台CHFCDFFOFPBCFBCQBC切片定价API定价云资源定价在线鉴权QoS策略SLA策略RFABMF激活订单/资料标签CGF事件交互计量管理定价管理策略管理AI注智SLA定价5G-PaaS集成/组件BillingaaS切片切片切片5GOSSBSSVBiFBilling12客服标准能力融合通信语音平台外呼管理质检管理知识库培训考试绩效排班报表监控工单管理客服智能能力文本机器人统一门户统一权限、认证统一工作台渠道
191、接入场景IVR智能场景化定制应用场景IVVR+业务场景融合化在线客服融合化视频客服基于语音机器人的智能外呼基于机器人+虚拟人+视频的无人营业厅基于语音机器人的座席助手.语音机器人智能质检智能外呼智能工单座席助手自动回访情感分析虚拟人视频客服客情洞察客户画像 AIGC(GPT-4)赋能通信行业应用白皮书 124 4.5.8 客户关系管理系统 客户关系管理系统,主要将 CRM 和业务系统所产生的大量业务信息进行价值提取,通过一系列的分析方法或挖掘工具,对将来的趋势做出必要的预测或寻找某种商业规律,将数据转化为信息,再将信息转化为知识,为企业的战略决策及经营发展提供量化依据。面向运营商业务和服务,实
192、现用户资料管理、计费、出帐、结算等,负责登记用户资料、开启或停止对用户的服务、销售不同资费套餐等营销、销售、服务功能,还包括了资源管理系统、客户服务系统、营销系统、以及与外界的相关服务接口,承载着各种业务系统和运营系统,并实现了各种数据和业务的集成及统一管理。图 4-15 客户关系管理系统架构 4.5.9 数据探索分析产品 数据探索分析产品(AISWare Data Discovery)是以增强分析为内核的智能BI 平台,提供基于云原生的智能数据分析和高级可视化服务,满足以业务为主导的各类数据服务需求。业务能力中心营销应用管理应用通用技术组件能力业务交付层能力管理能力管控运营监控服务保障前台应
193、用技术底座专有云能力运营平台能力中心层订单中心内部运营中心客户中心实时营销中心产商品中心客户交互中心销售中心渠道中心零售库存中心项目管理中心PaaS服务应用创新应用开发交付运维管理 AIGC(GPT-4)赋能通信行业应用白皮书 125 图 4-16 数据探索分析产品架构 4.5.10 知识图谱产品 知识图谱产品(AISWare Knowledge Graph)是涵盖知识获取、存储、建模、计算和管理的一站式全流程知识计算管理平台,为企业数字化转型注入新动能。图 4-17 知识图谱产品架构 环境适配层(技术支撑)营销支撑BI分析/可视化大屏场景电信政企电力交通零售能源实时监控移动办公数据填报经营总
194、结报告微服务异步处理基于Python科学计算GIS技术图形组件容器化Web端访问大屏适配移动端适配Api服务自助取数功能服务层(能力封装)应用适配层(应用场景)行业适配度数据准备数说工复杂报表增强分析知识存储图谱元数据图谱检索和缓存数据图数据智能运维标法智库风险防控金融反欺诈智能客服运营商制造业金融类案匹配类案推荐司法人员研判禁毒打防公安知识工厂原始存储知识开放商品推荐NLP标注平台数据预处理中心多模态数据加工中心知识计算中心通用能力中心图谱分析知识检索知识问答知识库行业赋能 AIGC(GPT-4)赋能通信行业应用白皮书 126 4.5.11 智能化网络规划优化平台 智能化网络规划优化平台(A
195、ISWare ReTiNA)是一套由无线人工智能算法及大数据挖掘能力驱动的网络性能优化系统。系统以用户端到端信令关联分析、栅格汇聚分析为基础为运营商提供 4/5G 无线网络规划、建设、优化及维护一体化解决方案。系统以 AI/ML 的智能算法辅以无线专家经验进行网络问题定位及分析,通过流程引擎完成网络工作闭环管理。图 4-18 智能化网络规划优化平台架构 4.5.12 网络和业务编排系统 网络和业务编排系统(AISWare NSO)是业务和网络资源的统一编排,实现业务端到端的设计与拉通,提供业务智能方案决策、资源灵活分配、业务自动开通、工程快速实施等能力,满足算网业务快速上线,场景灵活编排,流程
196、端到端可视的整体要求。无线自智网络能力平台通信人工智能是引擎无线数据模型是基础高阶无线自智是目标无线性能无线资源MR测量端到端无线数据原始汇聚无线数据应用模型专题应用分析AI人工智能平台引擎场景应用模型场景数据预测AI模型对接接口无线应用场景智能化等级L5L1数据分析智能决策自动执行自动网络调整无线自智跨域赋能预测模型能效评估价值预测强化学习专业数据模型智能网络优化AI赋能 AIGC(GPT-4)赋能通信行业应用白皮书 127 图 4-19 网络和业务编排系统架构 4.5.13 5G 网络故障管理系统 5G 网络故障管理系统(AISWare 5G-FM)实现了全网全业务集中故障管理,网络业务端
197、到端闭环运维管理。构建告警监控、告警关联分析、故障定界定位、故障工单派发全流程的自动化操作能力。基于通信人工智能 AI 学件,实现了多专业跨域 RCA、性能预警预测的智能化,助力客户实现预防式运维模式。图 4-20 5G 网络故障管理系统架构 网络和业务编排系统NSO算网编排专线编排通用编排引擎切片业务管理切片商城切片SLA保障切片生命周期管理算网设计物联网业务云网业务算网编排算网运维5G网络切片编排5G网络切片运营互联网业务业务流程设计业务流程运行执行监控数据管理数据共享数据订阅采集任务调度网络数据采集采集接口适配器网元告警监控网元性能监控拓扑监控场景监控故障管理系统拓扑灵活生成智能RCA后
198、向监督根因分析故障派单事件监控隐患管理性能预警预测网络健康度评估移动APP大屏展示政企业务监控上层应用家客业务监控纳管网元无线网边缘云传输网IP网网络云HSSPGWSGW核心网其它网元IDC计算存储网络 AIGC(GPT-4)赋能通信行业应用白皮书 128 4.5.14 智能用户体验管理平台 智能用户体验管理平台(AISWare CEM)基于 AI 和大数据技术,实现用户级的 ECS 评分,解决网络指标和客户实际感知的差距问题。客户体验管理平台基于 O/B 域融合的客户感知评估模型,面向客户、网络、业务实现客户满意度的全面改善和提升。图 4-21 智能用户体验管理平台架构 管理平台数据处理用户
199、级数据来源NPS调研数据B域大数据(CRM/经分)网络资源和性能系统电子渠道客服系统5G信令及DPI系统智能服务对外赋能开放接口(基于OAuth2.0)智能引擎用户体验仪表盘数据存储数据预处理数据采集实时流处理分布式处理平台质差定界分析用户服务保障用户体验领导视图图形化界面及报表系统计费系统数据处理AISWare CEM客户体验管理算法框架 AIGC(GPT-4)赋能通信行业应用白皮书 129 五.总结和展望 以 ChatGPT/GPT-4 为代表的 AIGC 迈出了通用人工智能的第一步,开启了AI 新代际,打开了诸多行业变革的想象天窗。AIGC 大模型将使机器可以大规模参与知识类和创造性工作
200、,成为继移动互联网之后未来最大的技术平台。ChatGPT 首次实现了人与机器之间自然的交互界面,GPT-4 具备更高的交互理解力和准确率。通信行业作为人与人、人与自然、人与机器之间进行信息交流与传递的行业,天然具有与 ChatGPT/GPT-4 的结合力。基于白皮书的分析可以看到,AIGC 可作为先进生产力工具改进信息通信服务能力,从各个层面深度赋能通信业,构建为千行百业数字化转型赋能的智慧通信。与此同时,AIGC 也将推动通信业从人与人之间的沟通交流扩展到人与机器之间的沟通交流,支撑人机物三元融合。从内涵和外延看,通信行业必须积极拥抱大模型。算力发展是人工智能的核心要素之一。大模型、基础模型
201、在开启人工智能技术新代际和应用新范式的条件下,对于算力的庞大需求将形成巨大挑战,也必将带动算力基础设施的发展。算力建设将是决定人工智能赋能各行各业的广度与深度的重要因素。通信行业运营商作为国家信息通信基础设施建设者和运营者,也是让大模型实现普惠智能服务的承载者。随着摩尔定律的逐步放缓,数据中心、边缘节点、智能终端等单点算力正在面临瓶颈。以 5G 为代表的通信基础设施和以云计算为代表的信息基础设施的高质量发展,为网络与算力融合提供了基础条件。在算力作为数字经济的关键生产力,已形成新的全球竞争格局的状态下,我国通信行业率先提出了算力网络技术并主导了这一新型信息通信基础设施的发展建设,在产业方面已初
202、步形成算力网络软硬件基础设施及平台与应用服务的上中下游完整产 AIGC(GPT-4)赋能通信行业应用白皮书 130 业链。算力网络的内涵就是要以网调算、以网融算、以网强算,通过网络对算力的感知、触达、编排、调度能力,在算网拓扑的任何一个接入点,为用户的任何计算任务可灵活、实时、智能匹配并调用最优的算力资源,从而实现云-边-端任何时间与任何地点的多方算力需求。基于算力网络对先进算力进行集中化建设使用和集约化发展,提升大模型构建和使用的算力能效,为大模型普惠智能服务提供高效基础支撑,也是在先进半导体面临严格管制的情况下通信行业节约算力投资、提升计算产业安全的重要举措。面向 2030 的通信系统,6
203、G 的竞争已经开始。中国 IMT-2030(6G)推进组提出“万物智联、数字孪生”的 6G 总体愿景。6G 将与先进计算、大数据、人工智能、区块链等信息技术交叉融合,成为服务生活、赋能生产、绿色发展的基本要素。6G 将构建人机物智慧互联、智能体高效互通的新型网络,具备智慧内生、多维感知、数字孪生、安全内生等新功能;将实现物理世界人与人、人与物、物与物的高效智能互联,打造泛在精细、实时可信、有机整合的数字世界。可以展望,AIGC 大模型与通信的融合将加快 6G 智慧内生、全自智网络的能力演进,即 AI4Network;6G 万物智联,将加快普惠智能的实现,即 Network4AI。AIGC(GP
204、T-4)赋能通信行业应用白皮书 131 参考文献 1 Vaswani A,Shazeer N,Parmar N,et al.Attention is all you needJ.Advances in neural information processing systems,2017,30.2 Radford A,Narasimhan K,Salimans T,et al.Improving language understanding by generative pre-trainingJ.2018.3 Radford A,Wu J,Child R,et al.Language model
205、s are unsupervised multitask learnersJ.OpenAI blog,2019,1(8):9.4 Brown T,Mann B,Ryder N,et al.Language models are few-shot learnersJ.Ad-vances in neural information processing systems,2020,33:1877-1901.5 Ouyang L,Wu J,Jiang X,et al.Training language models to follow instructions with human feedbackJ
206、.arXiv preprint arXiv:2203.02155,2022.6 OpenAI,GPT-4 Technical Report,2023.7 Qiu X,Sun T,Xu Y,et al.Pre-trained models for natural language processing:A surveyJ.Science China Technological Sciences,2020,63(10):1872-1897.8 Topal M O,Bas A,van Heerden I.Exploring transformers in natural language gener
207、ation:Gpt,bert,and xlnetJ.arXiv preprint arXiv:2102.08036,2021.9 Devlin J,Chang M W,Lee K,et al.Bert:Pre-training of deep bidirectional trans-formers for language understandingJ.arXiv preprint arXiv:1810.04805,2018.10 Raffel C,Shazeer N,Roberts A,et al.Exploring the limits of transfer learning with
208、a unified text-to-text transformerJ.The Journal of Machine Learning Re-search,2020,21(1):5485-5551.11 Schulman J,Zoph B,Kim C,et al.ChatGPT:Optimizing language models for di-alogueJ.2022.12 Tom Henighan,Jared Kaplan,Mor Katz,Mark Chen,Christopher Hesse,Jacob Jackson,Heewoo Jun,Tom B.Brown,Prafulla D
209、hariwal,Scott Gray,et al.Scaling laws for autoregressive generative modeling.arXiv preprint arXiv:2010.14701,2020.13 Rajani et al.,What Makes a Dialog Agent Useful?,Hugging Face Blog,2023.14 Chung,Hyung Won et al.“Scaling Instruction-Finetuned Language Mod-els.”ArXiv abs/2210.11416(2022):n.pag.15 We
210、i,Jason et al.“Chain of Thought Prompting Elicits Reasoning in Large Lan-guage Models.”ArXiv abs/2201.11903(2022):n.pag.16 Gilson A,Safranek C,Huang T,et al.How Well Does ChatGPT Do When Taking the Medical Licensing Exams?The Implications of Large Language Models for Medical Education and Knowledge
211、AssessmentJ.medRxiv,2022:2022.12.23.22283901.AIGC(GPT-4)赋能通信行业应用白皮书 132 17 Susnjak T.ChatGPT:The End of Online Exam Integrity?J.arXiv preprint arXiv:2212.09292,2022.18 国泰君安证券,ChatGPT 研究框架(2023)行业专题研究EB/OL,2023 年 02 月07 日。19 Rombach,Robin et al.“High-Resolution Image Synthesis with Latent Diffusion M
212、odels.”2022 IEEE/CVF Conference on Computer Vision and Pattern Recog-nition(CVPR)(2021):10674-10685.20 Agostinelli,A.,MusicLM:Generating Music From TextJ.arXiv preprint arXiv.2301.11325,2023.21 Molad,E.,Dreamix:Video Diffusion Models are General Video EditorsJ.arXiv preprint arXiv.2302.01329,2023.22
213、 Frolov,Stanislav et al.“Adversarial Text-to-Image Synthesis:A Review.”Neu-ral networks:the official journal of the International Neural Network Society 144(2021):187-209.23 Hernandez-Olivan,C.and Beltran,J.R.,Music Composition with Deep Learning:A ReviewJ.arXiv preprint arXiv.2108.12290,2021.24 Yu,
214、W.et al.“A Survey of Knowledge-enhanced Text Generation.”ACM Com-puting Surveys 54(2020):1-38.25 Ye OUYANG,Lilei WANG,Aidong YANG,Maulik SHAH,David BELANGER,Tongqing GAO,Leping WEI,Yaqin ZHANG.Next decade of telecommunica-tions artificial intelligenceJ.Telecommunications Science,2021,37(3):1-36.26 亚
215、信科技、清华大学智能产业研究院、中国移动、中国电信、Intel,通信人工智能赋能自智网络 白皮书,2021.12。27 孙杰,孙滔,孙震强等.5G 价值面,BSS/OSS 融合的下一站J.电信科学,2022,38(05):136-148。28 乔稳,王晓征,孙震强等.下一代电信 IT 架构初探:业务功能虚拟化(BFV)J.电信科学,2022,38(06):143-155。29 Yong Song,Xiaozhou Ye,Ye Ouyang et al.,Hierarchical Multi-label Text Classi-fication based on a Matrix Factorization and Recursive-Attention Approach,2022 7th International Conference on Big Data Analytics(ICBDA),Guangzhou,China,2022,pp.170-176,doi:10.1109/ICBDA55095.2022.9760305.30 亚信科技产品集,https:/