上海品茶

您的当前位置:上海品茶 > 报告分类 > PDF报告下载

AIGC行业专题报告:2023年有望成为AIGC的拐点-230130(19页).pdf

编号:113716 PDF  DOCX   19页 1.89MB 下载积分:VIP专享
下载报告请您先登录!

AIGC行业专题报告:2023年有望成为AIGC的拐点-230130(19页).pdf

1、 1|请务必仔细阅读报告尾部的重要声明 行业专题报告行业专题报告|计算机计算机 2023 年有望成为 AIGC 的拐点 AIGC 行业专题报告 核心结论核心结论 行业评级行业评级 超配超配 前次评级 超配 评级变动 维持 近一年近一年行业行业走势走势 相对表现相对表现 1 个月个月 3 个月个月 12 个月个月 计算机 12.46 15.24-8.40 沪深 300 8.00 18.08-8.38 分析师分析师 邢开允邢开允 S0800519070001 赵宇阳赵宇阳 S0800522090002 相关研究相关研究 计算机:安全与发展并重2023

2、 年计算机行业年度策略 2022-11-30 计算机:职教信息化:用智慧锻造制造强国职教智慧教育专题 2022-10-22 计算机:高校信息化:疫情影响有限,强国必经之途高校智慧教育专题 2022-10-17 GAN/CLIP/Diffusion 是是 AIGC(AI-Generated Content)发展的三大模型。发展的三大模型。目前 AIGC 生成正在完成从简单的降本增效(以生成金融/体育新闻为代表)向创造额外价值(以提供绘画创作素材为代表)转移,跨模态/多模态内容成为关键的发展节点。AIGC 拥有三大模型:GAN、CLIP 和 Diffusion。AIGC 应用场景广泛。应用场景广泛

3、。1)文本生成:文本交互成为未来发展方向;2)音频生成:AI 编曲将成为 AI 音频生成中的快速成长赛道;3)图像生成:目前仍然难以达到稳定可靠的生成高质量图像;4)视频生成:跨模态生成领域的中高潜力场景;5)图像、视频、文本间的跨模态生成:文本到视频转换目前还处于技术尝试阶段;6)策略生成:国内相关游戏厂商普遍存在内部开发或外部测试需求;7)虚拟人生成:视频是短期的发展重点。中国中国 AIGC 产业仍处于发展初期,底层技术相较国外仍有较大差距。产业仍处于发展初期,底层技术相较国外仍有较大差距。国内最先兴起的是 AI 写作和语音合成模块,虚拟人概念刚兴起,但技术层面还存在差距,众多国内厂商从内

4、容布局入手,同时众多厂商目前商业模式不成熟,还停留在免费引流阶段。此外,AIGC 目前主要客户集中在 B 端,厂商话语权较弱,未来会向 2B+2C 方向发展,B 端降本增效是根本诉求,C 端的付费逻辑在于高效获取信息,替代表达以及扩大用户创造力。2023 年年有望成为有望成为 AIGC 发展大年。发展大年。近期微软、谷歌等全球计软件互联网大厂大力投入 AIGC,并开始探索应用层面的突破,AIGC 已经来到 2 年前自动驾驶的应用突破拐点,2023 年有望成为 AIGC 大年。类似 ChatGPT 的“大模型”作为 AIGC 的底层平台,将成为 AIGC 的核心资源。建议关注:建议关注:1、自研

5、 AIGC 大模型或者有相关 AI 技术布局的上市公司:云从科技、拓尔思、金山办公、科大讯飞、商汤科技等;2、掌握独特场景,拥有 AIGC 应用场景的上市公司:汉仪科技、万兴科技、新国都、海天瑞声。风险提示:政策监管出现变化;技术更新不及预期。-30%-25%-20%-15%-10%-5%0%5%-062022-10计算机沪深300证券研究报告证券研究报告 2023 年 01 月 30 日 行业专题报告|计算机 西部证券西部证券 2023 年年 01 月月 30 日日 2|请务必仔细阅读报告尾部的重要声明 索引 内容目录 一、GAN/CLIP/Diffusion 是 AI

6、GC 发展的三大模型.4 二、AIGC 应用场景广泛.7 2.1 文本生成:文本交互成为未来发展方向.7 2.2 音频生成:AI 编曲将成为 AI 音频生成中的快速成长赛道.9 2.3 图像生成:目前仍然难以达到稳定可靠的生成高质量图像.11 2.4 视频生成:跨模态生成领域的中高潜力场景.12 2.5 图像、视频、文本间的跨模态生成:文本到视频转换目前还处于技术尝试阶段.13 2.6 策略生成:国内相关游戏厂商普遍存在内部开发或外部测试需求.14 2.7 虚拟人生成:视频是短期的发展重点.15 三、中国 AIGC 产业仍处于发展初期,2023 年有望成为 AIGC 发展大年.16 四、建议关

7、注.17 五、风险提示.18 图表目录 图 1:GAN 网络整体示意.5 图 2:CLIP 模型原理.6 图 3:Imagen 生成结果.7 图 4:各类生成模型对比图.7 图 5:澜舟科技文本续写功能.8 图 6:彩云小梦剧情续写功能.8 图 7:写作猫文本辅助功能.9 图 8:小冰岛 AI 聊天界面.9 图 9:文字转音频功能展示.10 图 10:AI 智能配音功能.10 图 11:网易-有灵智能创作平台.11 图 12:EditGAN 支持图像进行细节修改.11 图 13:DeepFaceDrawing 草图变完整图像效果.12 图 14:剪映视频氛围渲染.12 图 15:视频换脸原理.

8、13 图 16:DALLE2 生成结果.13 图 17:百度智能视频合成平台功能展示.14 图 18:腾讯 AI Lab 在游戏领域的全栈布局.14 图 19:数字分身视频制作界面.15 nXkZsUpZgYeXfYcZvYdUaQ9RaQtRoOpNtQeRnNrQfQpMoP6MnNvMNZtQoONZrQrP 行业专题报告|计算机 西部证券西部证券 2023 年年 01 月月 30 日日 3|请务必仔细阅读报告尾部的重要声明 图 20:小冰虚拟人产品.16 图 21:AIGC 产业链.16 图 22:ChatGPT 对话展示.17 表 1:AIGC 发展历程.4 表 2:AIGC 技术应

9、用场景.4 表 3:AIGC 的三大模型.5 行业专题报告|计算机 西部证券西部证券 2023 年年 01 月月 30 日日 4|请务必仔细阅读报告尾部的重要声明 一、一、GAN/CLIP/Diffusion是是AIGC发展的三大模型发展的三大模型 AIGC(AI-Generated Content)是利用人工智能技术来生成内容。是利用人工智能技术来生成内容。2021 年之前,AIGC生成的主要还是文字,而新一代模型可以处理的格式内容包括:文字、语音、代码、图像、视频、机器人动作等等。AIGC 被认为是继专业生产内容(PGC,professional-generated content)、用户

10、生产内容(UGC,User-generated content)之后的新型内容创作方式,可以在创意、表现力、迭代、传播、个性化等方面,充分发挥技术优势。表 1:AIGC 发展历程 阶段阶段 特点特点 典型事件典型事件 早期萌芽阶段(20 世纪 50 年代至 90 年代中期)受限于科技水平,AIGC 仅限于小范围实验 1950 年,艾伦图灵提出著名的“图灵测试”,给出判定机器是否具有“智能”的试验方法;1957 年,第一支由计算机创作的弦乐四重奏依利亚克组曲(llliac Suite)完成;1966 年,世界第一款可人机对话的机器人“Eliza”问世 80 年代中期,IBM 创造语音控制打字机

11、Tangora。沉淀积累阶段(20 世纪 90 年代中期至 21 世纪 10年代中期)AIGC 从实验性向实用性转变,受限于算法瓶颈,无法直接进行内容生产 2007 年,世界第一部完全由人工智能创作的小说1 The Road问世;2012 年,微软展示全自动同声传译系统,可将英文演讲者的内容自动翻译成中文语音。快速发展阶段(21 世纪 10 年代中期至今)深度学习算法不断迭代,人工智能生成内容百花齐放,效果逐渐逼真直至人类难以分辨 2014 年,lan J.Goodfellow 提出生成式对抗网络 GAN;2017 年,微软“小冰”推出世界首部 100%由人工智能创作的诗集阳光失了玻璃窗;20

12、18 年英伟达发布 StyleGAN 模型可以自动生成高质量图片 2018 年,人工智能生成的图作在佳士得拍卖行以 43.25 万美元成交,成为首个出售的人工智能艺术品;2019 年,DepMind 发布 DVD-GAN 模型用以生成连续视频 2021 年,OpenAI 推出 DALL-E,主要应用于文本与图像交互生成内容。资料来源:中国信通院、西部证券研发中心 目前 AIGC 生成正在完成从简单的降本增效(以生成金融/体育新闻为代表)向创造额外价值(以提供绘画创作素材为代表)转移,跨模态/多模态内容成为关键的发展节点。表 2:AIGC 技术应用场景 场景场景 内容内容 AIGC 技术场景 文

13、本生成 非交互式文本 结构化写作(新闻播报等,又比较强的规律)非结构化写作(剧情续写、营销文本等,需要一定创意和个性化)辅助性写作(推荐相关内容、帮助润色,部署于严格 AIGC)交互性文本 闲聊机器人(虚拟男/女友、心理咨询等)文本交互游戏等(AI dungeon 等)音频生成 语音克隆 文本生成特定语言(生成虚拟人歌声/播报等)乐曲/歌曲生成(包含作曲及编曲,在实际应用中常包含自动作词)图像生成 图像编辑工具(去除水印、提高分辨率、特定滤镜等)图像自动生成 创意图像生成(随机或按照特定属性生成画作等)行业专题报告|计算机 西部证券西部证券 2023 年年 01 月月 30 日日 5|请务必仔

14、细阅读报告尾部的重要声明 功能性图像生成(根据指定要求生成营销类海报、模特图、logo 等)视频生成 视频属性编辑(删除特定主体、生成特效、跟踪剪辑等)视频自动剪辑(对特定片段进行检测及合成)视频部分编辑(视频换脸等)图像、视频、文本间跨模态生成 文字生成图像(根据文字 prompt 生成创意图像)文字生成演示视频(拼接图片素材生成视频)文字生成创意视频(完全从头生成特定主题视频)图像/视频到文本(视觉问答系统、自动配字幕/标题等)策略生成(以 Game AI 中 AI bot 为代表)Game AI AI Bot NPC 逻辑剧情生成 数字资产生成 虚拟人生成 虚拟人视频生成 虚拟人实时交互

15、 资料来源:量子位智库、西部证券研发中心 AIGC 的三大模型:的三大模型:“对抗生成网络”GAN(Generative Adverserial Network,以下简称“GAN”)是很多 AIGC的基础框架,GAN 包含有两个模型,一个是生成模型(generative model),一个是判别模型(discriminative model)。生成模型的任务是生成看起来自然真实的、和原始数据相似的实例。判别模型的任务是判断给定的实例看起来是自然真实的还是人为伪造的(真实实例来源于数据集,伪造实例来源于生成模型)。图 1:GAN 网络整体示意 资料来源:AI 遇见机器学习、西部证券研发中心 但是

16、 GAN 有三个不足:1)对输出结果的控制力较弱,容易产生随机图像;2)生成的图像分别率较低;3)由于 GAN 需要用判别器来判断生产的图像是否与其他图像属于同一类别,这就导致生成的图像是对现有作品的模仿,而非创新。因此依托 GAN 模型难以创作出新图像,也不能通过文字提示生成新图像。表 3:AIGC 的三大模型 深度学习模型深度学习模型 出现时间出现时间 特点特点 行业专题报告|计算机 西部证券西部证券 2023 年年 01 月月 30 日日 6|请务必仔细阅读报告尾部的重要声明 深度学习模型深度学习模型 出现时间出现时间 特点特点 1 GAN 2014 1、生成器用来生成图片,判别器用来判

17、断图片质量,两者互相平衡之后得到结果。2、对输出结果的控制力较弱,容易产生随机图像、分辨率比较低。2 CLIP 2021 1、进行自然语言理解和计算机视觉分析。2、使用已经标注好的“文字-图像”训练数据。一方面对文字进行模型训练。另一方面对图像进行另一个模型的训练,不断调整两个模型内部参数,使得模型分别输出的文字特征值和图像特征值并确认匹配。3 Diffusion 2022 1、通过增加噪声破坏训练数据来学习,然后找出如何逆转这种噪声过程以恢复原始图像。2、经过训练,该模型可以应用这些去噪方法,从随机输入中合成新的“干净”数据。资料来源:腾讯科技、西部证券研发中心 CLIP 模型能够将文字和图

18、像进行关联,比如将文字“狗”和狗的图像进行关联,并且关联的特征非常丰富。因此,CLIP 模型具备两个优势:1)同时进行自然语言理解和计算机视觉分析,实现图像和文本匹配。2)为了有足够多标记好的“文本-图像”进行训练,CLIP模型广泛利用互联网上的图片,这些图片一般都带有各种文本描述,成为 CLIP 天然的训练样本。据腾讯科技公众号显示,CLIP 模型搜集了网络上超过 40 亿个“文本-图像”训练数据,这为后续 AIGC 尤其是输入文本生成图像/视频应用的落地奠定了基础。在预测阶段,也是通过一系列生成的文本对和目标图像,计算 cosine similarities 从而获取预测值。图 2:CLI

19、P 模型原理 资料来源:HIGH-FLYER、西部证券研发中心 随后出现的 Diffusion 扩散化模型,则真正让文本生成图像的 AIGC 应用为大众所熟知,也是 2022 年下半年 Stable Diffusion 应用的重要推手。Diffusion 模型有两个特点:1)给图像增加高斯噪声,通过破坏训练数据来学习,然后找出如何逆转这种噪声过程以恢复原始图像。经过训练,该模型可以从随机输入中合成新的数据。2)Stable Diffusion 把模型的计算空间从像素空间经过数学变换,降维到一个可能性空间(Latent Space)的低维空间里,这一转化大幅降低了计算量和计算时间,使得模型训练效

20、率大大提高。这算法模式的创新直接推动了 AIGC 技术的突破性进展。一句话概括 diffusion model,即存在一系列高斯噪声(T 轮),将输入图片 X0 变为纯高斯噪声 Xt。而我们的模型则负责将 Xt 复原回图片 X0。这样一来其实 diffusion model 和 GAN很像,都是给定噪声 Xt 生成图片 X0,但是要强调的是,这里噪声 Xt 与图片 X0 是同维度 行业专题报告|计算机 西部证券西部证券 2023 年年 01 月月 30 日日 7|请务必仔细阅读报告尾部的重要声明 的。图 3:Imagen 生成结果 资料来源:计算机视觉论文速递、西部证券研发中心 图 4:各类生

21、成模型对比图 资料来源:计算机视觉论文速递、西部证券研发中心 二、二、AIGC应用场景广泛应用场景广泛 2.1 文本生成:文本交互成为未来发展方向文本生成:文本交互成为未来发展方向 应用型文本:应用型文本:大多为结构化写作,以客服类的聊天问答、新闻撰写等为核心场景。最为典型的是基于结构化数据或规范格式,在特定情景类型下的文本生成,如体育新闻、金融新闻、公司财报、重大灾害等简讯写作。Narrative Science 创始人甚至曾预测,到 2030 年,90%以上的新闻将由机器人完成。行业专题报告|计算机 西部证券西部证券 2023 年年 01 月月 30 日日 8|请务必仔细阅读报告尾部的重要

22、声明 图 5:澜舟科技文本续写功能 资料来源:澜舟科技官网、西部证券研发中心 创作型文本创作型文本:主要适用于剧情续写、营销文本等细分场景等,具有更高的文本开放度和自由度,需要一定的创意和个性化,对生成能力的技术要求更高。我们使用了市面上的小说续写、文章生成等 AIGC 工具。发现长篇幅文字的内部逻辑仍然存在较明显的问题、且生成稳定性不足,尚不适合直接进行实际使用。除去本身的技术能力之外,由于人类对文字内容的消费并不是单纯理性和基于事实的,创作型文本还需要特别关注情感和语言表达艺术。图 6:彩云小梦剧情续写功能 资料来源:彩云小梦官网、西部证券研发中心 文本辅助:文本辅助:除去端到端进行文本创

23、作外,辅助文本写作其实是目前国内供给及落地最为广泛的场景。主要为基于素材爬取的协助作用,例如定向采集信息素材、文本素材预处理、自动聚类去重,并根据创作者的需求提供相关素材。行业专题报告|计算机 西部证券西部证券 2023 年年 01 月月 30 日日 9|请务必仔细阅读报告尾部的重要声明 图 7:写作猫文本辅助功能 资料来源:写作猫官网、西部证券研发中心 文本交互:文本交互:例如虚拟伴侣、游戏中的 NPC 个性化交互等。2022 年夏季上线的社交 AIGC叙事平台Hidden Door以及基于 GPT-3 开发的文本探索类游戏 AI dungeon 均已获得了不错的消费者反馈。案例:小冰发布小

24、冰岛 APP,每个用户均可创造自己的岛屿,并连带拥有一个功能类似于微信和 LINE 等社交产品的完整社交交互界面。用户不仅能在岛屿中体验丰富的视觉和自然音场,也不仅能与人工智能个体进行对话,而是再造了完整的一对一对话、群聊、朋友圈和技能生态体验。图 8:小冰岛 AI 聊天界面 资料来源:小冰岛 APP、西部证券研发中心 2.2 音频生成:音频生成:AI编曲将成为编曲将成为AI音频生成中的快速成长赛道音频生成中的快速成长赛道 TTS(Text-to-speech)场景:)场景:泛应用于客服及硬件机器人、有声读物制作、语音播报等任务。例如倒映有声与音频客户端“云听”APP 合作打造 AI 新闻主播

25、,提供音频内容服务的一站式解决方案,以及喜马拉雅运用 TTS 技术重现单田芳声音版本的 毛氏三兄弟和历史类作品。这种场景为文字内容的有声化提供了规模化能力。行业专题报告|计算机 西部证券西部证券 2023 年年 01 月月 30 日日 10|请务必仔细阅读报告尾部的重要声明 图 9:文字转音频功能展示 资料来源:倒映有声官网、西部证券研发中心 随着内容媒体的变迁,短视频内容配音已成为重要场景。部分软件能够基于文档自动生成解说配音,上线有150+款包括不同方言和音色的AI智能配音主播。代表公司有九锤配音、加音、XAudioPro、剪映等。图 10:AI 智能配音功能 资料来源:加音官网、西部证券

26、研发中心 乐曲乐曲/歌曲生成:歌曲生成:AIGC 在词曲创作中的功能可被逐步拆解为作词(NLP 中的文本创作/续写)、作曲、编曲、人声录制和整体混音。目前而言,AIGC 已经支持基于开头旋律、图片、文字描述、音乐类型、情绪类型等生成特定乐曲。通过这一功能,创作者即可得到 AI 创作的纯音乐或乐曲中的主旋律。2021 年末,贝多芬管弦乐团在波恩首演人工智能谱写完成的贝多芬未完成之作第十交响曲,即为 AI 基于对贝多芬过往作品的大量学习,进行自动续写。行业专题报告|计算机 西部证券西部证券 2023 年年 01 月月 30 日日 11|请务必仔细阅读报告尾部的重要声明 图 11:网易-有灵智能创作

27、平台 资料来源:有灵智能官网、西部证券研发中心 2.3 图像生成图像生成:目前仍然难以达到稳定可靠的生成高质量图像目前仍然难以达到稳定可靠的生成高质量图像 图像属性及部分编辑:图像属性及部分编辑:属性编辑部分,可以直观的将其理解为经 AI 降低门槛的 PhotoShop。目前而言,图片去水印、自动调整光影、设置滤镜(如 Prisma、Versa、Vinci 和 Deepart)、修改颜色纹理(如 DeepAI)、复刻/修改图像风格(DALLE 2 已经可以仅凭借单张图像进行风格复刻、NightCafe 等)、提升分辨率等已经常见。图像部分编辑部分,指部分更改图像部分构成(如英伟达 CycleG

28、AN 支持将图内的斑马和马进行更改)、修改面部特征(Metaphysics,可调节自身照片的情绪、年龄、微笑等;以Deepfake 为代表的图像换脸)。图 12:EditGAN 支持图像进行细节修改 资料来源:量子位智库、西部证券研发中心 图像端到端生成:图像端到端生成:此处则主要指基于草图生成完整图像(VansPortrait、谷歌 Chimera painter 可 画 出 怪 物、英 伟 达 GauGAN 可 画 出 风 景、基 于 草 图 生 成 人 脸 的DeepFaceDrawing)、有机组合多张图像生成新图像(Artbreeder)、根据指定属性生成目标图像(如 Rosebud

29、.ai 支持生成虚拟的模特面部)等。行业专题报告|计算机 西部证券西部证券 2023 年年 01 月月 30 日日 12|请务必仔细阅读报告尾部的重要声明 图 13:DeepFaceDrawing 草图变完整图像效果 资料来源:人工智能、西部证券研发中心 2.4 视频生成:视频生成:跨模态生成领域的中高潜力场景跨模态生成领域的中高潜力场景 视频属性编辑:视频属性编辑:例如视频画质修复、删除画面中特定主体、自动跟踪主题剪辑、生成视频特效、自动添加特定内容、视频自动美颜等。图 14:剪映视频氛围渲染 资料来源:剪映 APP、西部证券研发中心 视频自动剪辑:视频自动剪辑:基于视频中的画面、声音等多模

30、态信息的特征融合进行学习,按照氛围、情绪等高级语义限定,对满足条件片段进行检测并合成。目前还主要在技术尝试阶段。典型案例包括 Adobe 与斯坦福共同研发的 AI 视频剪辑系统、IBM Watson 自动剪辑电影预 行业专题报告|计算机 西部证券西部证券 2023 年年 01 月月 30 日日 13|请务必仔细阅读报告尾部的重要声明 告片、以及 Flow Machine。我国的影谱科技推出了相关产品,能够基于视频中的画面、声音等多模态信息的特征融合进行学习,按照氛围、情绪等高级语义限定,对满足条件片段进行检测并合成。视频部分生成(以视频部分生成(以 Deepfake 为典型代表):为典型代表)

31、:视频到视频生成技术的本质是基于目标图像或视频对源视频进行编辑及调试,通过基于语音等要素逐帧复刻,能够完成人脸替换、人脸再现(人物表情或面部特征的改变)、人脸合成(构建全新人物)甚至全身合成、虚拟环境合成等功能。图 15:视频换脸原理 资料来源:deepfake、西部证券研发中心 2.5 图像、视频、文本间的跨模态生成图像、视频、文本间的跨模态生成:文本到视频转换目前还处于技术尝试文本到视频转换目前还处于技术尝试阶段阶段 文字生成图像:文字生成图像:2021 年,OpenAI 的 CLIP 和 DALLE 开启了 AI 绘画重要的一年。同年,CVPR2021 收录的 VQGAN 也引发了广泛关

32、注。2022 年被称为“AI 绘画“之年,多款模型/软件证明了基于文字提示得到效果良好的图画的可行性,Diffusion Model 受到广泛关注。图 16:DALLE2 生成结果 资料来源:计算机视觉论文速递、西部证券研发中心 行业专题报告|计算机 西部证券西部证券 2023 年年 01 月月 30 日日 14|请务必仔细阅读报告尾部的重要声明 文字生成视频:文字生成视频:在一定程度上,文本生成视频可以看作是文本生成图像的进阶版技术。按照技术生成难度和生成内容,可以区分为拼凑式生成和完全从头生成两种方式。拼凑式生成的技术是指基于文字(涉及 NLP 语义理解)搜索合适的配图、音乐等素材,在已有

33、模板的参考下完成自动剪辑。这类技术本质是“搜索推荐+自动拼接”,门槛较低,背后授权素材库的体量、已有模版数量等成为关键因素。完全从头生成视频则是指由 AI 模型基于自身能力,不直接引用现有素材,生成最终视频。图 17:百度智能视频合成平台功能展示 资料来源:百度智能视频合成平台官网、西部证券研发中心 图像图像/视频到文本:视频到文本:具体应用包括视觉问答系统、配字幕、标题生成等,这一技术还将有助于文本图像之间的跨模态搜索。代表模型包括 METER、ALIGN 等。2.6 策略生成:策略生成:国内相关游戏厂商普遍存在内部开发或外部测试需求国内相关游戏厂商普遍存在内部开发或外部测试需求 GameA

34、I:以腾讯 AI Lab 在游戏制作领域的布局为例,人工智能在游戏前期制作、游戏中运营的体验及运营优化、游戏周边内容制作的全流程中均有应用。图 18:腾讯 AI Lab 在游戏领域的全栈布局 资料来源:量子位智库、西部证券研发中心 AI Bot,也即游戏操作策略生成:,也即游戏操作策略生成:可以将其简单理解为人工智能玩家,重点在于生成真实对战策略。2016 年 Deepmind AlphaGO 在围棋中有所展示,随后,AI 决策在 Dota2、StarCraft2、德扑、麻将等游戏领域中均展现出了良好的实力。NPC 逻辑及剧情生成,也即由逻辑及剧情生成,也即由 AI 生成底层逻辑:生成底层逻辑

35、:此前,NPC 具体的对话内容及底层剧情需要人工创造驱动脚本,由制作人主观联想不同 NPC 所对应的语言、动作、操作逻辑等,这种动态的个性化匹配背后依旧是不同的静态分支,创造性及个性化相对有限。行业专题报告|计算机 西部证券西部证券 2023 年年 01 月月 30 日日 15|请务必仔细阅读报告尾部的重要声明 目前,NPC 逻辑自动生成技术已经应用在黑客帝国:觉醒(Mass AI,车辆行人等将独立于玩家操控变动)、Red Dead Redemption 2、Monster Hunter:World 等大型游戏中。长期来看,NPC 的灵活自主将引领其成为重要的社交节点,有效填充元宇宙的内部架构

36、。2.7 虚拟人生成:虚拟人生成:视频是短期的发展重点视频是短期的发展重点 目前“深度合成+计算驱动”型的虚拟人,综合运用文本、图像、音频等生成技术,打造综合外观、面部表情、发声习惯等产出全面拟人化的数字内容,属于 AIGC 领域。此种多模态生成技术的聚合应用在虚拟偶像、虚拟主播等领域已有广泛应用。虚拟人视频生成:虚拟人视频生成:是目前计算驱动型虚拟人应用最为广泛的领域之一,不同产品间主要的区分因素包括:唇形及动作驱动的自然程度、语音播报自然程度、模型呈现效果(2D/3D、卡通/高保真等)、视频渲染速度等。图 19:数字分身视频制作界面 资料来源:倒映有声官网、西部证券研发中心 虚拟人的实时互

37、动:虚拟人的实时互动:广泛应用于可视化的智能客服,多见于 APP、银行大堂等。在 AIGC的虚拟人领域,由于更能够体现 AI 在个性化、高并发性等方面的优势,我们更强调虚拟人的实时交互功能。例:小冰虚拟人产品,基于小冰框架的全域底层能力,整合实现了虚拟人形象定制、内容生产、渲染呈现、交互响应等多个关键技术模块,以完备的产品架构支撑多样化的应用场景,如直播、教育、数字员工等,并以此赋能各行各业。行业专题报告|计算机 西部证券西部证券 2023 年年 01 月月 30 日日 16|请务必仔细阅读报告尾部的重要声明 图 20:小冰虚拟人产品 资料来源:小冰官网、西部证券研发中心 三、三、中国中国AI

38、GC产业仍处于发展初期产业仍处于发展初期,2023年年有望有望成为成为AIGC发展大年发展大年 中国中国 AIGC 产业仍处于发展初期,底层技术相较国外仍有较大差距。产业仍处于发展初期,底层技术相较国外仍有较大差距。国内最先兴起的是AI 写作和语音合成模块,虚拟人概念刚兴起,但技术层面还存在差距,众多国内厂商从内容布局入手,同时众多厂商目前商业模式不成熟,还停留在免费引流阶段。此外,AIGC目前主要客户集中在 B 端,厂商话语权较弱,未来会向 2B+2C 方向发展,B 端降本增效是根本诉求,C 端对个人的赋能也是值得关注的方向。图 21:AIGC 产业链 资料来源:量子位智库、西部证券研发中心

39、 2B 仍是仍是 AIGC 主要商业模式。主要商业模式。虽然 AIGC 使得 C 端以较低门槛使用,但是 B 端仍然是AIGC 目前主要商业模式,主要原因是它能为企业节省大量成本,使企业可以节省大量人力成本。而 C 端的付费逻辑在于高效获取信息,替代表达以及扩大用户创造力。自 2022 年 11 月底发布以来,ChatGPT 迅速火便全网,仅一周之内便拥有了超 100 万的用户量。如今,ChatGPT 已经成为了有史以来全球用户数量最多的 LLM(大型语言模型)聊天机器人。行业专题报告|计算机 西部证券西部证券 2023 年年 01 月月 30 日日 17|请务必仔细阅读报告尾部的重要声明 C

40、hatGPT 核心希望实现的功能是模拟聊天中的上下核心希望实现的功能是模拟聊天中的上下文关系。文关系。ChatGPT 是一款由多家公司支持的聊天式自然语言处理系统,主要用于机器学习项目。它是由 Google 合作伙伴OpenAI 发布的预训练模型,可以帮助开发者快速建立新的聊天机器人应用程序。它的核心思想是用机器学习算法来模拟聊天中的上下文关系。ChatGPT 还可以使用自然语言生成文本、回答问题以及推理。它具有很好的可扩展性,可以用于各种自然语言处理应用。图 22:ChatGPT 对话展示 资料来源:ChatGPT 小程序、西部证券研发中心 1 月 25 日消息,微软宣布将扩大与 OpenA

41、I 的合作关系,将获得微软“多年、数十亿美元”的投资,并“很快”将 OpenAI 的聊天机器人模型 ChatGPT 添加到其 Azure 云服务中。2020 年,谷歌就推出了一个 26 亿参数的端到端神经网络对话模型 Meena。但仅仅只是推出,没有将其应用于任何产品,推出后的反响也没有很大。和 ChatGPT 类似,谷歌DeepMind 在 2022 年 9 月提出的 Sparrow 模型,采取了一种基于人类反馈的强化学习(RL)框架。Sparrow 模型在最初的设计时就是为了和用户闲聊,并且可以在回答问题时,利用谷歌搜索出相关的信息来作为支撑证据。百度早前在 AIGC 领域的成果包括了百度

42、的数字人度晓晓曾发布 MV启航星,作画、作词、作曲,全部由 AI 一手操纵;百度 AI 数字人度晓晓,挑战写高考作文,40 秒写了 40 篇,得分可以排在总考生前 25%。2023年年有望有望成为成为AIGC发展大年。发展大年。近期微软、谷歌等全球计软件互联网大厂大力投入AIGC,并开始探索应用层面的突破,AIGC 已经来到 2 年前自动驾驶的应用突破拐点,2023 年有望成为 AIGC 大年。类似 ChatGPT 的“大模型”作为 AIGC 的底层平台,将成为 AIGC的核心资源。四、建议关注四、建议关注 1、自研、自研 AIGC 大模型或者有相关大模型或者有相关 AI 技术布局的上市公司技

43、术布局的上市公司 云从科技:云从科技:虚拟互动方面:公司正着力打造 AI 驱动的虚拟数字人,构建自身虚拟数字人方向的核心技术和产品,从而把握住虚拟直播、虚拟客服、动画游戏等新场景带来的商业机会;内容创作上:公司正在与第三方进行合作,其借助公司在大数据、NLP 和知识计算等方面的能力,对海量的演讲视频内容进行提炼和再创作,以低成本和高效率的方式满足客户个性化的定制需求。行业专题报告|计算机 西部证券西部证券 2023 年年 01 月月 30 日日 18|请务必仔细阅读报告尾部的重要声明 拓尔思:拓尔思:在 AIGC 方面,公司围绕传媒、政府等垂直领域的语料库积累已非常全面,在智能问答、自动写作或

44、智能写稿、内容播报、创作智能辅助等方面亦有成熟应用场景。金山办公:金山办公:迄迄今为止,金山办公 AI 中台围绕办公领域的计算机视觉、自然语言处理相关算法研究已开发了近 100 项 AI 能力,WPS 的智能校对功能月校对字数超过 70 亿,智能生成的内容占据云端整体内容资源的 33.6%,智能美化功能月度活跃用户数量也已超过百万。科大讯飞:科大讯飞:语音合成、虚拟人相关技术等都属于 AIGC,同时讯飞也积极布局基于预训练模型的文图生成、对话生成等技术方向,相关技术均达到业界领先水平,并通过 AI 虚拟人交互平台在媒体、金融、教育、文旅等领域赋能内容生产创作和业务服务。商汤科技:商汤科技:涵盖

45、感知智能、决策智能、智能内容生成和智能内容增强等关键技术领域,同时包含 AI 芯片、AI 传感器及 AI 算力基础设施在内的关键能力。2、掌握独特场景,拥有掌握独特场景,拥有 AIGC 应用场景的上市公司应用场景的上市公司 汉仪股份:汉仪股份:公司以技术驱动设计,近年来针对字库产品设计、生产、传输、储存到识别的全业务链条进行持续不断的研发投入,实现了全面的技术储备以保证公司业务持续高效的发展。万兴科技:万兴科技:公司致力于通过软件技术创新和产品能力提升助力新生代创作者高效、便捷创作。目前公司已布局虚拟数字人、虚拟场景、虚拟直播等创新业务,并于近日在 2022 全球元宇宙大会论坛上宣布布局 AI

46、GC 赛道,公司旗下首款 AI 绘画软件“万兴 AI 绘画”正式开启公测。新国都:新国都:公司全资子公司新国都智能基于图像深度学习、计算机视觉等前沿 AI 技术,积极探索 AI 人工智能技术在 AIGC、智能驾驶等领域的应用。海天瑞声:海天瑞声:AIGC 上游,海天瑞声从 1998 年就进入智能语音领域耕耘,至今已有 20 年历史。也是国内首家为全球用户提供人工智能基础数据服务的供应商。海天瑞声核心业务涵盖语音识别、语音合成、发音词典、自然语言理解、计算机视觉等多个领域。五、风险提示五、风险提示 1、监管政策出现变化 AIGC 出于发展早期,后续是否会出台 AIGC 作品相关知识版权或其他法律

47、监管条款尚不明确。2、技术更新不及预期 AIGC 是强技术行业,应用和涉及领域广泛,对技术要求较高,如若技术更新不及预期,会影响行业整体发展。行业专题报告|计算机 西部证券西部证券 2023 年年 01 月月 30 日日 19|请务必仔细阅读报告尾部的重要声明 西部证券西部证券行业投资评级说明行业投资评级说明 超配:超配:行业预期未来 6-12 个月内的涨幅超过大盘(沪深 300 指数)10%以上 中配:中配:行业预期未来 6-12 个月内的波动幅度介于大盘(沪深 300 指数)-10%到 10%之间 低配:低配:行业预期未来 6-12 个月内的跌幅超过大盘(沪深 300 指数)10%以上 联

48、系地址联系地址 联系地址:联系地址:上海市浦东新区耀体路 276 号 12 层 北京市西城区月坛南街 59 号新华大厦 303 深圳市福田区深南大道 6008 号深圳特区报业大厦 10C 联系电话:联系电话: 免责声明免责声明 本报告由西部证券股份有限公司(已具备中国证监会批复的证券投资咨询业务资格)制作。本报告仅供西部证券股份有限公司(以下简称“本公司”)机构客户使用。本报告在未经本公司公开披露或者同意披露前,系本公司机密材料,如非收件人(或收到的电子邮件含错误信息),请立即通知发件人,及时删除该邮件及所附报告并予以保密。发送本报告的电子邮件可能含有保密信息、版权专有

49、信息或私人信息,未经授权者请勿针对邮件内容进行任何更改或以任何方式传播、复制、转发或以其他任何形式使用,发件人保留与该邮件相关的一切权利。同时本公司无法保证互联网传送本报告的及时、安全、无遗漏、无错误或无病毒,敬请谅解。本报告基于已公开的信息编制,但本公司对该等信息的真实性、准确性及完整性不作任何保证。本报告所载的意见、评估及预测仅为本报告出具日的观点和判断,该等意见、评估及预测在出具日外无需通知即可随时更改。在不同时期,本公司可能会发出与本报告所载意见、评估及预测不一致的研究报告。同时,本报告所指的证券或投资标的的价格、价值及投资收入可能会波动。本公司不保证本报告所含信息保持在最新状态。对于

50、本公司其他专业人士(包括但不限于销售人员、交易人员)根据不同假设、研究方法、即时动态信息及市场表现,发表的与本报告不一致的分析评论或交易观点,本公司没有义务向本报告所有接收者进行更新。本公司对本报告所含信息可在不发出通知的情形下做出修改,投资者应当自行关注相应的更新或修改。本公司力求报告内容客观、公正,但本报告所载的观点、结论和建议仅供投资者参考之用,并非作为购买或出售证券或其他投资标的的邀请或保证。客户不应以本报告取代其独立判断或根据本报告做出决策。该等观点、建议并未考虑到获取本报告人员的具体投资目的、财务状况以及特定需求,在任何时候均不构成对客户私人投资建议。投资者应当充分考虑自身特定状况

51、,并完整理解和使用本报告内容,不应视本报告为做出投资决策的唯一因素,必要时应就法律、商业、财务、税收等方面咨询专业财务顾问的意见。本公司以往相关研究报告预测与分析的准确,不预示与担保本报告及本公司今后相关研究报告的表现。对依据或者使用本报告及本公司其他相关研究报告所造成的一切后果,本公司及作者不承担任何法律责任。在法律许可的情况下,本公司可能与本报告中提及公司正在建立或争取建立业务关系或服务关系。因此,投资者应当考虑到本公司及/或其相关人员可能存在影响本报告观点客观性的潜在利益冲突。对于本报告可能附带的其它网站地址或超级链接,本公司不对其内容负责,链接内容不构成本报告的任何部分,仅为方便客户查

52、阅所用,浏览这些网站可能产生的费用和风险由使用者自行承担。本公司关于本报告的提示(包括但不限于本公司工作人员通过电话、短信、邮件、微信、微博、博客、QQ、视频网站、百度官方贴吧、论坛、BBS)仅为研究观点的简要沟通,投资者对本报告的参考使用须以本报告的完整版本为准。本报告版权仅为本公司所有。未经本公司书面许可,任何机构或个人不得以翻版、复制、发表、引用或再次分发他人等任何形式侵犯本公司版权。如征得本公司同意进行引用、刊发的,需在允许的范围内使用,并注明出处为“西部证券研究发展中心”,且不得对本报告进行任何有悖原意的引用、删节和修改。如未经西部证券授权,私自转载或者转发本报告,所引起的一切后果及法律责任由私自转载或转发者承担。本公司保留追究相关责任的权力。所有本报告中使用的商标、服务标记及标记均为本公司的商标、服务标记及标记。本公司具有中国证监会核准的“证券投资咨询”业务资格,经营许可证编号为:982242D。

友情提示

1、下载报告失败解决办法
2、PDF文件下载后,可能会被浏览器默认打开,此种情况可以点击浏览器菜单,保存网页到桌面,就可以正常下载了。
3、本站不支持迅雷下载,请使用电脑自带的IE浏览器,或者360浏览器、谷歌浏览器下载即可。
4、本站报告下载后的文档和图纸-无水印,预览文档经过压缩,下载后原文更清晰。

本文(AIGC行业专题报告:2023年有望成为AIGC的拐点-230130(19页).pdf)为本站 (学无止境) 主动上传,三个皮匠报告文库仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。 若此文所含内容侵犯了您的版权或隐私,请立即通知三个皮匠报告文库(点击联系客服),我们立即给予删除!

温馨提示:如果因为网速或其他原因下载失败请重新下载,重复下载不扣分。
会员购买
客服

专属顾问

商务合作

机构入驻、侵权投诉、商务合作

服务号

三个皮匠报告官方公众号

回到顶部