上海品茶

您的当前位置:上海品茶 > 报告分类 > PDF报告下载

传媒行业深度研究报告:ChatGPT技术原理、演进路线和应用场景-230316(21页).pdf

编号:118780 PDF 21页 2.47MB 下载积分:VIP专享
下载报告请您先登录!

传媒行业深度研究报告:ChatGPT技术原理、演进路线和应用场景-230316(21页).pdf

1、 证 券 研 究 报证 券 研 究 报 告告 证监会审核华创证券投资咨询业务资格批文号:证监许可(2009)1210 号 未经许可,禁止转载未经许可,禁止转载 行业研究行业研究 传媒传媒 2023 年年 03 月月 16 日日 传媒行业深度研究报告 推荐推荐(维持)(维持)ChatGPT:技术原理、演进路线和应用场景技术原理、演进路线和应用场景 为什么为什么 ChatGPT 如此重要?如此重要?AI C 端产品中的第一个爆款,可能代表着商业端产品中的第一个爆款,可能代表着商业化的拐点。化的拐点。1)从用户体验上,比起竞品和上一代产品,ChatGPT 的连续对话能力明显更强,具备了大范围商业化的

2、潜力。2)从应用场景的潜力上,语义文本类产品想象空间较图片类更大。短期看有望落地的包括更专业的客服机器人、更垂直更专业化的 AI(如医疗教育领域)、新一代的智能搜索等。3)ChatGPT的出现或将加快巨头对于 AI 的发展速度。ChatGPT 的成功或将促进各科技巨头加大对于 AI 的研发投入,如谷歌近日宣布投资 OpenAI 的竞争对手Anthropic。大厂的竞争有助于技术的进步和商业化的加速。为什么是为什么是 ChatGPT?比起竞品和上一代产品,ChatGPT 在多方面有了明显改善。1)道德性的增强,敢于质疑提问者提问前提的正确性和正当性。避免出现偏见、歧视等毒害信息。2)主动承认错误

3、或主动承认无法回答某一问题。3)可以理解整段对话上下文的语义,而不是孤立的回答其中一个问题。4)对提问者意图判断能力大幅提升,并非单纯根据相关性进行答案罗列。因此整体上,ChatGPT 有着比其他 AI 机器人更好的用户体验,具备了真正意义上的连续对话的能力。如何落地?如何落地?短期看是降本增效的新生产力工具,长期看可能带来新的内容生短期看是降本增效的新生产力工具,长期看可能带来新的内容生产范式。产范式。ChatGPT 的成功证明了生成式模型的进化,实现通用人工智能 AGI的可能性进一步提高。其重要性体现在 AI 对人类传达信息的载体有了更好的学习,在此基础上各个媒介之间的互通成为可能。例如从

4、自然语言生成编程语言,可以产生新的人机交互方式;从自然语言生成图片和视频,可以革新内容行业的生产范式。短期直接落地的场景可能是在文本端,提高人的效率:搜索、营销文案、客服、辅助写作;更长期的可能在于提高人机互动的智能,如在游戏、虚拟人方面的应用。投资建议:投资建议:关注什么?关注上游的算力扩张和下游的应用落地。文字语音、图片、视频等多形式的输入输出,或将为内容创作领域带来革命性变化。而更广的数据形态、更多的应用场景、更深的用户体验,亦将大幅提升支撑人工智能的算力需求,算力或迎来高速扩张时代。建议关注:1)上游算力:浪潮信息、紫光股份、景嘉微、海光信息、宝信软件等。2)下游应用:应用层面建议关注

5、百度集团和三六零(具备 AI 大模型和成熟的应用场景搜索)、中文在线(AI绘图、AI 文字辅助写作)、万兴科技(AI 绘图)、昆仑万维(AI 绘图、文本、编程、音乐)、神州泰岳(金融场景下的 NLP 应用),此外,游戏、营销、虚拟人等业态也有望受益于对话智能程度的提升,建议关注相关公司如三人行、蓝色光标、天神互娱、天地在线等。3)算法和数据层面建议关注:商汤科技(AI、计算机视觉)、科大讯飞(NLP)、拓尔思(NLP)、汉王科技(绘图、NLP)、海天瑞声(数据标注)等。风险提示风险提示:政策监管变动;技术发展不及预期;商业化落地速度不及预期。证券分析师:刘欣证券分析师:刘欣 电话:010-63

6、214660 邮箱: 执业编号:S0360521010001 行业基本数据行业基本数据 占比%股票家数(只)148 0.02 总市值(亿元)13,883.24 1.50 流通市值(亿元)12,012.16 1.70 相对指数表现相对指数表现%1M 6M 12M 绝对表现 0.3%15.3%5.1%相对表现 3.7%18.4%12.7%相关研究报相关研究报告告 传媒行业周观点(20):继续关注教育信息化板块;ChatGPT 成本下降,关注应用端机会 2023-03-05 TMT 行业重大事项点评:数字中国布局规划提出,TMT 板块有望全面受益 2023-02-27

7、传媒行业周观点(20):建议关注教育信息化机会 2023-02-26 -19%-9%1%11%22/0322/0522/0822/1022/1223/032022-03-162023-03-16传媒沪深300华创证券研究华创证券研究所所 传媒行业深度研究报告传媒行业深度研究报告 证监会审核华创证券投资咨询业务资格批文号:证监许可(2009)1210 号 未经许可,禁止转载未经许可,禁止转载 投资投资主题主题 报告亮点报告亮点 本报告与市场不同的地方在于,对于 ChatGPT 的技术原理、技术演进的路线和不同技术路线的差异进行了分析。ChatGPT 不仅是一个“搜索

8、答案并完成整合输出”的工具,大模型其本身就蕴含着强大的逻辑推理能力,其应用空间将有望更快的从文字端向图片、视频等其他形式扩张。多模态的通用型 AI对人们生产生活的变化值得更加重视。投资逻辑投资逻辑 本报告重点阐述了 ChatGPT 以及同类型算法的背后蕴含的技术原理、演进的路线和可能的应用场景。从技术的原理角度论述了为什么 ChatGPT 技术如此重要,为什么 ChatGPT 在当前时点迎来了爆发。同时,对于 ChatGPT 和 AIGC可能率先落地的应用场景进行了推演和分析。短期看 ChatGPT 是降本增效的新生产力工具,长期看可能带来新的内容生产范式。ChatGPT 的成功证明了生成式模

9、型的进化,实现通用人工智能 AGI 的可能性进一步提高。其重要性体现在 AI 对人类传达信息的载体有了更好的学习,在此基础上各个媒介之间的互通成为可能。例如从自然语言生成编程语言,可以产生新的人机交互方式;从自然语言生成图片和视频,可以革新内容行业的生产范式。短期直接落地的场景可能是在文本端,提高人的效率:搜索、营销文案、客服、辅助写作;更长期的可能在于提高人机互动的智能,如在游戏、虚拟人方面的应用。qQpOZVfWdXcWpXeXyX8O8Q6MtRpPnPoNjMpPmPiNpOqP6MmMuNMYmOrNuOmRpN 传媒行业深度研究报告传媒行业深度研究报告 证监会审核华创证券投资咨询业

10、务资格批文号:证监许可(2009)1210 号 3 目目 录录 一、一、是什么是什么.5(一)什么是 ChatGPT?效果最好的通用对话式 AI 大模型.5(二)背后的 OpenAI 是什么?背靠微软,通用 AI 研发领头羊.5(三)怎么理解 ChatGPT 的底层技术?三次关键技术变化,大力产生的奇迹.7(四)ChatGPT 为什么提升如此明显?核心是在模型训练中加入了人类的反馈.10(五)为什么重要?ChatGPT 在商业和工程上的重要性要大于科学上.12 1、ChatGPT 是 AIGC 产品中的第一个爆款,可能代表着商业化的拐点.12 2、不是单纯的搜索引擎,ChatGPT 具备从文本

11、中学习的能力.13 二、二、做什么?或许正在建立新的范式做什么?或许正在建立新的范式.13(一)智能搜索:推荐和搜索的界限可能更加模糊.15(二)内容的生产:除了效率的提升还有叙事方式的变革.15 1、视频:当前以辅助为主,AI 视频生成仍需改进.15 2、游戏:AI 助力生产效率提升,内容成本持续下降.16(三)营销和文本生成.17 三、三、谁来做?谁来做?.18 四、四、风险提示风险提示.18 传媒行业深度研究报告传媒行业深度研究报告 证监会审核华创证券投资咨询业务资格批文号:证监许可(2009)1210 号 4 图表目录图表目录 图表 1 公司发展历程.6 图表 2 OpenAI 核心

12、AI 项目.7 图表 3 技术发展脉络.7 图表 4 几种核心技术之间的关系.8 图表 5 语义特征提取能力对比.8 图表 6 长距离特征捕获能力对比.8 图表 7 任务综合特征抽取能力对比.9 图表 8 并行计算能力及运算效率对比.9 图表 9 ChatGPT 和 BERT 模型的区别.9 图表 10 NLP 模型发展趋势.10 图表 11 模型和 GPT3.5 相比的变化.10 图表 12 ChatGPT 引入的 RLHF 训练方式原理.11 图表 13 action-driven LLM 训练流程图.12 图表 14 有人使用 ChatGPT 实现了虚拟机功能.13 图表 15 生成式

13、AI 应用前景.14 图表 16 应用场景的演进速度.14 图表 17 AI 视频编辑功能举例.15 图表 18 剪映抠图举例.15 图表 19 网易云 AI 音乐.16 图表 20 各娱乐类目受生成式 AI 的影响程度.16 图表 21 Roblex 推出的文本生成 3D 模型软件系统.16 传媒行业深度研究报告传媒行业深度研究报告 证监会审核华创证券投资咨询业务资格批文号:证监许可(2009)1210 号 5 一、一、是什么是什么(一)(一)什么是什么是 ChatGPT?效果最好的通用对话式效果最好的通用对话式 AI 大模型大模型 ChatGPT(全名为(全名为 Chat Generati

14、ve Pre-TrainedTransformer)是是 22 年年 11 月由月由 OpenAI发布发布一款一款 AI 聊天聊天模型模型(即可对话的交互式(即可对话的交互式 AI 模型),用户只需输入包含相关需求的文模型),用户只需输入包含相关需求的文本,本,ChatGPT 即可自动完成回答即可自动完成回答。相较于其他同类产品,ChatGPT 更拟真、更智能,可以回答后续问题、承认错误、挑战不正确的前提、拒绝不适当的请求,给予更高水平的AI 交互体验。ChatGPT 具备强大的文字交互功能具备强大的文字交互功能,包括但不限于日常对话、信息检索、代码生成与调试、自动文本创作等。其可实现与人类的

15、拟真交互,一定程度上替代并简化了搜索引擎;并为文本创造类行业提供了一种全新且相对可靠的智能内容生成方案。OpenAI 的 CEO Sam Altman 称,ChatGPT 在发布 5 天注册用户即达到 100 万,而其上一代 GPT-3 花了将近 24 个月才达到这一体量。(二)(二)背后的背后的 OpenAI 是什么?是什么?背靠微软,通用背靠微软,通用 AI 研发领头羊研发领头羊 OpenAI 是一家美国的通用人工智能研究公司是一家美国的通用人工智能研究公司,是当前全球最著名的人工智能研究机构之一,已有研究成果包括 GPT 系列大语言模型、DALLE 系列文本生成图片预训练模型、Whisp

16、er 系列语音识别模型等。据路透社报道,预计今年公司收入将达到据路透社报道,预计今年公司收入将达到 2 亿美元,亿美元,到到 2024 年将达年将达 10 亿美元,公司估值已达亿美元,公司估值已达 200 亿美元。亿美元。据据澎湃新闻援引澎湃新闻援引美国财经媒体美国财经媒体Semafor 报道报道,微软希望向微软希望向 OpenAI 追加投资追加投资 100 亿美元亿美元,交易达成后,交易达成后,OpenAI 的估值的估值将达到将达到 290 亿美元亿美元。2015 年特斯拉创始人埃隆马斯克和 YC 的前总裁萨姆阿尔特曼(Sam Altman)等 6 人共出资成立 OpenAI。起初 Open

17、AI 为非盈利性人工智能公司,旨在与其他研究机构合作,开放各自研究成果促进 AI 技术发展。由于特斯拉与由于特斯拉与 OpenAI 关系愈深,且关系愈深,且 GPT-2 模型出现重大进展,模型出现重大进展,2018 年年 2 月马斯克月马斯克离开离开 OpenAI,专注专注投身于投身于 SpaceX,萨姆宣布自己和,萨姆宣布自己和 YC 再无干系,出任再无干系,出任 OpenAI的的 CEO。2019 年,Reid Hoffman(LinkedIn 联合创始人)和 Khosla Ventures 对公司进行投资,此后 OpenAI 宣布转型为 OpenAI LP,设定“有限盈利”(capped

18、-profit)架构。随后微软投资 10 亿美元,宣布共同打造 Azure AI 超级计算技术,同时 OpenAI 的服务也全面转移至 Azure 云计算上,共同构建具有经济价值的 AGI。传媒行业深度研究报告传媒行业深度研究报告 证监会审核华创证券投资咨询业务资格批文号:证监许可(2009)1210 号 6 图表图表 1 公司发展历程公司发展历程 资料来源:商业知行侠,OpenAI,华创证券 OpenAI 广泛覆盖广泛覆盖 AI 相关领域研究,其相关领域研究,其技术路径迭代技术路径迭代如下如下 2016 年公司开发了第个人工智能系统,在Dota 2游戏中击败了职业玩家;2017 年发布了年发

19、布了 GPT-1(初代生成人类文本的语言处理模型);2019 年年 2 月月 14 日官宣日官宣 GPT-2 模型模型;同年 3 月 4 日发布用于强化学习代理的大规模多代理游戏环境:Neural MMO;2019 年 4 月 25 日发布最新深度神经网络 MuseNet,可用于音乐作品创造;2020年4月14日发布用于分析神经网络内部特征形成过程的可视化工具Microscope;5 月月 28 日正式公布日正式公布 GPT-3 相关的研究结果,相关的研究结果,6 月月 17 日发布日发布 Image GPT 模型,将模型,将GPT 运用于计算机视觉领域,运用于计算机视觉领域,9 月月 GPT

20、-3 的商业化授权给了微软的商业化授权给了微软;2021 年 1 月 5 日发布 CLIP,可有效地从自然语言监督中学习视觉概念;并发布并发布DALL E 模型模型,可以实现基于文本描述生成全新图像。2021 年 8 月 10 日发布 GPT-3后代模型 Codex。2022 年年 1 月月 27 日发布日发布 InstructGPT(基于 GPT-3 的 AI 对话系统);4 月 6 日发布DALLE2(DALLE 二代二代模型模型);9 月 21 日发布 Whisper(完全开源的语音识别预训练模型)。2022 年年 11 月月 30 日,发布日,发布 ChatGPT 系统系统(AI 对话

21、系统)。传媒行业深度研究报告传媒行业深度研究报告 证监会审核华创证券投资咨询业务资格批文号:证监许可(2009)1210 号 7 图表图表 2 OpenAI 核心核心 AI 项目项目 资料来源:OpenAI,华创证券 (三)(三)怎么理解怎么理解 ChatGPT 的底层技术?的底层技术?三次关键技术变化,大力产生的奇迹三次关键技术变化,大力产生的奇迹 通俗的说,通俗的说,GPT 是一个基于统计学的语言模型,其工作就是对词语进行概率分布的建模,是一个基于统计学的语言模型,其工作就是对词语进行概率分布的建模,也就是利用已经说过的话去预测下一个词出现的分布概率。也就是利用已经说过的话去预测下一个词出

22、现的分布概率。衡量一个语言模型的功能最衡量一个语言模型的功能最重要取决于两点:一是是否能有效利用历史上下文信息,这重要取决于两点:一是是否能有效利用历史上下文信息,这决定其对于决定其对于人类意图的理解人类意图的理解能力。二是是否有足够丰富高质量的训练语料,这决定其回答的质量。此外就是性能和能力。二是是否有足够丰富高质量的训练语料,这决定其回答的质量。此外就是性能和成本之间的平衡。成本之间的平衡。图表图表 3 技术发展脉络技术发展脉络 资料来源:ChatGPT:又一个AI突破的时刻真格基金 传媒行业深度研究报告传媒行业深度研究报告 证监会审核华创证券投资咨询业务资格批文号:证监许可(2009)1

23、210 号 8 在过去在过去 10 年发生了三次技术上的变化。年发生了三次技术上的变化。1)Attention 机制的提出:机制的提出:Attention 机制于 2014 年正式被提出,并逐步成为了 NLP 中应用最广泛的设计。Attention 机制的核心优势在于将算法的注意力从“关注全部”转为“关注重点”。将有限的注意力集中到重点的信息上,从而节省资源、快速获得最有效信息。同时,解决了此前的长距离信息会被弱化的痛点,即使文本较长,算法也可以不丢失重要信息。这为这为解决算法对大段文本解决算法对大段文本理解和利用理解和利用不足的问题不足的问题提供了思路。提供了思路。图表图表 4 几种核心技术

24、之间的关系几种核心技术之间的关系 资料来源:Attention机制产品经理的AI知识库 2)Transform 架构的提出:架构的提出:Transformer 在 2017 年由 Google 在题为Attention Is All You Need的论文中提出。Transformer 是基于 Attention 机制的改进版自注意力机制的编解码器模型。从原理上,不同于 RNN 的序列建模方式,Transform 架构把序列中所有的单词并行处理,通过自注意力机制对所有单词之间的关系进行建模分析。在表达能力、训练时间、训练质量上都有着质的提高,很快替代 RNN 成为主流的 NLP 架构。在 Tr

25、ansform模型和 Attention 机制的基础上,自监督模型成为了 NLP 领域的主流。Bert、Chat 均是此类型模型。图表图表 5 语义特征提取能力语义特征提取能力对比对比 图表图表 6 长距离特征捕获能力长距离特征捕获能力对比对比 资料来源:Gongbo Tang,et al.,why Self-Attention?A Targeted Evaluation of Neural Machine Translation Architectures,华创证券 资料来源:Gongbo Tang,et al.,why Self-Attention?A Targeted Evaluatio

26、n of Neural Machine Translation Architectures,华创证券 传媒行业深度研究报告传媒行业深度研究报告 证监会审核华创证券投资咨询业务资格批文号:证监许可(2009)1210 号 9 图表图表 7 任务综合特征抽取能力任务综合特征抽取能力对比对比 图表图表 8 并行计算能力及运算效率并行计算能力及运算效率对比对比 资料来源:Gongbo Tang,et al.,why Self-Attention?A Targeted Evaluation of Neural Machine Translation Architectures,华创证券 资料来源:Gon

27、gbo Tang,et al.,why Self-Attention?A Targeted Evaluation of Neural Machine Translation Architectures,华创证券 BERT 模型和模型和 GPT 模型两者间孰优孰劣?模型两者间孰优孰劣?两者的不同方式在于预训练的方式不一样。通俗讲,GPT 采用的方式“写出下文”采用的方式“写出下文”,即对模型隐藏任意一段文本的下文,让其预测后面的文字,并通过和原文进行对比来不断训练模型。BERT 则是“完形填空”则是“完形填空”,对于任意一段文字随意隐藏 15%的字,让模型来补全。两者的区别在于 BERT 有除了

28、上文外还有下文可以参考,而 GPT 只有上文,因此长期以来 BERT 模型在很多任务上通过微调都可以取得比 GPT 更好的效果。GPT 的优势则在于有更强大的的优势则在于有更强大的“生成”能力,这代表更强“生成”能力,这代表更强的零样本学习能力、更强的泛化能力,作为通用型的零样本学习能力、更强的泛化能力,作为通用型 AI 也就更具备向大众推广的价值。也就更具备向大众推广的价值。图表图表 9 ChatGPT 和和 BERT 模型的区别模型的区别 资料来源:From zero to ChatGPT小蛋子 3)GPT-3 模型的突破:模型的突破:大力出奇迹。大力出奇迹。Generative Pre-

29、trained Transformer(GPT),是一种基于互联网可用数据训练的文本生成深度学习模型。它用于问答、文本摘要生成、机器翻译、分类、代码生成和对话 AI。2018 年 OpenAI 推出了 GPT-1 模型,但此时的 GPT 模型的能力并没有和传统模型有明显差异,只可当作语言理解工具使用而非对话式 AI。19年,OpenAI 推出了第二代模型,和上一代相比,GPT-2 在网络结构上并没有太多创新和突破,但是使用了更多的参数和更大的数据集:48 层模型和 15 亿参数量。此时 GPT-2 传媒行业深度研究报告传媒行业深度研究报告 证监会审核华创证券投资咨询业务资格批文号:证监许可(2

30、009)1210 号 10 在生成方面表现出了强大且普适的能力。GPT-3 进一步增加了数据文本的丰富度,其参数规模是上一代的百倍以上。其卓越性能更是引起了业界的广泛关注,已经可以完成 NLP的绝大部分任务,且性能绝佳:英法、英德互译达到了翻译模型的最佳水平、自动生成的文章让人无法分辨来自人手或是机器、两位数加减运算、自动生成代码等。GPT-3 的出现让人们看到了通用人工智能的希望。图表图表 10 NLP 模型发展趋势模型发展趋势 资料来源:ChatGPT:又一个AI突破的时刻真格基金,华创证券 (四)(四)ChatGPT 为什么为什么提升如此明显提升如此明显?核心是在模型训练中加入了人类的反

31、馈核心是在模型训练中加入了人类的反馈 主要的提升有三处:训练数据集的类型和质量有提高、模型训练的方式有变化、指令做主要的提升有三处:训练数据集的类型和质量有提高、模型训练的方式有变化、指令做了大量细致、有效的调整。了大量细致、有效的调整。数据集的类型有增加。数据集的类型有增加。ChatGPT 是基于 2022 年 OpenAI 推出的 InstructGPT 实现的改进版模型,训练集基于文本和代码,在微软 Azure AI 服务器上完成的训练。和 GPT-3 相比,其数据集增加了代码文本,因此新增了代码的理解和生成能力。图表图表 11 模型和模型和 GPT3.5 相比的变化相比的变化 资料来源

32、:OpenAI官网 ChatGPT 将人类的反应引入到了模型的训练中。将人类的反应引入到了模型的训练中。和其他模型相比,ChatGPT 新引入了“从人类反馈中强化学习”的训练方式(Reinforcement Learning from Human Feedback,RLHF)。以训练“什么是香蕉?”这个问题为例,人作为 Labeler(标记者)参与到训练中,模型会把问题下发到标记者,标记者会回答其希望看到的答案。这个答案会先作为“标准答案”来对模型进行初步训练。初步训练结束后,模型会将 AI 生成的答案和标记者提供的答案进行混合,混合后的答案会再次发给标记者,标记者会给这些答案排序打分,打分

33、传媒行业深度研究报告传媒行业深度研究报告 证监会审核华创证券投资咨询业务资格批文号:证监许可(2009)1210 号 11 后的结果会形成一个“奖励模型”。因此,完整的训练过程因此,完整的训练过程如下如下:提问者提出问题后,1)ChatGPT 生成一段答案;2)ChatGPT将答案放到奖励模型中进行比较,得到一个参数;3)将参数与提前设定好的阈值进行比较,如果达到证明答案效果较好,会输出,如果没有达到就继续迭代直到达到阈值。人类反馈系统的引入,是整个人类反馈系统的引入,是整个 ChatGPT 提升的核心原因。提升的核心原因。图表图表 12 ChatGPT 引入的引入的 RLHF 训练方式原理训

34、练方式原理 资料来源:OpenAI官网,华创证券 与此前训练模式的不同之处:常规大模型的提升重心会放在大模型(与此前训练模式的不同之处:常规大模型的提升重心会放在大模型(LLM)本身和提示)本身和提示工程环节上,而工程环节上,而 ChatGPT 将重点放在了下图右侧的循环上,并且进行了长时间仔细的将重点放在了下图右侧的循环上,并且进行了长时间仔细的调优工作。调优工作。RLHF 属于强化学习,其训练比较困难,因为算法很容易遭遇大模式坍塌情况即答案会过于向标准答案趋近,相似的问题会被收敛到同一种答案。而解决这一问题需要耗费大量时间进行调优。从 InstructGPT 的参数量级也可看出,虽然量级上

35、只有GPT-3 的 1/100,但输出效果要远高于 GPT-3 和其他改良模型。传媒行业深度研究报告传媒行业深度研究报告 证监会审核华创证券投资咨询业务资格批文号:证监许可(2009)1210 号 12 图表图表 13 action-driven LLM 训练流程图训练流程图 资料来源:ChatGPT为什么这么强穿云寻恒星 (五)(五)为什么重要?为什么重要?ChatGPT 在商业和工程上的重要性要大于科学上在商业和工程上的重要性要大于科学上 1、ChatGPT 是是 AIGC 产品中的第一个爆款,可能代表着商业化的拐点产品中的第一个爆款,可能代表着商业化的拐点 对对 AI 的发展来说,的发展

36、来说,现阶段创造商业、数据现阶段创造商业、数据的的可以迭代的闭环反馈可能比单纯的算法创可以迭代的闭环反馈可能比单纯的算法创新要重要。新要重要。OpenAI 相比于 Google 的算法团队和 Deepmind 等创业公司更注重商业应用。由于对商业的克制或受限于 ROI,导致 Google 对于大模型的应用非常保守,这使得他们即使技术上的起点非常高,但一直在进行小范围迭代,而 OpenAI 从 GPT-3 开始,即拥有了大量客户,这些客户和 OpenAI 的数据交互也将极大的推动产品的进步,带来一定的先发优势。此外 OpenAI 也借此获得了极大的关注度,这对公司甚至 AI 产业此后的融资和商业

37、化的开展都极为重要。从用户体验上,比起竞品和上一代产品,从用户体验上,比起竞品和上一代产品,ChatGPT 在多方面有了明显改善。在多方面有了明显改善。一是道德性的增强,敢于质疑提问者提问前提的正确性和正当性。避免出现偏见、歧视等毒害信息。二是会主动承认错误或主动承认无法回答某一问题。三是会可以理解整段对话上下文的语义,而不是孤立的回答其中一个问题。四是会对提问者意图判断能力大幅提升,并非单纯根据相关性进行答案罗列。因此整体上,ChatGPT 有着比其他 AI 机器人更好的用户体验,具备了真正意义上的连续对话的能力。从应用场景的潜力上,语义文本类产品想象空间较图片类更大。从应用场景的潜力上,语

38、义文本类产品想象空间较图片类更大。短期看有望落地的包括更专业的客服机器人、更垂直更专业化的 AI(如医疗教育领域)、新一代的智能搜索等。ChatGPT到了“对普通人友好的阶段”,是到了“对普通人友好的阶段”,是AI的第一个爆款应用。的第一个爆款应用。从技术上来讲,ChatGPT并没有颠覆式的创新,但它是第一个普通用户可以使用且能够感受到科技感的产品。“对普通人友好”的产品可以有更大的应用想象空间,也更容易刺激巨头加快产品和技术的研发投入。如谷歌近日宣布投资 OpenAI 的竞争对手 Anthropic。传媒行业深度研究报告传媒行业深度研究报告 证监会审核华创证券投资咨询业务资格批文号:证监许可

39、(2009)1210 号 13 2、不是单纯的搜索引擎,不是单纯的搜索引擎,ChatGPT 具备从文本中学习的能力具备从文本中学习的能力 ChatGPT 虽然是一个基于语料的统计模型,但是并虽然是一个基于语料的统计模型,但是并非所有的认知都来自于灌输的文本内非所有的认知都来自于灌输的文本内容。容。虽然大模型本质是统计模型,但其突破就在于大模型已经获得了很强的推理能力。学术上称之为 in context learning,是过去一年以来学界的热点话题,微软、谷歌都有论文来探讨其原因,但目前还没有权威的解释。但是已经有大量案例证明了其学习能力。图表图表 14 有人使用有人使用 ChatGPT 实现

40、了虚拟机功能实现了虚拟机功能 资料来源:Jonas Degrave Building a virtual machine inside ChatGPT 二、二、做什么?做什么?或许正在建立新的范式或许正在建立新的范式 短期看是降本增效的新生产力工具,长期看可能带来新的内容生产范式。短期看是降本增效的新生产力工具,长期看可能带来新的内容生产范式。ChatGPT 的成功证明了生成式模型的进化,实现通用人工智能 AGI 的可能性进一步提高。其重要性体其重要性体现在现在 AI 对人类传达信息的载体有了更好的学习,在此基础上各个媒介之间的互通成为对人类传达信息的载体有了更好的学习,在此基础上各个媒介之间

41、的互通成为可能。例如从自然语言生成编程语言,可以产生新的人机交互方式;从自然语言生成图可能。例如从自然语言生成编程语言,可以产生新的人机交互方式;从自然语言生成图片和视频,可以革新内容行业的生产范式。片和视频,可以革新内容行业的生产范式。传媒行业深度研究报告传媒行业深度研究报告 证监会审核华创证券投资咨询业务资格批文号:证监许可(2009)1210 号 14 图表图表 15 生成式生成式 AI 应用前景应用前景 资料来源:SEQUOLA Generative AI:A Creative New World 图表图表 16 应用场景的演进速度应用场景的演进速度 资料来源:SEQUOLA Gene

42、rative AI:A Creative New World 传媒行业深度研究报告传媒行业深度研究报告 证监会审核华创证券投资咨询业务资格批文号:证监许可(2009)1210 号 15 (一)(一)智能搜索智能搜索:推荐和搜索的界限可能更加模糊:推荐和搜索的界限可能更加模糊 AIGC 可能形成对传统搜索引擎的降维打击可能形成对传统搜索引擎的降维打击,呈现“检索,呈现“检索+生成”的功能。生成”的功能。传统搜索引擎主要承担信息检索功能,但 AIGC 通过用户互动的形式可更高效的呈现出精准的答复(比如某一具体编程问题如何解决、某些领域的知识问答等等),一定程度上可替代部分搜索引擎的功能,并实现高效

43、生成回答的附加价值。但 AIGC 并不可完全替代搜索引擎,一方面用户“选择”信息的权利不应该被“最佳答案”所替代;另一方面,以 ChatGPT 为例,本质是聊天机器人,其回答是基于有限的训练数据集,存在准确度不够、时效性不足等问题,某些时候会对提问者造成误导。巨头积极将巨头积极将 AIGC 与搜索引擎融合。与搜索引擎融合。微软已推出通过 ChatGPT 来回答搜索问题的 Bing搜索版本,此外还计划将 ChatGPT 技术整合到 Word、PowerPoint、Outlook 等软件产品中。搜索和推荐的界限会更加模糊。搜索和推荐的界限会更加模糊。搜索和推荐的界限会逐步模糊。随着搜索系统变得更加

44、个性化,我们预测搜索和推荐之间的界限将变得模糊。例如,TikTok 在最近几年发展迅速,字节跳动的个性化、不断改进的推荐模式体验,已经成功地从 Youtube 等传统的视频搜索产品中抢占了市场份额,我们预计推荐系统将在未来几年内激增,并从传统搜索中夺取份额。(二)(二)内容的生产:除了效率的提升还有叙事方式的变革内容的生产:除了效率的提升还有叙事方式的变革 1、视频:当前以辅助为主,视频:当前以辅助为主,AI 视频生成仍需改进视频生成仍需改进 AI 视视频辅助编辑已较为成熟频辅助编辑已较为成熟,目前运用广泛,目前运用广泛。AI 视频编辑是在已有素材基础上进行相应 AI 操作,包括智能封面、自动

45、字幕、视频祛抖、视频特效自动生成、视频美颜等,当前该技术已较为成熟,广泛运用于视频创作领域,包括字节跳动旗下的剪映,快手云剪,抖音,美图等。图表图表 17 AI 视频编辑功能举例视频编辑功能举例 图表图表 18 剪映抠图举例剪映抠图举例 资料来源:深度文娱 资料来源:剪映官网 AI 视频生产仍有较大提升空间。视频生产仍有较大提升空间。由于视频设计 3D 资产整合以及运动,其对 AI 提出更高的要求,当前生成的视频时长较短,且部分视频无法准确再现真实世界的运作方式,AI视频生成技术到成熟应用还有一段距离。AI 音频生成成熟度高于视频。音频生成成熟度高于视频。由于音频对视觉要求度较低,目前 AI

46、生成效果好于视频,部分公司已有成功应用案例。网易曾推出一站式 AI 音乐创作平台“网易天音”,依托大量的歌曲曲库,率先于行业部署工业出版级智能编曲系统,能快速生成一首对标人编1-1.5 传媒行业深度研究报告传媒行业深度研究报告 证监会审核华创证券投资咨询业务资格批文号:证监许可(2009)1210 号 16 万元左右的出版级编曲,曾成功打造出醒来、春启正阳等多首广受欢迎的 AI 原创歌曲。图表图表 19 网易云网易云 AI 音乐音乐 资料来源:金融界 2、游戏:游戏:AI 助力生产效率提升,内容成本持续下降助力生产效率提升,内容成本持续下降 游戏作为工业化程度较高的内容类产品,受益于生成式游戏

47、作为工业化程度较高的内容类产品,受益于生成式 AI 巨大。巨大。游戏作为工业化程度较高的内容类产品,且游戏具备强互动性、实时体验性,因此高质量游戏具备较高的生产门槛(无论是技术,还是时间、金钱成本)。生成式生成式 AI 有望大幅降低内容成本,有望大幅降低内容成本,释放释放游戏行业产能。游戏行业产能。将生成式 AI 运用于游戏场景、人物制作时,其更类似于更高效、成本更低的自动中台体系,一旦创意/设计方式被确定,则制作游戏的时间和成本都会大幅降低,游戏行业产能会得到极大的释放,更大体量、更多数量的游戏将出现。以以微软模拟飞行微软模拟飞行为例,为例,游戏中玩家能够围绕整个地球 1.97 亿平方英里的

48、地方飞行,这一功能是通过人工智能来完成,即微软公司与 blackshark.ai合作对人工智能进行训练,从二维卫星图像生成无限逼真的三维世界,从而实现了这一浩大的工程量。图表图表 20 各娱乐类目受生成式各娱乐类目受生成式 AI 的影响程度的影响程度 图表图表 21 Roblex 推出的文本生成推出的文本生成 3D 模型软件系统模型软件系统 资料来源:阿法兔研究笔记生成式AI在游戏领域的机会 资料来源:三次方AIRX 传媒行业深度研究报告传媒行业深度研究报告 证监会审核华创证券投资咨询业务资格批文号:证监许可(2009)1210 号 17 游戏开发门槛的降低,将会导致更多的冒险和创造性探索游戏

49、开发门槛的降低,将会导致更多的冒险和创造性探索。我们可能很快就会进入一个新的游戏开发 黄金时代,较低的准入门槛会导致出现更多创新和创造性游戏,而这不仅仅是因为较低的制作成本导致了游戏制作商需要承担的风险较低,还因为这些工具代表了为更多受众创造高质量内容的能力。从环节上看,从环节上看,AIGC 全面介入游戏开发和制作的完整生命周期全面介入游戏开发和制作的完整生命周期,包括初步设计、模型动,包括初步设计、模型动画的生成、关卡设计和游戏世界构建等多个维度。画的生成、关卡设计和游戏世界构建等多个维度。初步设计:初步设计环节是影视或游戏行业中初期的一个核心工作内容。初步设计:初步设计环节是影视或游戏行业

50、中初期的一个核心工作内容。即为一款产品的视觉效果和整体色彩进行定调。在这一环节,需要游戏设计师进行大量的探索,而 AIGC可以大大节省这一时间。游戏设计师可通过文本提示生成大量2D图像,这也是目前AIGC最成熟、最广泛的应用领域,诸如 Midjourney、Stable Diffusion 和 Dall-E 2 这样的工具,直接可以将文本描述生成高质量的二维图像,甚至可以通过使用 Stable Diffusion 这样的工具,将二维图像进行整合,并以此为基础生成更大量的类似图片。可以将原本 3-4 周的工作量压缩到 1-2 天。模型搭建:模型搭建:AIGC 可以被广泛应用于可以被广泛应用于 3

51、D 模型资产的生产。模型资产的生产。游戏世界其本质即是各种模型的集合,随着对游戏品质要求的提高,3D 模型使用量剧增。而 3D 模型相比 2D 平面图要更为复杂,需要搭建模型并添加纹理和效果。目前已有创业公司推出了相关产品。如BariumAI、Ponzu 和 ArmorLab,创作者可以根据文本或者图像来生成 3D 纹理,可以快速提高创作过程的迭代速度。在 3D 模型的搭建领域,也有诸如 Kaedim、Mirage 和Hypothetic 的创业公司,大公司也在关注这个问题如 Nvidia 的 Get3D 和 Autodesk 的ClipForge。Kaedim 和 Get3d 专注于图像到

52、3D 模型的转换;ClipForge 和 Mirage 专注于文本到 3D 转换,而 Hypothetic 公司两者都在参与。更多内容的创作:音效、游戏配乐、对话、更多内容的创作:音效、游戏配乐、对话、NPC 的创作。的创作。在声音领域 AIGC 同样有巨大的想象空间,除了现有内容的 AI 制作外,在效果上也有更多可以突破的地方。1)互动音效和配乐:现有的音效和配乐多数为提前录制好的,但较为重复和失真。AI 可以实现不同情况下的不同音效,如脚步声,可以根据角色行走环境、角色体重、步态(跑/走/静步)、鞋类型等来生成和调整脚步声音。配乐也可以根据屏幕上不同的场景和动作来进行调整。2)及时对话的生

53、成:形如 ChatGPT 这样的 AI 对话工具,可以让角色对于玩家的行为作出实时的反应,也可以生成更有情感表达能力可以承担更多作用的 NPC。3)订制化声音:玩家可以用自己的声音在游戏中发生,本地化也有进一步提高的空间。(三)(三)营销和文本生成营销和文本生成 文案文案生成是生成式生成是生成式 AI 最早应用的领域之一,最早应用的领域之一,应用领域包括应用领域包括客服客服、编写邮件、编写邮件、新闻稿新闻稿/营营销文案销文案撰写、诗歌小说创作撰写、诗歌小说创作续写续写等。等。客服客服:以 ChatGPT 为代表的聊天机器人经过针对特殊场景的训练后可以很快胜任智能客服的角色。除了常规的指引功能外

54、,AI 客服也可以承担更多的营销任务。新闻稿新闻稿/营销文案撰写:营销文案撰写:蓝色光标旗下有多款产品已实现 AI 易稿模块,能够辅助营销人员一键生成新闻草稿。诗歌小说创作:诗歌小说创作:采用 AIGC 技术的虚拟人度晓晓曾于 22 年撰写作高考作文,在不到1 分钟的时间,完成了 40 多篇文章,获得专家打分 48 分的成绩,击败了 75%的考生。2017 年 5 月 19 日,微软 AI 小冰曾推出原创诗集阳光失了玻璃窗,囊括了139 首现代诗,是人类历史上第一部 100%由人工智能创造的诗集。传媒行业深度研究报告传媒行业深度研究报告 证监会审核华创证券投资咨询业务资格批文号:证监许可(20

55、09)1210 号 18 代代码生成:码生成:以微软旗下的 Github Copilot 为例,该产品基于 OpenAI 专门用 GPT-3 为编程场景定制的 AI 模型 Codex。使用者文字输入代码逻辑,它能快速理解,根据海量开源代码生成代码。当前微软内部已推广使用。三、三、谁来做?谁来做?国内外的差距在哪里?国内外的差距在哪里?1)资金差距:)资金差距:大模型训练成本百万美金左右,对小厂难度较大,训练一个大模型成本约 300-400 万美金,之后每次调用成本在几美分。小厂商不具备自己训练的能力。2)数据)数据差距差距。数据量差异:AI 学界话语权在英文世界,因此英语语料较多;数据质量差异

56、:国内私域互联网较为发达,因此公域中高质量中文内容较为缺失。3)算力差距。)算力差距。地缘政治因素导致缺芯短期影响不大,长期禁令不解有卡脖子风险。4)人才差距人才差距。国内在 AI 顶尖人才方面仍和海外有一定差距。谁有可能最先做出来?谁有可能最先做出来?我们认为,我们认为,互联网公司偏研发型互联网公司偏研发型+国家队的企业应用终端公国家队的企业应用终端公司。司。互联网公司:不存在算力+资金问题,AI 人才储备丰富;但目前各家尚未拉开明显差距,其中百度略有优势(布局较早+经验丰富)。偏研发型+国家队的企业:如智源研究院,和清北关系密切,人才密度较高;但资金实力较弱,且缺乏足够的商业化能力;应用终

57、端公司:如科大讯飞(具备语音处理能力,但解决方案以产品销售为导向),可能做成通用大模型。关注什么?关注上游的算力扩张和下游的应用落地。关注什么?关注上游的算力扩张和下游的应用落地。文字语音、图片、视频等多形式的输入输出,或将为内容创作领域带来革命性变化。而更广的数据形态、更多的应用场景、更深的用户体验,亦将大幅提升支撑人工智能的算力需求,算力或迎来高速扩张时代。建议关注:1)上游算力:浪潮信息、紫光股份、景嘉微、海光信息、宝信软件等。2)下游应用:应用层面建议关注百度集团和三六零(具备 AI 大模型和成熟的应用场景搜索)、中文在线(AI 绘图、AI 文字辅助写作)、万兴科技(AI 绘图)、昆仑

58、万维(AI 绘图、文本、编程、音乐)、神州泰岳(金融场景下的 NLP 应用),此外,游戏、营销、虚拟人等业态也将受益于对话智能程度的提升,建议关注相关公司如三人行、蓝色光标、天神互娱、天地在线等。3)算法和数据层面建议关注:商汤科技(AI、计算机视觉)、科大讯飞(NLP)、拓尔思(NLP)、汉王科技(绘图、NLP)、海天瑞声(数据标注)等。四、四、风险提示风险提示 政策监管变动;技术发展不及预期;商业化落地速度不及预期。传媒行业深度研究报告传媒行业深度研究报告 证监会审核华创证券投资咨询业务资格批文号:证监许可(2009)1210 号 19 传媒组团队介绍传媒组团队介绍 组长,首席研究员:刘欣

59、组长,首席研究员:刘欣 中国人民大学硕士。先后于中金公司(2015-2016)、海通证券(2016-2019)、民生证券(2019-2020),从事 TMT 行业研究工作。所在团队 2016/2017 年连续两年获得新财富最佳分析师评选文化传媒类第三名,2016 年水晶球评选第三名,2016 年金牛奖第三名,2017 年水晶球第五名,2017 证券时报金翼奖第一名,2019 年获得 WIND 第七届金牌分析师评选传播与文化类第五名等。分析师:张静雯分析师:张静雯 中国人民大学硕士。曾就职民生证券,2019 年获得 WIND 第七届金牌分析师评选传播与文化类第五名。2021 年加入华创证券研究所

60、。研究员:费磊研究员:费磊 南开大学硕士。曾就职民生证券,2021 年加入华创证券研究所。助理研究员:廖志国助理研究员:廖志国 莫纳什大学硕士。2021 年加入华创研究所。传媒行业深度研究报告传媒行业深度研究报告 证监会审核华创证券投资咨询业务资格批文号:证监许可(2009)1210 号 20 华华创证券机构销售通讯录创证券机构销售通讯录 地区地区 姓名姓名 职务职务 办公电话办公电话 企业邮箱企业邮箱 北京机构销售部 张昱洁 副总经理、北京机构销售总监 张菲菲 北京机构副总监 刘懿 副总监 侯春钰 资深销售经理 0

61、10-63214682 侯斌 资深销售经理 过云龙 高级销售经理 蔡依林 高级销售经理 刘颖 高级销售经理 顾翎蓝 高级销售经理 车一哲 销售经理 深圳机构销售部 张娟 副总经理、深圳机构销售总监 汪丽燕 高级销售经理 张嘉慧 高级销售经理 邓洁 高级销售经理 董姝彤 销售经理 巢莫雯 销售经理 王春

62、丽 销售经理 上海机构销售部 许彩霞 总经理助理、上海机构销售总监 曹静婷 上海机构销售副总监 官逸超 上海机构销售副总监 黄畅 副总监 -2552 吴俊 资深销售经理 张佳妮 高级销售经理 邵婧 高级销售经理 蒋瑜 高级销售经理 施嘉玮 高级销售经理 朱涨雨 销售助理 李凯月 销售助理 广州机构销售部 段佳音

63、广州机构销售总监 周玮 销售经理 王世韬 销售经理 私募销售组 潘亚琪 总监 汪子阳 副总监 江赛专 资深销售经理 汪戈 高级销售经理 宋丹玙 销售经理 传媒行业深度研究报告传媒行业深度研究报告 证监会审核华创证券投资咨询业务资格批文号:证监许可(2009)1210 号 21 华创行业公司投资评级体系华创行业公司投资评级体系(基准指数沪深基准指数沪深 300)公司投资评级说明:公司投资评级说明:强推:预期未来 6 个月内超越基准指数 2

64、0%以上;推荐:预期未来 6 个月内超越基准指数 10%20%;中性:预期未来 6 个月内相对基准指数变动幅度在-10%10%之间;回避:预期未来 6 个月内相对基准指数跌幅在 10%20%之间。行业投资评级说明:行业投资评级说明:推荐:预期未来 3-6 个月内该行业指数涨幅超过基准指数 5%以上;中性:预期未来 3-6 个月内该行业指数变动幅度相对基准指数-5%5%;回避:预期未来 3-6 个月内该行业指数跌幅超过基准指数 5%以上。分析师声明分析师声明 每位负责撰写本研究报告全部或部分内容的分析师在此作以下声明:分析师在本报告中对所提及的证券或发行人发表的任何建议和观点均准确地反映了其个人

65、对该证券或发行人的看法和判断;分析师对任何其他券商发布的所有可能存在雷同的研究报告不负有任何直接或者间接的可能责任。免责声明免责声明 。本公司不会因接收人收到本报告而视其为客户。本报告所载资料的来源被认为是可靠的,但本公司不保证其准确性或完整性。本报告所载的资料、意见及推测仅反映本公司于发布本报告当日的判断。在不同时期,本公司可发出与本报告所载资料、意见及推测不一致的报告。本公司在知晓范围内履行披露义务。报告中的内容和意见仅供参考,并不构成本公司对具体证券买卖的出价或询价。本报告所载信息不构成对所涉及证券的个人投资建议,也未考虑到个别客户特殊的投资目标、财务状况或需求。客户应考虑本报告中的任何

66、意见或建议是否符合其特定状况,自主作出投资决策并自行承担投资风险,任何形式的分享证券投资收益或者分担证券投资损失的书面或口头承诺均为无效。本报告中提及的投资价格和价值以及这些投资带来的预期收入可能会波动。本报告版权仅为本公司所有,本公司对本报告保留一切权利。未经本公司事先书面许可,任何机构和个人不得以任何形式翻版、复制、发表、转发或引用本报告的任何部分。如征得本公司许可进行引用、刊发的,需在允许的范围内使用,并注明出处为“华创证券研究”,且不得对本报告进行任何有悖原意的引用、删节和修改。证券市场是一个风险无时不在的市场,请您务必对盈亏风险有清醒的认识,认真考虑是否进行证券交易。市场有风险,投资需谨慎。华创证券研究所华创证券研究所 北京总部北京总部 广深分部广深分部 上海分部上海分部 地址:北京市西城区锦什坊街 26 号 恒奥中心 C 座 3A 地址:深圳市福田区香梅路 1061 号 中投国际商务中心 A 座 19 楼 地址:上海市浦东新区花园石桥路 33 号 花旗大厦 12 层 邮编:100033 邮编:518034 邮编:200120 传真: 传真: 传真: 会议室: 会议室: 会议室:

友情提示

1、下载报告失败解决办法
2、PDF文件下载后,可能会被浏览器默认打开,此种情况可以点击浏览器菜单,保存网页到桌面,就可以正常下载了。
3、本站不支持迅雷下载,请使用电脑自带的IE浏览器,或者360浏览器、谷歌浏览器下载即可。
4、本站报告下载后的文档和图纸-无水印,预览文档经过压缩,下载后原文更清晰。

本文(传媒行业深度研究报告:ChatGPT技术原理、演进路线和应用场景-230316(21页).pdf)为本站 (海平线) 主动上传,三个皮匠报告文库仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。 若此文所含内容侵犯了您的版权或隐私,请立即通知三个皮匠报告文库(点击联系客服),我们立即给予删除!

温馨提示:如果因为网速或其他原因下载失败请重新下载,重复下载不扣分。
会员购买
客服

专属顾问

商务合作

机构入驻、侵权投诉、商务合作

服务号

三个皮匠报告官方公众号

回到顶部