上海品茶

您的当前位置:上海品茶 > 报告分类 > PDF报告下载

计算机行业AIGC专题二:ChatGPT更懂人类的叙事-230214(41页).pdf

编号:115190 PDF 41页 3.02MB 下载积分:VIP专享
下载报告请您先登录!

计算机行业AIGC专题二:ChatGPT更懂人类的叙事-230214(41页).pdf

1、0AIGC专题二:ChatGPT更懂人类的叙事2023年2月14日证券研究报告|行业专题证券分析师姓名:马笑资格编号:S02邮箱:1请务必阅读正文之后的信息披露及法律声明。投资要点:ChatGPT加速商业化,AI将带来泛娱乐的革新 ChatGPT是OpenAI推出的聊天机器人模型,月度用户已破亿,正在逐步探索商业化途径。ChatGPT能够通过学习和理解人类的语言来进行对话,还能根据聊天的上下文进行互动,真正像人类一样来聊天交流,甚至能完成撰写邮件、视频脚本、文案、翻译、代码等任务。根据UBS统计数据显示,ChatGPT上线2个月后月度用户数量破1亿。OpenAI的商业模式

2、为,会员收费、开放API以及与微软的战略合作。会员服务:2023年2月1日,OpenAI推出付费订阅项目ChatGPTPlus,价格为$20/月,目前面向美国用户。API服务:ChatGPT将在未来加入OpenAI的API,目前已在包括游戏虚拟人等泛娱乐内容产业和互联网的多方面进行应用。1)办公软件:微软计划将包括ChatGPT等AI工具整合进旗下的所有产品中。ChatGPT已加入浏览器扩展程序,集成了ChatGPT-4的BING短暂上线。2)泛娱乐:AI或将不断趋近人类思维叙事,AIGC是踏入元宇宙的重要一步,且已有公司在直播场景、游戏场景等泛娱乐中应用ChatGPT。谷歌、百度等众多公司推

3、出自有AI产品,百度文心一言(ERNIE Bot)预计三月份完成内测。百度拥有飞桨(深度学习开源框架)、百度AI大底座(全栈AI基础设施)和文心大模型(AI应用场景全覆盖)。ERNIE是百度开创性提出的基于知识增强的持续学习语义理解框架。ERNIE3.0参数量增大到了10B,训练数据集为4TB。产品应用或可期待。投资建议:把握AIGC技术催化和商业落地的投资机会。技术发展有望促进生产效率提升,并进一步创造新的消费和需求,有利于文娱内容和互联网行业。在AIGC和ChatGPT方面,我们建议持续关注技术发展和应用情况,把握技术催化和商业化落地带来的投资机会:1)具备AIGC和ChatGPT的技术探

4、索和应用的公司:百度、商汤、万兴科技、拓尔思等;2)具有海量内容素材且具有AIGC探索布局的,图片/文字/音乐/视频等内容及平台公司腾讯控股,阅文集团、美图公司、视觉中国、昆仑万维、蓝色光标、中文在线、汉仪股份、天娱数科、风语筑等。风险提示:技术发展不及预期、监管政策变化、知识产权问题等。nXiXtVuWkUfWaVdYuZ8ZbR8QbRtRrRsQsRiNpPsQlOrQsPbRoOyRNZqRzQNZrMtQ2请务必阅读正文之后的信息披露及法律声明。0102030405ChatGPT概述技术应用场景其他类似产品投资建议&风险提示目 录CONTENTS核心优势3SEPARATOR PAGE

5、01ChatGPT概述4请务必阅读正文之后的信息披露及法律声明。OpenAI深耕AI领域研究,特色产品包括ChatGPT、DALL E2、Whisper等。OpenAI是于2015年12月在美国成立的人工智能研究公司,由马斯克、美国创业孵化器Y Combinator总裁阿尔特曼、全球在线支付平台PayPal联合创始人彼得 蒂尔等硅谷科技大亨创立。研究方向可以分为三类:训练生成模型算法,即深度学习生成模型;从数据中推断算法的算法,即神经图灵机;强化学习方法,可以理解为深度增强学习。1.1 OpenAI:人工智能研究领域最前沿的公司之一表表1:OpenAI部分重点研究领域及成果部分重点研究领域及成

6、果研究领域研究领域模型模型/成果成果深度学习生成模型GPT系列语言:ChatGPT、InstructGPT代码:Codex图像:Image GPT、DALL E、DALL E2音乐:Jukebox、MuseNetCLIPWhisper神经图灵机人工神经网络中的多模态神经元无监督情绪神经元强化学习方法近端优化策略进化策略资料来源:OpenAI,德邦研究所表表2:OpenAI的特色产品的特色产品重要技术重要技术发布时间发布时间用途用途ChatGPT2022年11月30日人工智能聊天机器人DALL E22022年4月6日文本到图像生成模型,它基于扩散模型原理,可以通过自然语言对现有图像进行逼真的编辑

7、,它可以添加和删除元素等。Whisper2022年9月21日自动语音识别(ASR)系统,经过68万小时的多语言和多任务监督数据训练,支持多种语言的转录,以及从这些语言翻译成英语。Alignment 2022年8月24日专注于训练人工智能系统,使其变得有用、真实和安全,与人类意图保持一致资料来源:OpenAI,德邦研究所5请务必阅读正文之后的信息披露及法律声明。公司大事件重点研发活动2015年12月OpenAI成立2018年2月20日马斯克辞去董事会席位2019年7月22日微软投资OpenAI 10亿美元,双方将携手合作替Azure云端平台服务开发人工智能技术。2023年1月17日微软计划将包括

8、ChatGPT、DALL-E等人工智能工具整合进微软旗下的所有产品中。2023年1月23日微软将向OpenAI进行一项为期多年、价值数十亿美元的投资,以加速其在人工智能(AI)领域的技术突破。1.1 OpenAI:人工智能研究领域最前沿的公司之一2016年4月27日发布了其强化学习研究平台“OpenAIGym”的公测版。2016年12月5日OpenAI发布了“Universe”,用于测量和训练人工智能在全球游戏、网站等应用程序中的通用智能。2020年5月OpenAI发布了 GPT-3;微软于2020年9月22日取得GPT-3的授权。2021年1月5日OpenAI推出了 DALL-E和CLIP。

9、2022年11月30日OpenAI发布了ChatGPT2022年4月6日OpenAI发布了DALLE2可以视作是CLIP+DALLE资料来源:OpenAI等,德邦研究所6请务必阅读正文之后的信息披露及法律声明。1.2 ChatGPT月度用户已破亿,正在逐步探索商业化途径2023年1月17日微软CEO纳德拉在世界经济论坛上表示,微软正在迅速推进OpenAI的工具商业化,计划将包括ChatGPT、DALL-E等人工智能工具整合进微软旗下的所有产品中,并将其作为平台供其他企业使用.2023年1月根据UBS统计数据显示,ChatGPT上线2个月后月度用户数量破1亿。2023年2月1日OpenAI公司宣

10、布,新的订阅服务名为ChatGPT Plus,价格为$20/月。2022年11月30日OpenAI发布了ChatGPT ChatGPT是OpenAI在2022年11月30日发布的全新聊天机器人模型。它能够通过学习和理解人类的语言来进行对话,还能根据聊天的上下文进行互动,真正像人类一样来聊天交流,甚至能完成撰写邮件、视频脚本、文案、翻译、代码等任务。ChatGPT月度用户已破亿,正在逐步探索商业化途径。根据UBS统计数据显示,ChatGPT上线2个月后月度用户数量破1亿。2023年2月1日,OpenAI推出付费订阅项目ChatGPT Plus,价格为$20/月,目前面向美国用户。资料来源:Ope

11、nAI等,德邦研究所7请务必阅读正文之后的信息披露及法律声明。图图1:GPT-3.5的进化树的进化树资料来源:符尧等拆解追溯 GPT-3.5 各项能力的起源,德邦研究所图图2:ChatGPT 技术技术逻辑逻辑资料来源:符尧等拆解追溯 GPT-3.5 各项能力的起源,德邦研究所1.3 ChatGPT基于GPT3.5模型进化微调,从人类反馈中学习 OpenAI 基于GPT模型,使用监督学习和强化学习的组合来调优 ChatGPT,其中人类反馈强化学习(RLHF)使 ChatGPT趋近人类价值观及意图。ChatGPT的训练分为三步:一是训练及微调GPT模型,获得语言及代码的生成能力;二是根据人类意图训

12、练,人为标记生成内容的排序,训练出奖励模型(Reward Model);三是通过奖励模型为生成内容打分,通过近端策略优化(PPO)来优化生成模型,使其趋近人类的意图。8请务必阅读正文之后的信息披露及法律声明。1.3.1 第一步:收集数据微调GPT3.5模型 预训练的GPT3.5在少量已标注的数据上进行调优,以学习从给定的提示词(prompt)列表生成输出的有监督的策略 模型选择:选择了 GPT-3.5 系列中的预训练模型,参考InstructGPT,参数量最高达175B。例如,输入“你好”,通过GPT后输出“美”。GPT每一次的输出可能都是不同的,因为在网络上的语句中,“你好”后面有多种接法,

13、例如“你好高”、“你好吗”,而输出结果是遵循概率分布的,高频组合出现的概率较高。数据收集:使用了两种不同的提示词来源。一些是直接使用标注人员或研究人员准备的,另一些是从 OpenAI 的 API 请求(即从 GPT-3 用户那里)获取的。策略生成:选择一个提示列表,标注人员按要求写下预期的输出。最终得到的结果是一个相对较小、高质量的数据集,可用于调优预训练的语言模型。图图3:ChatGPT训练训练Step1资料来源:OpenAI,德邦研究所9请务必阅读正文之后的信息披露及法律声明。对大量的模型输出进行排序,创建了一个由比较数据组成的新数据集。在此数据集上训练新模型,被称为训练奖励模型(Rewa

14、rd Model,RM)。输出排序:标注者根据人类偏好将输出从最佳到最差排序。结果是一个新的标签数据集。奖励模型:将有标签的数据集用于训练 RM 模型,并将生成模型的输出,按优先顺序对它们进行排序。例如,输入“台湾最高的山是哪座?”,输出可能有两个结果,输出一是“玉山”,输出二是“谁来告诉我呀”。两个回答都可以与问题衔接,但是人类的偏好是输出一,因此RM给两个输出排序时,输出一是高于输出二。图图4:ChatGPT训练训练Step2资料来源:OpenAI,德邦研究所1.3.2 第二步:模拟人类偏好,训练奖励模型10请务必阅读正文之后的信息披露及法律声明。图图5:ChatGPT训练训练Step3资

15、料来源:OpenAI,德邦研究所1.3.3 第三步:使用奖励模型,基于PPO进行最优化 强化学习被应用于通过优化 RM 模型来调优模型,所使用的特定算法称为近端策略优化(PPO)。PPO:强化学习中的一种方式,通过学习策略以达成回报最大化或实现特定目标的问题。PPO在实现的便利性、样本复杂性和调优的便利性之间取得了平衡,试图在每一步计算一个更新,使代价函数最小化,同时确保与前一个策略的偏差相对较小。调整目标:使用RM作为奖励函数,通过PPO算法微调策略,调整参数获得最大的奖励。11SEPARATOR PAGE02核心优势12图图7:OpenAI与微软的合作关系与微软的合作关系资料来源:Four

16、WeekMBA,德邦研究所图图6:OpenAI组织架构组织架构资料来源:FourWeekMBA,德邦研究所2.1 优势一:公司与微软合作,提供上下游支持 微软作为OpenAI的LP投资者,为公司提供研发底层支撑及应用的大力支持。资金支持:2019年7月22日,微软投资OpenAI 10亿美元;2023年1月23日,微软宣布与OpenAI建立长期合作伙伴关系进入第三阶段,通过一项为期多年、数十亿美元的投资来加速AI的突破。服务支持:1)大规模超级计算 微软将增加对开发和部署专用超级计算系统的投资,以加速OpenAI的研究;继续构建 Azure 领先的 AI 基础结构。2)独家云提供商-Azure

17、将为研究、产品和API服务中的所有OpenAI工作提供支持。应用支持:1月17日微软表示,计划将包括ChatGPT、DALL-E等人工智能工具整合进微软旗下的所有产品中,并将其作为平台供其他企业使用,包括且不限于Bing搜索引擎、Microsoft Office、Azure云服务、Teams聊天程序等。132.2 优势二:管理层均为行业精英,引领公司发展表表3:OpenAI LP 管理层均为精英管理层均为精英姓名姓名职位职位上任时间上任时间履历履历Greg Brockman董事长;联合创始人2019.03毕业于哈佛大学和麻省理工大学;是OpenAI的创始人之一Sam AltmanCEO;联合创

18、始人2019.032011 年开始担任Y Combinator的兼职合伙人;2014 年 2 月,被任命为Y Combinator总裁;2015年成为OpenAI联合创始人之一;2019.3 转任Y Combinator董事长,未来专注OpenAI的工作Ilya Sutskever首席科学家;联合创始人2019.032012年毕业于多伦多大学,获得计算机博士学位;2013年加入谷歌;2015年成为OpenAI联合创始人之一Brad LightcapCOO2022.052008年毕业于杜克大学;先后就职于摩根大通、DropBox、Y Combinator等;2018.08入职OpenAI担任CF

19、OMira MuratiCTO2022.05毕业于达特茅斯商学院;先后就职于高盛、特斯拉等;2018.6加入OpenAIChris Clark非营利和战略计划主管2022.052005年毕业于斯坦福大学;2016.3-2022.5 Open AI COO;2016.3-至今,OpenResearch(前身为Y Combinator Research)COO资料来源:OpenAI,领英等,德邦研究所14SEPARATOR PAGE03应用场景15请务必阅读正文之后的信息披露及法律声明。图图8:OpenAI商业模式商业模式资料来源:FourWeekMBA,德邦研究所 OpenAI的商业模式为,会员

20、收费、开放API以及与微软的战略合作 会员服务:2023年2月1日,OpenAI推出付费订阅项目ChatGPT Plus,价格为$20/月,目前面向美国用户。付费服务包括,在高峰时段也可常规访问ChatGPT、更快的响应、以及优先访问新功能和改进。ChatGPT将继续提供免费访问。API服务:ChatGPT或将加入OpenAI API,从下游用户的使用中收取费用。目前OpenAI的API以Token对于NLP的文字进行收费,例如莎士比亚作品集需要1.2M的Token。与微软合作:使用 Azure OpenAI 服务,采用即用即付的消费模式,以Token或托管时长进行收费。3.1 ChatGPT

21、以采取会员收费,未来或拓展商业模式表表4:OpenAI的的API收费收费,Davinci是同系列中最强大的模型是同系列中最强大的模型模型模型价格价格基础模型基础模型AdaBabbageCurieDavinci$0.0004/1K tokens$0.0005/1K tokens$0.0020/1K tokens$0.0200/1K tokens微调模型微调模型AdaBabbageCurieDavinci训练训练$0.0004/1K tokens$0.0006/1K tokens$0.0030/1K tokens$0.0300/1K tokens使用使用$0.0016/1K tokens$0.00

22、24/1K tokens$0.0120/1K tokens$0.1200/1K tokens参考最大请求参考最大请求预训练模型预训练模型GPT-3text-ada-001text-babbage-001 text-curie-001text-davinci-0032,048 tokens2,048 tokens2,048 tokens4,000 tokensCodex-code-cushman-001code-davinci-002-最多2,048 tokens8,000 tokens资料来源:OpenAI,德邦研究所16请务必阅读正文之后的信息披露及法律声明。3.2 GPT系列API可为下游

23、应用提供语言和代码处理 ChatGPT尚未开放API,因此参考已开放API的Text-davinci-003和Code-davinci-002来解读其功能。ChatGPT与Text-davinci-003的能力相似,均属于GPT3.5系列模型。实现功能包括:回答问题、分类、编写代码、对话、生成、翻译和转换。Text-davinci-003 文本到命令(创建电子表格和SQL语句)转换+生成 英语到其他语言(语法更正)翻译+转换+生成 电影到表情符号转换+生成 计算时间复杂度编写代码+转换 分类:包括高级推文情绪分类器分类 解析非结构化数据、取关键词、分段总结分类+转换+生成 事实回答回答+分类+

24、对话+生成 从程序语言生成摘要注释生成 生成比喻、VR食谱、餐厅评论、恐怖故事生成+翻译+转换 根据产品描述生成广告、产品名称生成 讽刺聊天机器人对话+生成Code-davinci-002 自然语言转Stripe API编写代码+转换 自然语言到OpenAI API编写代码+转换 SQL翻译编写代码+转换 从Python到自然语言编写代码+翻译 从编程语言到指定编程语言编写代码+翻译 解释代码编写代码+翻译 Python错误修复器编写代码+生成 JavaScript助手聊天机器人回答问题+编写代码+对话 从JavaScript 到 Python编写代码+翻译+转换 编写Python 文档字符串

25、编写代码+生成 JavaScript 转单行代码编写代码+翻译+转换资料来源:OpenAI,德邦研究所表表5:Text-davinci-003与与Code-davinci-002的部分应用举例的部分应用举例17请务必阅读正文之后的信息披露及法律声明。图图10:GPT-3应用于客服团队应用于客服团队资料来源:AchieveChat AI,德邦研究所图图9:GPT系列的系列的CodeX应用于辅助编程应用于辅助编程资料来源:OpenAI,德邦研究所3.3 ToB:GPT系列已应用到办公应用、智能客服等 办公应用:1)AI辅助编程:GitHub Copilot 可辅助程序员编程,通过Codex在代码编

26、辑器中为整行或某个函数提供建议。2)市场调研工具:Viable 使用 GPT-3 从客户反馈中提供有用的见解,可以从调查、票证、实时聊天日志、评论等中识别和提取主题内容和情绪,并在几秒钟内提供内容总结。智能客服:Algolia和ActiveChat 使用了 GPT-3 来更好地理解客户的问题,并将他们连接到回答他们问题的内容的特定部分。18请务必阅读正文之后的信息披露及法律声明。图图11:GPT-3应用于应用于Duolingo资料来源:OpenAI,德邦研究所3.3 ToC:GPT系列已应用到学习类于创作类生成 学习类:1)论文检索:GithubElicit是一个人工智能研究助手,通过检索已发

27、表的论文,从大量研究论文中查找最相关的摘要,并应用 GPT-3 的自定义功能来生成答案。2)语言学习:Duolingo作为一个语言学习平台,已经使用 GPT-3 进行法语语法更正。Duolingo 的一项内部研究表明,使用此功能可以显著提高用户的第二语言写作技巧。创作类:1)Blog创意生成:Blog Idea Generator通过采用搜索关键字来分析该主题在Google里最受欢迎的内容。基于获取的数据,软件通过GPT-3生成内容来获得更高的阅读量。2)写作造句工具:Compose.ai 是一个免费的Chrome扩展程序,可使用AI自动进行写作。只需要输入关键字词和主要内容,GPT-3可协助

28、生成完整语句,构成全文。图图12:GPT-3应用于博客创意生成应用于博客创意生成资料来源:Usetopic,德邦研究所19请务必阅读正文之后的信息披露及法律声明。图图13:GPT系列应用于系列应用于AI驱动游戏驱动游戏资料来源:AI Dungeon,德邦研究所图图14:GPT系列用于系列用于Keeper Tax资料来源:OpenAI,德邦研究所3.3 ToC:GPT系列还应用于娱乐及生活类APP 娱乐类:1)AI驱动游戏:AI Dungeon是一款由AI驱动的基于文本的角色扮演游戏,AI会自动生成故事,玩家可以在其中输入对话,人工智能将以新的事件和对话作出回应,创造独特且不可预测的游戏体验。2

29、)AI聊天伙伴:WhatsApp 上的AI Buddy是由GPT-3.5驱动的软件,可以和用户进行对话,就像发消息给朋友一样。例如,“给我讲个笑话”、“给我一个博客构思”等。生活类:税务助手:Keeper Tax可帮助个人记录税务情况。在关联到个人财务账号后,Keeper Tax用不同模型提取文本信息并分类交易类型。20请务必阅读正文之后的信息披露及法律声明。图16:微软Bing短暂上线ChatGPT功能资料来源:IT之家,德邦研究所图15:ChatGPT作为免费插件加入到各大浏览器中资料来源:Chatonai,德邦研究所3.3.1 应用一:ChatGPT已与搜索引擎相结合 ChatGPT已加

30、入浏览器扩展程序,集成了ChatGPT-4的BING短暂上线 ChatGPT已作为扩展程序加入到Chrome、Firefox、Edge等浏览器的应用中;Bing、谷歌等搜索引擎中将接入ChatGPT,得到自然语言回答。集成了 ChatGPT-4 的新版 Bing 曾于2月4日短暂上线。据设计师 Owen Yin分享的截图,新版 Bing 的搜索框变为聊天框,会在聊天气泡中回复用户的问题。新版 Bing 鼓励用户使用自然语言而不是关键字进行搜索,还能够根据用户的要求调整搜索结果。21请务必阅读正文之后的信息披露及法律声明。图17:虚拟数字人已经接入ChatGPT等模型资料来源:元境科技公众号,德

31、邦研究所 元境科技率先接入ChatGPT,结合自研多模态智能算法,完成了行业首个AIGC互动直播功能的落地。元境科技虚拟数字人已经接入ChatGPT等模型,并已在Tik Tok跨境电商直播、虚拟主播直播互动等场景实现应用,并形成产品化解决方案。未来,将更加关注数字人与ChatGPT等模型的整合应用,快速扩展到不同行业、不同场景。行业首个应用此项技术的虚拟主播是虚拟二次元网红CiCi。在最近的一大段时间里CiCi的直播早已替换为了AIGC互动直播,在测试应用期间一众粉丝均未看出任何异样,同时在使用测试期间粉丝量也持续稳步提升。3.3.2 应用二:泛娱乐行业应用,包括游戏、直播等方面22图19:B

32、站Up主将ChatGPT接入Galgame,打造AI角色资料来源:Bilibili Up主 addone123,德邦研究所图18:骑马与砍杀2 游戏中玩家自由输入文字与NPC沟通资料来源:Gamepressure,德邦研究所3.3.2 应用二:泛娱乐行业应用,包括游戏、直播等方面 RPG游戏的未来:游戏骑马与砍杀2与ChatGPT的结合 骑马与砍杀2 是一款设定在欧洲中世纪风格架空世界的游戏,除了战斗外还可与游戏世界中的各种角色交互。游戏提供接口和Mod制作工具方便玩家按自己喜好修改、扩展游戏内容。Youtube博主Bloc使用ChatGPT算法作为基础,并在此基础上创建了一个“叙事引擎”,其

33、中包含有关游戏内世界的数据:地点,聚会,职业等。玩家可自由输入问题,NPC基于ChatGPT等算法作出游戏背景下的合理回应。Galgame与ChatGPT的结合,可打造定制化AI角色。23SEPARATOR PAGE04类似产品244.1 众多公司推出类似产品,行业竞争激烈表表6:ChatGPT部分海外竞品梳理部分海外竞品梳理模型模型公司公司底层模型底层模型编程能力编程能力合并历史记录合并历史记录价格价格类别类别ChatGPTOpenAIGPT-3.5免费预览;付费订阅20美元/月聊天机器人模型ClaudeAnthropicConstitutional Al内测阶段聊天机器人模型;采用RLAI

34、FNeuroflashneuroflashGPT-3.52000字/月免费;199./月无限字主要服务于德语内容的生成器ChatsonicWritesonicGPT-3.X免费试用;多种付费订阅模式提供了访问当前谷歌数据的选项,而 ChatGPT 的答案有时是几年前的。YouChatRichard Socher-免费将聊天助手集成到其搜索结果中的搜索引擎,它在答案中包含自己的搜索索引,同时也将源网页包含在答案中,并且有脚注编号。PerplexityPerplexity AI基于OpenAI的API免费Perplexity是基于OpenAI API 的搜索引擎,或者说是答案引擎。与 ChatGP

35、T 不同的是它的答案中不仅包括训练数据,还包括来自互联网的内容。GitHub CopilotGitHubGPT-3.5$10/月及以上基于 OpenAI API,侧重代码生成LaMDAGoogleLaMDA免费预览与 ChatGPT 不同,LaMDa 更积极地参与对话、提出问题、讲述自己,并且不仅根据事实而且还“情感地”回答问题。SparrowDeepMindSparrow Model-私人Beta版即将推出Sparrow 使用 Google 搜索来寻找合适的来源;与ChatGPT 类似,使用强化学习(RL)进行训练资料来源:Daniel PericTop 8 ChatGPT Alternat

36、ives for 2023:Discover the Best Options for Your Needs,Source Forge,德邦研究所25图20:CAI的过程资料来源:Yuntao Bai et al.Constitutional AI:Harmlessness from AI Feedback,德邦研究所4.2 Claude:谷歌旗下ChatGPT有力竞品 Claude是Anthropic新推出的一款类似于ChatGPT的AI助手,谷歌已经向Anthropic投资约3亿美元。Anthropic是由前OpenAI的一支研发团队出走成立的人工智能初创公司,大多为 OpenAI 的早期

37、及核心员工,深度参与过OpenAI的多项课题,比如GPT-3、神经网络里的多模态神经元、引入人类偏好的强化学习等。根据Financial Times报道,谷歌已经向Anthropic投资约3亿美元。通过这笔交易,谷歌将获得Anthropic约10%的股份,后者要用这笔钱从前者的云计算部门购买大量计算资源。Claude目前还处于实验阶段,开创性引入了“宪法人工智能”(Constitutional AI,CAI)的概念。与RLHF不同,宪法AI的过程使用模型而不是人类来生成微调输出的初始排名,根据一系列基本原则选择最佳回复,即RLAIF。图21:Claude通过RLAIF无害化输出结果,并取得一定

38、成效资料来源:Scale官网,德邦研究所26图22:Claude与ChatGPT的生成能力对比ClaudeChatGPT对比计算题正确答案约为 1555.80。ChatGPT 的答案非常接近,但 ChatGPT 和Claude 都没有给出正确的答案。事实知识ChatGPT:回答正确但自相矛盾Claude:回答不正确。资料来源:Scale官网,德邦研究所4.2.1 Claude与ChatGPT逻辑推理能力均有提升空间27图22:Claude与ChatGPT的生成能力对比(续前)ClaudeChatGPT对比代码生成均回答正确代码理解ChatGPT:通常会正确处理这个问题,在5次试验中4次取得成功

39、;Claude:在所有5次尝试中都失败了。资料来源:Scale官网,德邦研究所4.2.2 Claude较ChatGPT,代码能力较弱28图22:Claude与ChatGPT的生成能力对比(续前)ClaudeChatGPT对比笑话撰写Claude:可以在经过多轮尝试后生成接近人类的笑话。ChatGPT:无法生成笑话,即使在调整问题,以适应其的谨慎态度之后,也无法获得理想答案。资料来源:Scale官网,德邦研究所4.2.3 Claude比ChatGPT更懂人类幽默29图24:文心大模型发挥了大模型驱动AI规模化应用的产业价值资料来源:公司官网,德邦研究所图23:飞桨在深度学习开源框架中的份额较高资

40、料来源:IDC中国,德邦研究所4.3 百度:拥有打造国产ChatGPT能力的公司 百度拥有飞桨(深度学习开源框架)、百度AI大底座(全栈AI基础设施)和文心大模型(AI应用场景全覆盖)。PaddlePaddle飞桨是中国自主研发的第一个深度学习框架。深度学习框架是在完成深度学习时一套可以复用的代码,使得使用者在开发深度学习程序时可以不用从复杂的神经网络搭建开始编代码,而是在已有的模型上进行个性化改进。百度AI大底座:国內首个全栈自研的Al基础设施,面向企业Al开发和应用,提供端到端自主可控、自我进化的解决方案让企业可以快捷、低成本地实现“Al能力随用随取”文心大模型:源于产业、服务于产业,是产

41、业级知识增强大模型。百度通过大模型与国产深度学习框架融合发展,打造了自主创新的AI底座,大幅降低了AI开发和应用的门槛,满足真实场景中的应用需求,真正发挥大模型驱动AI规模化应用的产业价值。30请务必阅读正文之后的信息披露及法律声明。图26:ERNIE3.0的生成效果资料来源:Yu Sun et al.ERNIE 3.0:LARGE-SCALE KNOWLEDGE ENHANCED PRE-TRAINING FOR LANGUAGE UNDERSTANDING AND GENERATION,德邦研究所图25:ERNIE3.0的架构图资料来源:Yu Sun et al.ERNIE 3.0:LAR

42、GE-SCALE KNOWLEDGE ENHANCED PRE-TRAINING FOR LANGUAGE UNDERSTANDING AND GENERATION,德邦研究所4.3.1 ERNIE:百度基于BERT打造的NLP模型 2月7日,百度官宣其新的大模型项目“文心一言”,英文名ERNIE Bot。ERNIE是百度开创性提出的基于知识增强的持续学习语义理解框架。ERNIE在情感分析、文本匹配、自然语言推理、词法分析、阅读理解、智能问答等16个公开数据集上全面显著超越世界领先技术,在国际权威的通用语言理解评估基准GLUE上,得分首次突破90分,获得全球第一。ERNIE在工业界得到了大规模

43、应用,如搜索引擎、新闻推荐、广告系统、语音交互、智能客服等。314.3.1 ERNIE:百度基于BERT打造的NLP模型 ERNIE由BERT进化而来,经过一系列的升级,目前已推出3.0版本。在 ERNIE 3.0 中,自回归和自编码网络被创新型地融合在一起进行预训练。自编码网络采用 ERNIE 2.0 的多任务学习增量式构建预训练任务,持续的进行语义理解学习。通过新增的实体预测、句子因果关系判断、文章句子结构重建等语义任务进行预训练;同时,创新性地增加了知识增强的预训练任务。自回归网络基于 Tranformer-XL 结构,支持长文本语言模型建模。多范式的统一预训练模式使得 ERNIE 3.

44、0 能够在理解任务、生成任务和零样本学习任务上获取 SOTA 的表现。表表7:ERNIE3.0与与GPT-3的对比的对比ERNIE3.0GPT-3基本信息基本信息公司公司百度OpenAI发布时间发布时间2021年7月2020年5月模型模型底层模型底层模型BERTGPT参数量参数量10B175B学习量学习量4TB45TB资料来源:各公司官网,Tom B.Brown et al.Language Models are Few-Shot Learners,Yu Sun et al.ERNIE 3.0:LARGE-SCALEKNOWLEDGE ENHANCED PRE-TRAINING FOR LAN

45、GUAGE UNDERSTANDING AND GENERATION,德邦研究所324.4 科技公司申请人机对话相关专利表表8:腾讯腾讯、阿里阿里、华为申请的人机对话相关专利华为申请的人机对话相关专利专利名称专利名称人机对话方法以及对话系统人机对话方法、装置、设备及计算机可读存储介质人机对话及预训练语言模型训练方法、系统及电子设备公司公司(专利权人专利权人)华为技术有限公司腾讯科技(深圳)有限公司阿里巴巴达摩院(杭州)科技有限公司授权公告时间授权公告时间2023/2/32023/2/32023/01/31 实质审查的生效内容简介内容简介-资料来源:国家知识产权局,企查查,德邦研究所33SEPA

46、RATOR PAGE05投资建议&风险提示34图19:OpenAI推出付费订阅项目ChatGPT Plus,价格为$20/月资料来源:OpenAI,德邦研究所图18:ChatGPT上线2个月后月度用户数量破1亿资料来源:yahoo finance,UBS,德邦研究所5.投资建议:把握AIGC技术催化和商业落地的投资机会 ChatGPT月度用户已破亿,加速商业化布局;国内外科技龙头布局AICG,行业有望迎来爆发式增长。技术发展有望促进生产效率提升,并进一步创造新的消费和需求,有利于文娱内容和互联网行业。在AIGC和ChatGPT方面,我们建议持续关注技术发展和应用情况,把握技术催化和商业化落地带

47、来的投资机会:1)具备AIGC和ChatGPT的技术探索和应用的公司:百度、商汤、万兴科技、拓尔思等;2)具有海量内容素材且具有AIGC探索布局的,图片/文字/音乐/视频内容及平台公司腾讯控股,阅文集团、美图公司、视觉中国、中文在线、汉仪股份、昆仑万维、天娱数科、风语筑等。355.投资建议:把握AIGC技术催化和商业落地的投资机会表表9 9:部分公司在:部分公司在AIGCAIGC领域的布局(截至领域的布局(截至2023/2/62023/2/6)港股公司港股公司证券代码证券代码证券简称证券简称主要研究领域主要研究领域相关应用相关应用/布局布局总市值总市值PEPS(亿元,(亿元,HKD)(TTM)

48、(TTM)9888.HK百度集团-SW深度学习开源框架飞浆Paddle Paddle3,89581.52.8全栈AI基础设施百度AI大底座AI应用场景全覆盖的大模型文心大模型(NLP、CV、跨模态、生物计算、及各种行业大模型)0020.HK商汤-WAI基础设施Sense Core 商汤AI大装置1,004-5.219.2CV(2D/3D关键点捕捉;3D关键点驱动;肖像风格化;图像/视频编辑);虚拟穿戴;数字人-0700.HK腾讯控股AI实验室覆盖CV、NLP、机器学习、强化学习等方面研究-36,01618.45.9AI平台服务腾讯云TI平台;人工智能服务平台;腾讯智能对话平台;IP 虚拟人;音

49、视频字幕平台0772.HK阅文集团NLP联合微软(亚洲)互联网工程院开启AI赋能网络文学40334.74.11357.HK美图公司CV美图秀秀上新AI绘画功能108-50.95.0资料来源:各公司官网,各公司公告,Wind,同花顺等,德邦研究所注:CV(Computer Vision,计算机视觉)36表表9 9:部分公司在:部分公司在AIGCAIGC领域的布局(截至领域的布局(截至2023/2/62023/2/6,续前),续前)A股公司股公司证券代码证券代码证券简称证券简称主要研究领域主要研究领域相关应用相关应用/布局布局总市值总市值PEPS(亿元,(亿元,CNY)(TTM)(TTM)3006

50、24.SZ万兴科技CV旗下首款AIGC产品“万兴AI绘画”将开启公测;产品包括Filmora、万兴喵影、Pixso55180.64.9300229.SZ拓尔思NLPTRS小思智能问答机器人;语义智能技术平台“智拓”14758.913.9300418.SZ昆仑万维图像、音乐、文本、编程等多模态内容生成能力“昆仑天工”旗下模型包括天工巧绘Sky Paint、天工乐府SkyMusic、天工妙笔Sky Text、天工智码SkyCode232263.65.0000681.SZ视觉中国CV发售数轮AIGC数字藏品:与百度旗下的AI作画平台文心一格达成战略合作协议、赋能创作者和版权保护。AIGC方式创造图片

51、内容,平台场景逻辑顺,且仍在大力投入AI布局。118142.917.8300364.SZ中文在线NLP、CV等AI文字辅助创作功能已推出,并在17k小说网面向所有作者开放;AI辅助绘画功能已推出。“Al 主播”实现低成本2高效优质的内容生产,通过 Al驱动复活3D模型虚拟数字人。89-108.67.1301270.SZ汉仪股份字体生成AI造字3955.917.1002354.SZ天娱数科多模态智能算法等升级发布“Meta Surfing-元享智能云平台”,在原有功能基础上纳入AIGC功能模块92-834.84.8603466.SH风语筑CV;数字人等公司在虚拟展厅、虚拟数字人、虚拟场景以及数字

52、艺术创作领域均有结合AI人工智能技术的探索与应用,有效提升了数字创意、三维设计与3D内容创作的效率和独特性。现阶段,上述探索仍集中在AI生成艺术、AI辅助内容创意与生产等领域89147.34.5资料来源:各公司官网,各公司公告,Wind,同花顺等,德邦研究所注:CV(Computer Vision,计算机视觉)5.投资建议:把握AIGC技术催化和商业落地的投资机会37请务必阅读正文之后的信息披露及法律声明。风险提示技术发展不及预期、监管政策变化、知识产权等相关问题。38请务必阅读正文之后的信息披露及法律声明。信息披露分析师与研究助理简介马笑,华中科技大学硕士,2022年加入德邦证券,传媒互联网

53、&海外首席分析师,行业全覆盖。5年多二级研究经验,2年产业战略/投资/咨询经验。曾任新时代证券TMT组长,传媒/计算机首席分析师,此前担任过管理咨询顾问/战略研究员/投资经理等岗位。2018年东方财富百佳分析师传媒团队第一名;2020年wind金牌分析师。投资评级说明1.投资评级的比较和评级标准:以报告发布后的6个月内的市场表现为比较标准,报告发布日后6个月内的公司股价(或行业指数)的涨跌幅相对同期市场基准指数的涨跌幅;类 别评 级说 明股票投资评级买入相对强于市场表现20%以上;增持相对强于市场表现5%20%;中性相对市场表现在-5%+5%之间波动;减持相对弱于市场表现5%以下。2.市场基准

54、指数的比较标准:A股市场以上证综指或深证成指为基准;香港市场以恒生指数为基准;美国市场以标普500或纳斯达克综合指数为基准。行业投资评级优于大市预期行业整体回报高于基准指数整体水平10%以上;中性预期行业整体回报介于基准指数整体水平-10%与10%之间;弱于大市预期行业整体回报低于基准指数整体水平10%以下。39请务必阅读正文之后的信息披露及法律声明。特别声明适当性说明:证券期货投资者适当性管理办法于2017年7月1日起正式实施,通过本微信订阅号/本账号发布的观点和信息仅供德邦证券的专业投资者参考,完整的投资观点应以德邦证券研究所发布的完整报告为准。若您并非德邦证券客户中的专业投资者,为控制投

55、资风险,请取消订阅、接收或使用本订阅号/本账号中的任何信息。本订阅号/本账号难以设置访问权限,若给您造成不便,敬请谅解。市场有风险,投资需谨慎。分析师承诺:本人具有中国证券业协会授予的证券投资咨询执业资格,以勤勉的职业态度、专业审慎的研究方法,使用合法合规的信息,独立、客观地出具本报告,本报告所采用的数据和信息均来自市场公开信息,本人对这些信息的准确性或完整性不做任何保证,也不保证所包含的信息和建议不会发生任何变更。报告中的信息和意见仅供参考。本人过去不曾与、现在不与、未来也将不会因本报告中的具体推荐意见或观点而直接或间接收任何形式的补偿,分析结论不受任何第三方的授意或影响,特此证明。免责声明

56、:德邦证券股份有限公司经中国证券监督管理委员会批准,已具备证券投资咨询业务资格。本报告中的信息均来源于合规渠道,德邦证券研究所力求准确、可靠,但对这些信息的准确性及完整性均不做任何保证,据此投资,责任自负。本报告不构成个人投资建议,也没有考虑到个别客户特殊的投资目标、财务状况或需要。客户应考虑本报告中的任何意见或建议是否符合其特定状况。德邦证券及其所属关联机构可能会持有报告中提到的公司所发行的证券并进行交易,还可能为这些公司提供投资银行服务或其他服务。本报告仅向特定客户传送,未经德邦证券研究所书面授权,本研究报告的任何部分均不得以任何方式制作任何形式的拷贝、复印件或复制品,或再次分发给任何其他

57、人,或以任何侵犯本公司版权的其他方式使用。如欲引用或转载本文内容,务必联络德邦证券研究所并获得许可,并需注明出处为德邦证券研究所,且不得对本文进行有悖原意的引用和删改。如未经本公司授权,私自转载或者转发本报告,所引起的一切后果及法律责任由私自转载或转发者承担。本公司并保留追究其法律责任的权利。本资料不是德邦证券研究报告的发布平台,所载内容均来自于德邦证券已正式发布的研究报告,或对研究报告进行的整理与解读,因此在任何情况下,本订阅号中的信息或所表述的意见并不构成对任何人的投资建议。40德邦证券股份有限公司地 址:上海市中山东二路600号外滩金融中心N1幢9层电 话:+86 21 68761616 传 真:+86 21 68767880400-8888-128

友情提示

1、下载报告失败解决办法
2、PDF文件下载后,可能会被浏览器默认打开,此种情况可以点击浏览器菜单,保存网页到桌面,就可以正常下载了。
3、本站不支持迅雷下载,请使用电脑自带的IE浏览器,或者360浏览器、谷歌浏览器下载即可。
4、本站报告下载后的文档和图纸-无水印,预览文档经过压缩,下载后原文更清晰。

本文(计算机行业AIGC专题二:ChatGPT更懂人类的叙事-230214(41页).pdf)为本站 (分析师) 主动上传,三个皮匠报告文库仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。 若此文所含内容侵犯了您的版权或隐私,请立即通知三个皮匠报告文库(点击联系客服),我们立即给予删除!

温馨提示:如果因为网速或其他原因下载失败请重新下载,重复下载不扣分。
会员购买
客服

专属顾问

商务合作

机构入驻、侵权投诉、商务合作

服务号

三个皮匠报告官方公众号

回到顶部