上海品茶

您的当前位置:上海品茶 > 报告分类 > PDF报告下载

ChatGPT研究框架(ChatGPT——生成式AI迎来拐点商用落地前景可期)-230207(72页).pdf

编号:114899 PDF 72页 3.16MB 下载积分:VIP专享
下载报告请您先登录!

ChatGPT研究框架(ChatGPT——生成式AI迎来拐点商用落地前景可期)-230207(72页).pdf

1、ChatGPT研究框架(2023)2023年02月07日 行业专题研究 诚信 责任 亲和 专业 创新 2 ChatGPT生成式AI迎来拐点,商用落地前景可期 请参阅附注免责声明 01 ChatGPT市场反应热烈,国内外巨头纷纷入场 据统计,ChatGPT日活跃用户数的增速远超Instagram,1月份平均每天有超过1300万名独立访问者使用ChatGPT,是去年12月份的两倍多;国内外科技巨头都非常重视ChatGPT引发的科技浪潮,积极布局生成式AI,国内厂商(百度、腾讯等)也高度关注ChatGPT,积极探索前沿技术,相关深度应用也即将推出。02 03 04 摘要 ChatGPT经历多类技术路

2、线演化,逐步成熟与完善 ChatGPT所能实现的人类意图,来自于机器学习、神经网络以及Transformer模型的多种技术模型积累。Transformer建模方法成熟以后,使用一套统一的工具来开发各种模态的基础模型这种理念得以成熟,随后GPT-1、GPT-2、GPT-3模型持续演化升级,最终孵化出ChatGPT文本对话应用。AIGC跨模态产业生态逐步成熟,商用落地未来可期 AIGC产业生态当前在文本、音频、视频等多模态交互功能上持续演化升级,奠定了多场景的商用基础。跨模态生成技术也有望成为真正实现认知和决策智能的转折点。ChatGPT乘东风,商业架构日益清晰 随着ChatGPT Plus发布,

3、商业化序幕已经拉开。ChatGPT在传媒、影视、营销、娱乐以及数实共生助力产业升级等领域均可产生极大助益,提升生产力曲线,多维度赋能虚拟经济和实体经济。3 诚信 责任 亲和 专业 创新 ChatGPT生成式AI迎来拐点,商用落地前景可期 请参阅附注免责声明 目录/CONTENTS 市场概况:ChatGPTAI平民化里程碑 01 技术路径:基于人类反馈系统,ChatGPT助力跨模态AI生成应用 02 行业进程:AIGC多模态交互功能持续演化,奠定多场景商用基础 03 商业方向:多领域多功能应用密集落地,ChatGPT商用前景可期 03 4 诚信 责任 亲和 专业 创新 ChatGPT生成式AI迎

4、来拐点,商用落地前景可期 请参阅附注免责声明 01 市场概况:ChatGPTAI平民化的里程碑 诚信 责任 亲和 专业 创新 5 ChatGPT生成式AI迎来拐点,商用落地前景可期 请参阅附注免责声明 OpenAI在成立之初便备受资本瞩目,与微软合作加速商业化进程 01 ChatGPT是由OpenAI 团队研发创造,OpenAI是由创业家埃隆马斯克、美国创业孵化器Y Combinator总裁阿尔特曼、全球在线支付平台PayPal联合创始人彼得蒂尔等人于2015年在旧金山创立的一家非盈利的AI研究公司,拥有多位硅谷重量级人物的资金支持,启动资金高达10亿美金;OpenAI的创立目标是与其它机构合

5、作进行AI的相关研究,并开放研究成果以促进AI技术的发展 2019年7月 2020年6月 2020年9月 OpenAI发展的里程碑 OpenAI宣布从”非盈利“性质过度到”封顶盈利“性质,利润上限为任何投资的100倍(创立了OpenAI LP公司)微软向OpenAI投资了10亿美金,并获得了OpenAI技术的商业化授权。从此,OpenAI的一些技术开始出现在微软的产品和业务上 OpenAI发布了OpenAI API,这是OpenAI第一个商业化产品,OpenAI正式开始了商业化运作 OpenAI授权微软使用GPT-3模型,微软成为全球首个享用GPT-3能力的公司 2019年3月 图1:Open

6、AI发展势头强劲,商业化趋势明显 资料来源:OpenAI官网,国泰君安证券研究 诚信 责任 亲和 专业 创新 6 ChatGPT生成式AI迎来拐点,商用落地前景可期 请参阅附注免责声明 OpenAI 的ChatGPT是生成式人工智能技术(AIGC)浪潮的一部分 01 资料来源:中国信息通信研究院,国泰君安证券研究 AIGC发展特点 人工智能总体阶段 早期萌芽阶段(20世纪50年代-90年代中期)沉淀积累阶段(20世纪90年代-21世纪10年代中期)快速发展阶段(21世纪10年代中期-至今)受限于技术水平,AIGC仅限于小范围实验 AIGC从实验性向实用性转变,受限于算法瓶颈,无法直接进行内容生

7、成 深度学习算法不断迭代,人工智能生成内容百花齐放 AIGC典型事件 1950年,艾伦图灵提出著名的“图灵测试”,给出判断机器是否具有“智能”的方法 1966年,世界第一款可人机对话机器人“Eliza”问世 80年代中期,IBM创造语音控制打字机“Tangora”2012年,微软展示语全自动同声传译系统,可将英文语音自动翻译成中文语音 2007年,世界上第一部完全由人工智能创作的小说1 The Road问世 2014年,Lan J.Goodfellow提出生成式对抗网络GAN 2018年,英伟达发布StyleGAN模型用于自动生成高质量图片 2019年,DeepMind发布DVD-GAN模型用

8、于生成连续性视频 2022年,OpenAI发布ChatGPT模型用于生成自然能语言文本 图2:随着算法的不断迭代,生成式人工智能技术(AIGC)不断发展 诚信 责任 亲和 专业 创新 7 ChatGPT生成式AI迎来拐点,商用落地前景可期 请参阅附注免责声明 ChatGPT是在GPT基础上进一步开发的自然语言处理模型 01 GPT模型是一种自然语言处理(NLP)模型,使用多层变换器(Transformer)来预测下一个单词的概率分布,通过训练在大型文本语料库上学习到的语言模式来生成自然语言文本 从 GPT-1 到 GPT-3 智能化程度不断提升,ChatGPT 的到来也是 GPT-4 正式推出

9、之前的序章 资料来源:CSDN,国泰君安证券研究 GPT-1(1.17亿参数)GPT-1 有一定的泛化能力,能够用于和监督任务无关的 NLP 任务中 2018 2019 2020 2022.01 GPT-2(15亿参数)除了理解能力外,GPT-2 在生成方面表现出了强大的天赋:阅读摘要、聊天、续写、编故事,甚至可以生成假新闻、钓鱼邮件或在线进行角色扮演 GPT-3(1750亿参数)GPT-3 作为一个自监督模型,可以完成自然语言处理的绝大部分任务:将网页描述转换为相应代码、模仿人类叙事、创作定制诗歌、生成游戏剧本,甚至模仿已故的哲学家预测生命的真谛 InstructGPT InstructGP

10、T是一个经过微调的新版 GPT-3,可以将有害的、不真实的和有偏差的输出最小化 ChatGPT ChatGPT 是 InstructGPT 的衍生产品,它将人类的反馈纳入训练过程,更好地使模型输出与用户意图保持一致 2022.12 图3:ChatGPT由GPT-1到InstructGPT模型的不断成熟而逐步形成 诚信 责任 亲和 专业 创新 8 ChatGPT生成式AI迎来拐点,商用落地前景可期 请参阅附注免责声明 ChatGPT发布后用户数持续暴涨,市场影响力迅速提升 01 根据UBS发布的研究报告显示,ChatGPT在1月份的月活跃用户数已达1亿,成为史上用户数增长最快的消费者应用 相比之

11、下,TikTok花了九个月的时间月活跃用户数才破亿,而Instagram则花费了两年半的时间,同时,根据Similar Web的披露信息,Spotify在四年半后仅积累了1亿月活跃用户 根据Similar Web的数据,1月份平均每天有超过1300万名独立访问者使用ChatGPT,是去年12月份的两倍多 资料来源:UBS,Similar Web,ARK Invest,第一财经,国泰君安证券研究 2个月 9个月 30个月 54个月 图4:ChatGPT日活跃用户数的增速远超Instagram 图5:对比各大热门平台月活跃用户数破亿所需时长,ChatGPT的成长速度惊人 42个月 54个月 90个

12、月 资料来源:第一财经,国泰君安证券研究 诚信 责任 亲和 专业 创新 9 ChatGPT生成式AI迎来拐点,商用落地前景可期 请参阅附注免责声明 ChatGPT已能覆盖较多能力域 01 由于ChatGPT包含了更多主题的数据,能够处理更多小众主题。ChatGPT能力范围可以覆盖回答问题、撰写文章、文本摘要、语言翻译和生成计算机代码等任务。资料来源:ChatGPT,国泰君安证券研究 用鲁迅口吻写一篇评价新冠疫情的散文 用Python写一段CCI量化投资策略 写一篇信创产业的研究报告 用藏文、俄罗斯语、韩语和日文说一句话 用C+写一段爬虫代码 图6:ChatGPT的使用案例如下所示 代码阅读理解

13、和Debug 诚信 责任 亲和 专业 创新 10 ChatGPT生成式AI迎来拐点,商用落地前景可期 请参阅附注免责声明 ChatGPT具备诸多先进性特征 01 ChatGPT嵌入了人类反馈强化学习以及人工监督微调,因而具备了理解上下文、连贯性等诸多先进特征,解锁了海量应用场景 当前,ChatGPT所利用的数据集只截止到2021年。在对话中,ChatGPT会主动记忆先前的对话内容信息(上下文理解),用来辅助假设性的问题的回复,因而ChatGPT也可实现连续对话,提升了交互模式下的用户体验。同时,ChatGPT也会屏蔽敏感信息,对于不能回答的内容也能给予相关建议。资料来源:知乎,国泰君安证券研究

14、 图7:ChatGPT提升的核心点如下所示 连续对话能力 用户意图有效捕捉 上下文理解 敢于质疑 承认不知道 提升准确度 ChatGPT 算法屏蔽 连续对话 人类意图 诚信 责任 亲和 专业 创新 11 ChatGPT生成式AI迎来拐点,商用落地前景可期 请参阅附注免责声明 科技巨头不断下注AI行业,ChatGPT带动新一轮AI发展浪潮 01 2023年初,微软和谷歌均宣布裁员计划,但都加大了在AI行业的投入 资料来源:UBS,财富,华尔街见闻,国泰君安证券研究 1月18日,微软宣布将于3月底前在全球裁员1万人,约占公司员工总数的5%1月23日,微软宣布对 ChatGPT 创建者 OpenAI

15、 进行第三轮投资,将向OpenAI进行为期多年、金额达数十亿美元的投资,以加速其在人工智能领域的技术突破 此外,微软还计划在未来几周内发布其 Bing 搜索引擎的 GPT-4 版本,预计该版本将比 ChatGPT 模型更快、更强大 1月20日,谷歌母公司Alphabet宣布将裁员约1.2万人,占公司员工总数的6%以上,同时公司CEO表示,公司将会进一步聚焦AI技术核心业务的研发投入 2月4日,谷歌注资3亿美元投资ChatGPT竞品Anthropic,和Open AI一样,Anthropic也在开发生成式人工智能 图8:科技巨头纷纷加大ChatGPT相关投入 诚信 责任 亲和 专业 创新 12

16、ChatGPT生成式AI迎来拐点,商用落地前景可期 请参阅附注免责声明 国内外科技巨头积极布局生成式AI,部分公司已有成型产品 01 国内外科技巨头都非常重视ChatGPT引发的科技浪潮,积极布局生成式AI 国外公司 公司名称 相关布局 谷歌 面对ChatGPT构成的威胁,注资3亿美元投资竞品Anthropic 微软 作为OpenAI的最大投资方,利用ChatGPT提高产品竞争力 亚马逊 ChatGPT受到重点关注,已广泛运用在各种工作职能中 国内公司 百度 预计在3月份完成其ChatGPT产品文心一言(ERNIE Bot)的内测,并面向公众开放 腾讯 目前已经公布一项人机对话专利,能够实现机

17、器与用户之间自然且顺畅的沟通 表1:国内外科技公司积极布局生成式AI 资料来源:各公司公告,国泰君安证券研究 诚信 责任 亲和 专业 创新 13 ChatGPT生成式AI迎来拐点,商用落地前景可期 请参阅附注免责声明 谷歌:面对ChatGPT构成的威胁,注资3亿美元投资竞品Anthropic 01 在ChatGPT发布后,谷歌CEO在公司内部发布了“红色警报”(Code Red),敦促团队解决ChatGPT对公司搜索引擎业务构成的威胁,同时批准了在谷歌搜索引擎中加入AI聊天机器人的计划 2月4日,谷歌注资3亿美元投资ChatGPT竞品Anthropic,谷歌将获得约10%的股份,Anthrop

18、ic计划将次轮资金用于购买谷歌云计算部门的计算资源;Anthropic开发了一款名为Claude的智能聊天机器人,据称可与ChatGPT相媲美(仍未发布)Anthropic和Open AI渊源颇深,其联合创始人曾担任OpenAI 研究副总裁 资料来源:腾讯新闻,国泰君安证券研究 图9:Anthropic的联合创始人曾担任OpenAI 研究副总裁 图10:聊天机器人Claude据称可与ChatGPT相媲美 资料来源:新浪财经,国泰君安证券研究 诚信 责任 亲和 专业 创新 14 ChatGPT生成式AI迎来拐点,商用落地前景可期 请参阅附注免责声明 微软:OpenAI的最大投资方,开始利用Cha

19、tGPT提高产品竞争力 01 微软将ChatGPT视为新一代技术革命,将ChatGPT整合进Bing搜索引擎、Office全家桶、Azure云服务、Teams程序等产品中 微软近期宣布推出视频会议及远程协作平台的高级付费版Microsoft Teams Premium,订阅者可享用OpenAI GPT提供支持的大型语言模型技术,用AI自动生成会议笔记,此举或对Zoom、谷歌会议等平台形成巨大冲击。资料来源:微软官网,国泰君安证券研究 图11:Microsoft Teams Premium 使用 ChatGPT 做笔记,使远程协作更高效 图12:集成了ChatGPT的新版 Bing 曾短暂上线,

20、搜索框类似一个聊天框 资料来源:Windows Central,国泰君安证券研究 诚信 责任 亲和 专业 创新 15 ChatGPT生成式AI迎来拐点,商用落地前景可期 请参阅附注免责声明 亚马逊:ChatGPT受到重点关注,已广泛运用在各种工作职能中 01 ChatGPT 已经被亚马逊用于各种不同的工作职能中,包括回答面试问题、编写软件代码和创建培训文档等 公司内部员工在 Slack 表示,亚马逊Amazon Web Services(AWS)云部门已经成立了一个小型工作组,以更好地了解人工智能对其业务的影响。资料来源:Business Insider,新浪科技,国泰君安证券研究 图13:C

21、hatGPT 已经被亚马逊用于各种不同的工作职能中 资料来源:Encaptechno,国泰君安证券研究 图14:亚马逊AWS云部门的职能与人工智能联系紧密 诚信 责任 亲和 专业 创新 16 ChatGPT生成式AI迎来拐点,商用落地前景可期 请参阅附注免责声明 美国新媒体巨头Buzzfeed踩准ChatGPT风口,两天内股价飙升3倍 01 1月29日,美国新媒体巨头Buzzfeed宣布计划采用ChatGPT协助内容创作,其股价一夜间暴涨近120%,两天内飙升逾300%,成交量突破4.38亿股(其月平均成交量不足2500万股)消息公布后同类型公司股票成交量也迎来历史高峰:C3.ai本月成交量超

22、过7200万股,为自去年6月以来最多;语音AI软件公司SoundHound AI的成交量约为6450万股,几乎是其月平均值的三倍 资料来源:腾讯新闻,国泰君安证券研究 图16:Buzzfeed宣布计划采用ChatGPT协助内容创作后,股票成交量暴涨 图15:Buzzfeed宣布计划采用ChatGPT协助内容创作后,股价一夜间暴涨近120%资料来源:澎湃新闻,国泰君安证券研究 诚信 责任 亲和 专业 创新 17 ChatGPT生成式AI迎来拐点,商用落地前景可期 请参阅附注免责声明 Stability AI:Stable Diffusion大热,Open AI在图片生成AI大有可为 01 Sta

23、bility AI有着与Open AI相同的创业理念:构建开源AI项目,促进AI发展,其成功证明Open AI在图片生成领域同样大有可为 公司的开源模型Stable Diffusion可以根据文字生成图片,只需要几秒钟,就可以生成分辨率、清晰度高,同时不失真实性和艺术性的图片。资料来源:网易新闻,国泰君安证券研究 图17:用户使用基于Stable Diffusion算法构建的工具创建了数百万张图像 图18:Stability AI有着与Open AI相同的创业理念,其成功证明Open AI在图片生成领域同样大有可为 资料来源:Stability AI官网,国泰君安证券研究 诚信 责任 亲和 专

24、业 创新 18 ChatGPT生成式AI迎来拐点,商用落地前景可期 请参阅附注免责声明 Jasper:采用同类底层技术,进一步证明ChatGPT的巨大商业潜力 01 文案自动生成平台Jasper,其技术底层是 OpenAI 的 GPT-3,在成立仅 18 个月后就达到了 15 亿美元的高估值 IBM、Autodesk等巨头公司均是Jasper的付费用户,足以证明ChatGPT底层技术具备巨大的商业潜力。ChatGPT出现后,其技术领先性和受欢迎程度对Jasper形成了强烈冲击。资料来源:搜狐新闻,Jasper 官网,国泰君安证券研究 图19:ChatGPT的出现,对采用同类底层技术的热门公司J

25、asper形成强烈冲击 图20:相比ChatGPT的免费开源,Jasper需要付费使用 资料来源:Jasper 官网,国泰君安证券研究 诚信 责任 亲和 专业 创新 19 ChatGPT生成式AI迎来拐点,商用落地前景可期 请参阅附注免责声明 国内厂商(百度&腾讯):高度关注ChatGPT,积极探索前沿技术 01 百度:1月10日,百度宣布将升级百度搜索的“生成式搜索”能力,智能解答用户的搜索提问;2月7日,百度宣布将在3月份完成其ChatGPT产品的内测,面向公众开放,该项目名字为文心一言(ERNIE Bot)百度指出,生成式AI和搜索引擎是互补关系而不是替代;据路透社报道,百度计划于 3

26、月将类似 ChatGPT 的 AI 对话服务作为独立应用推出,之后再逐步将其合并到搜索引擎中。腾讯:2月3日,腾讯公布一项人机对话专利,能够实现机器与用户之间自然且顺畅的沟通 图22:腾讯发布相关专利,积极涉足ChatGPT领域 资料来源:腾讯新闻,国泰君安证券研究 图21:百度研发的ChatGPT产品“文心一言”将于3月份问世 资料来源:中国经济网,国泰君安证券研究 诚信 责任 亲和 专业 创新 20 ChatGPT生成式AI迎来拐点,商用落地前景可期 请参阅附注免责声明 AIGC创业公司大比拼,国外ChatGPT的优势遥遥领先并有望延续 01 国内对比国外AIGC创业公司的相关产品,国外C

27、hatGPT的优势遥遥领先并有望延续 公司名称 主要AIGC产品 产品领域 OpenAI GPT-3、ChatGPT 文本、图片 Stability AI Stable Diffusion、Dreamstudio 图片、音频 Midjourney Midjourney 图片 Jasper Jasper 文本 Copi.ai Copi.ai 文本 Copysmith Copysmith 文本 表2:国外创业公司涉及的AIGC产品领域十分丰富,相关应用日渐成熟 资料来源:各公司官网,国泰君安证券研究 诚信 责任 亲和 专业 创新 21 ChatGPT生成式AI迎来拐点,商用落地前景可期 请参阅附注

28、免责声明 AI 需要大量资金、人力投入和数据积累,国内市场中巨头更具优势 01 人工智能不仅需要巨大的投入,还需要庞大的用户数据基础,只有互联网巨头才有这个能力产出伟大的产品 国外是微软、谷歌、亚马逊,而国内则是百度、腾讯等互联网巨头最具潜力;相比国外巨头,国内巨头正投入大量资金和人力成本快速发展人工智能技术,在没有硝烟的人工智能竞赛中,中国企业也将异军突起 资料来源:腾讯AI LAB官网,国泰君安证券研究 图24:腾讯的AI 产品在游戏场景中不断提升人机协作与内容生成能力 图23:百度构建了云智共生的生态,助力AI发展 资料来源:百度官网,国泰君安证券研究 22 诚信 责任 亲和 专业 创新

29、 ChatGPT生成式AI迎来拐点,商用落地前景可期 请参阅附注免责声明 02 技术路径:基于人类反馈系统,ChatGPT助力跨模态AI生成应用 诚信 责任 亲和 专业 创新 23 ChatGPT生成式AI迎来拐点,商用落地前景可期 请参阅附注免责声明 2022年 ChatGPT经历多类技术路线演化,逐步成熟与完善 02 资料来源:真格基金,国泰君安证券研究 ChatGPT所能实现的人类意图,来自于机器学习、神经网络以及Transformer模型的多种技术模型积累 GPT-1 GPT-2 GPT-3 Instruc-tGPT ChatGPT T5 BART M2m-100 BigBird BE

30、RT RoBERTa XLM ALBERT ELECTRA Transfo-rmer CNN RNN 神经网络 Machine Learning 基于规则的少量数据处理 1950年开始 1980年开始 1990年开始;2006年获得突破 2017年 2018年 2019年 2020年 基于模板和规则的前深度学习阶段 根据一定范围的数据进行参数分类 开始模仿人脑进行大量数据的标记和训练 对人脑学习过程进行重点关注 进行海量数据学习训练,人类的反馈信息成为模型学习的内容 图25:ChatGPT经过多类技术积累,最终形成针对人类反馈信息学习的大规模预训练语言模型 GAN 诚信 责任 亲和 专业 创新

31、 24 ChatGPT生成式AI迎来拐点,商用落地前景可期 请参阅附注免责声明 资料来源:ChatGPT,国泰君安证券研究 ChatGPT模型在以往模型的基础上有了多方面的显著提升 02 更大的语料库 ChatGPT使用了更大的语料库,以更好地捕捉人类语言的复杂性。更高的准确性 ChatGPT的训练效果比以往的大语言模型更好,因此它的准确性更高。更加通用的预训练 ChatGPT的预训练是通用的,因此它可以更好地适应各种不同的任务。更强的自我学习能力 ChatGPT具有自我学习能力,可以在不断接触新语料的过程中持续提高自己的性能。图26:ChatGPT是基于Transformer架构的语言模型,

32、它在以往大语言模型(如ELMo和GPT-2)的基础上有诸多性能提升 更高的计算能力 ChatGPT使用了更高的计算资源,以获得更好的训练效果。更高的适应性 ChatGPT具有较高的适应性,可以根据不同的场景和任务进行微调,以提高其在特定领域的效果。诚信 责任 亲和 专业 创新 25 ChatGPT生成式AI迎来拐点,商用落地前景可期 请参阅附注免责声明 Transformer的应用标志着基础模型时代的开始 02 转移学习(Transfer Learning)使基础模型成为可能 技术层面上,基础模型通过转移学习(Transfer Learning)(Thrun 1998)和规模(scale)得以

33、实现。转移学习的思想是将从一项任务中学习到的“知识”(例如,图像中的对象识别)应用于另一项任务(例如,视频中的活动识别)。在深度学习中,预训练又是转移学习的主要方法:在替代任务上训练模型(通常只是达到目的的一种手段),然后通过微调来适应感兴趣的下游任务。转移学习(Transfer Learning)使基础模型成为可能。大规模化(scale)使基础模型更强大,因而GPT模型得以形成 大规模需要三个要素:(i)计算机硬件的改进例如,GPU吞吐量和内存在过去四年中增加了10倍;(ii)Transformer模型架构的开发(Vaswani et al.2017),该架构利用硬件的并行性来训练比以前更具

34、表现力的模型;以及(iii)更多训练数据的可用性。基于Transformer的序列建模方法现在应用于文本、图像、语音、表格数据、蛋白质序列、有机分子和强化学习等,这些例子的逐步形成使得使用一套统一的工具来开发各种模态的基础模型这种理念得以成熟。例如,GPT-3(Brown et al.2020)与GPT-2的15亿参数相比,GPT-3具有1750亿个参数,允许上下文学习,在上下文学习中,只需向下游任务提供提示(任务的自然语言描述),语言模型就可以适应下游任务,这是产生的一种新兴属性。资料来源:Attention Is All You Need 论文,国泰君安证券研究 诚信 责任 亲和 专业 创

35、新 26 ChatGPT生成式AI迎来拐点,商用落地前景可期 请参阅附注免责声明 Transformer奠定了生成式AI领域的游戏规则 02 资料来源:Attention Is All You Need,Ashish Vaswani et.al 2017 Transformer摆脱了人工标注数据集的缺陷,模型在质量上更优、更易于并行化,所需训练时间明显更少 Transformer通过成功地将其应用于具有大量和有限训练数据的分析,可以很好地推广到其他任务 2017年,在Ashish Vaswani et.al 的论文Attention Is All You Need中,考虑到主导序列转导模型基于

36、编码器-解码器配置中的复杂递归或卷积神经网络,性能最好的模型被证明还是通过注意力机制(attention mechanism)连接编码器和解码器,因而Attention Is All You Need中提出了一种新的简单架构Transformer,它完全基于注意力机制,完全不用重复和卷积,因而这些模型在质量上更优,同时更易于并行化,并且需要的训练时间明显更少。Transformer出现以后,迅速取代了RNN系列变种,跻身主流模型架构基础。(RNN缺陷正在于流水线式的顺序计算)图27:Transformer模型架构如下所示 诚信 责任 亲和 专业 创新 27 ChatGPT生成式AI迎来拐点,商

37、用落地前景可期 请参阅附注免责声明 Transformer实现的不同技术场景对应的不同技术原理 02 资料来源:量子位智库,国泰君安证券研究 Transformer架构可分为自回归系列(例如GPT-3,偏好生成性任务)、双向Transformer+Mask的自编码系列(例如BERT,偏好自然语言理解)、Encoder-decoder架构(例如T5,使用双向/单向attention,偏好条件文本生成)首先通过词嵌入(Word Embedding)将字、词、句进行区分,然后基于特征评分、序列标注、分类模型等提取内容特征计算相关文本单元权重其次洗择相应的文本单元子集组成摘要候洗集,完成内容选择,最后

38、针对字数要求等限定条件,对候选集的内容进行整理形成最终摘要,完成内容组织。其细分路径又包含生成式文本摘要(AATS),即形成抽象认知并创造新词灵活概括,和抽取式文本摘要(EATS),即直接抽取原始素材并拼接成简单概要 摘要/标题生成 内容续写(例如文章续写)文本风格迁移 整段文本生成 产品特色 通过随机Mask(即遮挡)数据库文本中的词语或语段,让神经网络自主学习复原被遮挡部分,从而拥有“猜测”缺失内容的能力,产出预训练模型。再通过大规模预训练模型理解上文或给定条件,从概率层面推测最符合要求的输出结果。其本质是借助超大规模的训练参数猜测上下文的过程 主流思路是分离文本属性及文本内容 隐式方法即

39、使用某类无监督学习学习或强化学习模式将文本属性及内容自动分离,常见的有生成对抗方式,即通过GAN实现目标属性和文本量性完全由不同的编码控制的状态。对话式文本生成适用于智能客服等任务型和闲聊型机器人等非任务型人机交互场景,可分类为管道模式及端对端模式。结构性的文本生成,首先通过注意力机制、多层感知器等系统进行语句内容预选,对数值、时间等类型数据进行推理。增强数据间的结构信息。其次通过Transformer等模式结合上下文进行推导,生成最终文本。图28:Transformer典型技术场景下的原理介绍如下所述 诚信 责任 亲和 专业 创新 28 ChatGPT生成式AI迎来拐点,商用落地前景可期 请

40、参阅附注免责声明 GPT-1:借助预训练,进行无监督训练和有监督微调 02 资料来源:Improving Language Understanding by Generative Pre-Training 论文,稀土掘金,国泰君安证券研究 GPT-1模型基于Transformer解除了顺序关联和依赖性的前提,采用生成式模型方式,重点考虑了从原始文本中有效学习的能力,这对于减轻自然语言处理(NLP)中对监督学习的依赖至关重要 GPT(Generative Pre-training Transformer)于2018年6月由OpenAI首次提出。GPT模型考虑到在自然语言理解中有大量不同的任务,尽

41、管大量的未标记文本语料库非常丰富,但用于学习这些特定任务的标记数据却很少,这使得经过区分训练的模型很难充分执行。同时,大多数深度学习方法需要大量手动标记的数据,这限制了它们在许多缺少注释资源的领域的适用性。在考虑以上局限性的前提下,GPT论文中证明,通过对未标记文本的不同语料库进行语言模型的生成性预训练,然后对每个特定任务进行区分性微调,可以实现这些任务上的巨大收益。和之前方法不同,GPT在微调期间使用任务感知输入转换,以实现有效的传输,同时对模型架构的更改最小。图29:GPT-1模型的核心手段是预训练(Pre-training)无监督预训练(Unsupervised pre-training

42、)不需要标注数据集,即大规模自学阶段,在保证AI算力充足的条件下,根据attention机制进行自学 有监督微调(Supervised fine-tunning)微调,用来修正模型理解力。即小规模指导过程,让AI在小样本数据下进行调整 结合形成了一种使用无监督预训练和有监督微调相结合的语言理解任务的“半监督方法”诚信 责任 亲和 专业 创新 29 ChatGPT生成式AI迎来拐点,商用落地前景可期 请参阅附注免责声明 GPT-1:模型更简化、计算加速,更适合自然语言生成任务(NLG)02 资料来源:Improving Language Understanding by Generative P

43、re-Training 论文,稀土掘金,国泰君安证券研究 GPT相比于Transformer等 模型进行了显著简化 相比于Transformer,GPT训练了一个12层仅decoder的解码器(原Transformer模型中包含Encoder和Decoder两部分)。相比于Google的BERT(Bidirectional Encoder Representations from Transformers,双向编码生成Transformer),GPT仅采用上文预测单词(BERT采用了基于上下文双向的预测手段)。注:ChatGPT的表现更贴近人类意图,部分因为一开始GPT是基于上文的预测,这更贴

44、近人类的话语模式,因为人类言语无法基于将来的话来做分析。VS 图30:GPT-1模型相比于Transformer模型有了显著简化 Transformer架构 GPT-1架构 GPT用于对不同任务进行微调的输入转换的示意图 诚信 责任 亲和 专业 创新 30 ChatGPT生成式AI迎来拐点,商用落地前景可期 请参阅附注免责声明 GPT-2:采用多任务系统,基于GPT-1进行优化 02 资料来源:Language Models are Unsupervised Multitask Learners论文,国泰君安证券研究 GPT-2在GPT-1的基础上进行诸多改进,实现执行任务多样性,开始学习在不

45、需要明确监督的情况下执行数量惊人的任务 在GPT-2阶段,OpenAI去掉了GPT-1阶段的有监督微调(fine-tuning),成为无监督模型。大模型GPT-2是一个1.5B参数的Transformer,在其相关论文中它在8个测试语言建模数据集中的7个数据集上实现了当时最先进的结果。模型中,Transfomer堆叠至48层。GPT-2的数据集增加到8 million的网页、大小40GB的文本。GPT-2的核心抓手采用多任务模型(Multi-task)GPT-2要实现的目标 GPTGPT-2 2调整优化的目的调整优化的目的是为了解决零次学习问题(zero-shot)(注:zero-shot问题

46、,就是针对AI在面对不认识的事物时,也能进行推理)多任务模型的特点多任务模型的特点:跟传统ML需要专门的标注数据集不同(从而训练出专业AI),多任务模型不采用专门AI手段,而是在海量数据喂养训练的基础上,适配任何任务形式。转向更通用的系统,使其可以执行许多任务,最终无需为每个任务手动创建和标记训练数据集。机器学习系统通过使用大型数据集、高容量模型和监督学习的组合,在训练任务方面表现出色,然而这些系统较为脆弱,对数据分布和任务规范的轻微变化非常敏感,因而使得AI表现更像狭义专家,并非通才。GPT-2要解决和优化的问题 图31:GPT-2通过调整原模型和采用多任务方式来让AI更贴近“通才”水平 诚

47、信 责任 亲和 专业 创新 31 ChatGPT生成式AI迎来拐点,商用落地前景可期 请参阅附注免责声明 GPT-2仍未解决应用中的诸多瓶颈 02 资料来源:Language Models are Few-Shot Learners论文,国泰君安证券研究 GPT-2聚焦在无监督、zero-shot(零次学习)上,然而GPT-2训练结果也有不达预期之处,所存在的问题也亟待优化 在GPT-2阶段,尽管体系结构是任务无关的,但仍然需要任务特定的数据集和任务特定的微调:要在所需任务上实现强大的性能,通常需要对特定于该任务的数千到数十万个示例的数据集进行微调。存在的问题02:预训练加微调范式中,可能在这

48、种范式下实现的泛化可能很差,因为该模型过于特定于训练分布,并且在其之外无法很好地泛化。微调模型在特定基准上的性能,即使名义上是人类水平,也可能夸大基础任务的实际性能。存在的问题03:因为人类学习大多数语言任务不需要大型受监督的数据集,当前NLP技术在概念上具有一定的局限性。存在的问题01:从实用的角度来看,每一项新任务都需要一个标记示例的大数据集,这限制了语言模型的适用性;对于其中的许多任务(从纠正语法到生成抽象概念的示例,再到评论一个短篇故事等等),很难收集一个大型的监督训练数据集,特别是当每个新任务都必须重复该过程时。问题问题 0202 问题问题0101 问题问题0303 GPT-2阶段存

49、在的问题点 图32:GPT-2尚未解决诸多瓶颈问题 诚信 责任 亲和 专业 创新 32 ChatGPT生成式AI迎来拐点,商用落地前景可期 请参阅附注免责声明 GPT-3取得突破性进展,任务结果难以与人类作品区分开来 02 GPT-3对GPT-2追求无监督与零次学习的特征进行了改进 GPT-3利用了过滤前45TB的压缩文本,在诸多NLP数据集中实现了强大性能 GPT-3是一个具有1750亿个参数的自回归语言模型,比之前的任何非稀疏语言模型多10倍。对于所有任务(在few-shot设置下测试其性能),GPT-3都是在没有任何梯度更新或微调的情况下应用的,仅通过与模型的文本交互来指定任务和few-

50、shot演示。GPT-3在许多NLP数据集上都有很强的性能(包括翻译、问题解答和完形填空任务),以及一些需要动态推理或领域适应的任务(如解译单词、在句子中使用一个新单词或执行三位数算术)。GPT-3可以生成新闻文章样本(已很难将其与人类撰写的文章区分开来)。图34:GPT-3相关研究显示,few-shot(少量样本)的综合表现是在无监督模式下最优的 资料来源:Language Models are Few-Shot Learners,国泰君安证券研究 图33:GPT-3的模型参数在GPT-2的基础上增加110多倍 资料来源:Language Models are Few-Shot Learne

51、rs,国泰君安证券研究 诚信 责任 亲和 专业 创新 33 ChatGPT生成式AI迎来拐点,商用落地前景可期 请参阅附注免责声明 InstructGPT模型在GPT-3基础上进一步强化 02 资料来源:Training language models to follow instructions with human feedback论文,稀土掘金,国泰君安证券研究 InstructGPT使用来自人类反馈的强化学习方案RLHF(reinforcement learning from human feedback),通过对大语言模型进行微调,从而能够在参数减少的情况下,实现优于GPT-3的功能

52、 InstructGPT提出的背景:使语言模型更大并不意味着它们能够更好地遵循用户的意图,例如大型语言模型可以生成不真实、有毒或对用户毫无帮助的输出,即这些模型与其用户不一致。另外,GPT-3虽然选择了少样本学习(few-shot)和继续坚持了GPT-2的无监督学习,但基于few-shot的效果,其稍逊于监督微调(fine-tuning)的方式。基于以上背景,OpenAI在GPT-3基础上根据人类反馈的强化学习方案RHLF,训练出奖励模型(reward model)去训练学习模型(即:用AI训练AI的思路)InstructGPT的训练步骤为:对GPT-3监督微调训练奖励模型(reward mo

53、del)增强学习优化SFT(第二、第三步可以迭代循环多次)图35:InstructGPT训练三步骤各自对应的数据集规模如下图所示(labeler指的是OpenAI的标注人员,customer指GPT-3 API的用户)诚信 责任 亲和 专业 创新 34 ChatGPT生成式AI迎来拐点,商用落地前景可期 请参阅附注免责声明 ChatGPT核心技术优势:提升了理解人类思维的准确性 02 资料来源:Training language models to follow instructions with human feedback论文,国泰君安证券研究 InstructGPT与ChatGPT属于相

54、同代际的模型,ChatGPT只是在InstructGPT的基础上增加了Chat属性,且开放了公众测试 ChatGPT提升了理解人类思维的准确性的原因在于利用了基于人类反馈数据的系统进行模型训练(注:根据官网介绍,GhatGPT也是基于InstructGPT构建,因而可以从InstructGPT来理解ChatGPT利用人类意图来增强模型效果)图36:基于人类反馈强化的核心训练流程如下所示:步骤1:搜集说明数据,训练监督策略 步骤2:搜集比较数据,训练一个奖励模型 步骤3:搜集说明数据,使用增强学习优化模型 搜集说明数据(基于 prompt 训练方式的数据集),训练监督策略 Labeler(标记者

55、)揭示期望的输出行为 这个数据用来联合监督学习,对GPT-3进行微调 对这个prompt训练的数据集和若干模型的结果进行抽样 Labeler(标记者)从最优到最差将输出结果进行排序 这个数据用来训练反馈模型 新的prompt从数据集中抽样 借助模型生成输出 反馈模型为输出计算一个反馈结果 反馈结果用来优化策略 诚信 责任 亲和 专业 创新 35 ChatGPT生成式AI迎来拐点,商用落地前景可期 请参阅附注免责声明 ChatGPT得益于通用(基础)模型所构建 AI 系统的新范式 02 基础模型(Foundation Model)在广泛的应用中整合构建机器学习系统的方法,它为许多任务提供了强大的

56、杠杆作用 基础模型是在深度神经网络和自我监督学习的基础上演化而来。基础模型基于广泛数据(通常使用大规模自我监督)训练的任何模型,可以适应(例如微调)广泛的下游任务,目前例子包括BERT(Devlin et al.)、GPT-3(Brown et al.2020)和CLIP(Radford et al.2021)。机器学习使学习算法同质化(例如,逻辑回归),深度学习使模型架构同质化(如卷积神经网络),而基础模型使模型本身同质化(比如,GPT-3)。资料来源:On the Opportunities and Risks of Foundation Models 论文,国泰君安证券研究 图37:人工

57、智能的发展呈现同质化的过程 随着机器学习的引入,任务是如何执行的(自动推断)从例子中显现出来 随着深度学习,用于预测的高级特征出现 有了基础模型,甚至出现了情境学习等高级功能 诚信 责任 亲和 专业 创新 36 ChatGPT生成式AI迎来拐点,商用落地前景可期 请参阅附注免责声明 ChatGPT以基础模型为杠杆,可适用多类下游任务 02 ChatGPT采用了GPT3.5(InstructGPT)大规模预训练模型,在自然语言理解和作品生成上取得极大性能提升 鉴于传统NLP技术的局限问题,基于大语言模型(LLM)有助于充分利用海量无标注文本预训练,从而文本大模型在较小的数据集和零数据集场景下可以

58、有较好的理解和生成能力。基于大模型的无标准文本书收集,ChatGPT得以在情感分析、信息钻取、理解阅读等文本场景中优势突出。随着训练模型数据量的增加,数据种类逐步丰富,模型规模以及参数量的增加,会进一步促进模型语义理解能力以及抽象学习能力的极大提升,实现ChatGPT的数据飞轮效应(用更多数据可以训练出更好的模型,吸引更多用户,从而产生更多用户数据用于训练,形成良性循环)。研究发现,每增加参数都带来了文本合成和/或下游NLP任务的改进,有证据表明,日志丢失与许多下游任务密切相关,随着规模的增长,日志丢失呈现平稳的改善趋势。资料来源:On the Opportunities and Risks

59、of Foundation Models 论文 图38:基础模型可以集中来自各种模态的所有数据的信息,然后这一模型可以适用于广泛的下游任务 诚信 责任 亲和 专业 创新 37 ChatGPT生成式AI迎来拐点,商用落地前景可期 请参阅附注免责声明 ChatGPT大模型架构也是ML发展到第三阶段的必然产物 02 ML中的计算历史分为三个时代:前深度学习时代、深度学习时代和大规模时代,在大规模时代,训练高级ML系统的需求快速增长 计算、数据和算法的进步是指导现代机器学习(ML)进步的三个基本因素。在2010年之前,训练计算的增长符合摩尔定律,大约每20个月翻一番。自2010年代早期深度学习(Dee

60、p Learning)问世以来,训练计算的规模已经加快,大约每6个月翻一番。2015年末,随着公司开发大规模ML模型,训练计算需求增加10至100倍,出现了一种新趋势训练高级ML系统的需求快速增长。2015-2016年左右,出现了大规模模型的新趋势。这一新趋势始于2015年末的AlphaGo,并持续至今(GPT-3于2020年出现)。文章 研究结论 Amodei&Hernandez(2018)3.4 month doubling time between 2012 and 2018 Sastry,G.,et.al(2019,November).2 year doubling period be

61、tween 1959 and 2018 Lyzhov,A.(2021,April).2 year doubling period between 2018 and 2020 表3:ML相关计算规模呈现持续快速攀升趋势 数据来源:compute trends across three eras of machine learning,Jaime Sevilla et.al 图40:2010年至2022年间102个里程碑ML系统的训练计算趋势如下所示 数据来源:compute trends across three eras of machine learning,Jaime Sevilla et

62、.al,国泰君安证券研究 38 诚信 责任 亲和 专业 创新 ChatGPT生成式AI迎来拐点,商用落地前景可期 请参阅附注免责声明 03 行业进程:AIGC多模态交互功能持续演化,奠定多场景商用基础 诚信 责任 亲和 专业 创新 39 ChatGPT生成式AI迎来拐点,商用落地前景可期 请参阅附注免责声明 AIGC:利用人工智能产生内容,提升生产力曲线 03 代码生成 文本问答 图像生成 视频生成 其他 AIGC AIGC:Artificial Intelligence Generated Context,即可以利用人工智能技术自动产生内容,常见如代码生成,文本问答等 ChatGPT 可与人

63、类进行流畅的文本问答 Copilot 可自动编写代码 DALLE2 由文字描述生成图像,如:An astronaut riding a hourse as a pencil drawing 资料来源:OpenAI官网,Copilot官网,Synthesia官网,国泰君安证券研究 Synthesia可将输入文本合成不同述说风格的视频 图41:AIGC应用功能简单如下图所示 诚信 责任 亲和 专业 创新 40 ChatGPT生成式AI迎来拐点,商用落地前景可期 请参阅附注免责声明 ChatGPT已成为AIGC功能矩阵中的重要板块 03 ChatGPT是AIGC“数字内容智能编辑”功能中的重要组成部

64、分,ChatGPT 模型的出现对于文字/语音模态的 AIGC 应用具有重要意义 随着深度学习技术的快速突破以及数字内容的海量增长,AIGC领域相关技术打破了预定义规则的局限性,使得快速便捷且智慧地输出多模态的数字内容成为可能。在技术创新以及多模态模型的持续突破下,AIGC根据功能和对象的不同,按顺序可包括三种主要实用功能:数字内容孪生、数字内容的智能编辑、数字内容的智能创作。这三种功能相互嵌套与结合,可以让AIGC产品具备超越人类的创作潜力。而ChatGPT正是AIGC的数字内容智能编辑这一大功能领域中的重要组成部分。资料来源:Sam Altman,机器翻译观察(公众号),国泰君安证券研究 模

65、型托管、交易平台模型托管、交易平台 面向C端和B端的应用 OpenAI GPT DeepMind Gopher Google GlaM Azure 云计算平台 Google Cloud AWS Ali cloud BERT EMLo 大型语言模型(LLM)Hugging Face Replicat LanguageX 中间层中间层 Startup 图42:ChatGPT是AIGC的产品应用框架中大型语言模型的重要板块 诚信 责任 亲和 专业 创新 41 ChatGPT生成式AI迎来拐点,商用落地前景可期 请参阅附注免责声明 AIGC相关技术包含了三大前沿能力 03 资料来源:中国信通院,国泰君

66、安证券研究 数字内容孪生能力构建现实世界-虚拟世界映射 孪生能力包括智能增强与转译技术,其中增强技术弥补内容数字化过程中的信息损失,转译技术在理解基础上对内容进行多种形式呈现 数字编辑能力打通现实世界虚拟世界交互通道 编辑能力包括智能语义理解与属性控制,语义理解帮助实现数字内容各属性的分离解耦,属性控制则在理解基础上对属性进行精确修改、编辑与二次生成,最终反馈于现实世界,形成孪生-反馈闭环 数字创作能力从数据理解走向数据创作 创作能力可分为基于模仿的创作与基于概念的创作,前者基于对某一类作品数据分布进行创作,而后者从海量数据中学习抽象概念,并基于概念创作出现实世界不存在的内容 计算机视觉技术

67、自然语言处理技术 其他单模态技术 多模态技术 孪生能力 编辑能力 创作能力 智能增强 智能转译 语义理解 属性控制 基于模仿创作 基于概念创作 三维重构 音频修复 语音合成 视觉描述 摘要生成 数字人 智能作画 短片创作 图43:AIGC三大前沿技术能力架构如下图所示 诚信 责任 亲和 专业 创新 42 ChatGPT生成式AI迎来拐点,商用落地前景可期 请参阅附注免责声明 快速发展阶段 2010s-至今 IBM推出基于HMM架构的 语音控制打字机 Tangora,可处理约20000个单词 80年代中期 1957年 莱杰伦希勒 与 伦纳德艾萨克森利用计算机完成世界首曲由计算机完成的音乐 依利亚

68、克组曲(Illiac Suite)1966年 约瑟夫魏岑鲍姆与 肯尼斯科尔比 推出世界首款人机可对话机器人 Eliza 2007年 世界首部完全由人工智能创作的小说 1 The Road 微软公开展示全自动同声传译系统,可讲英文语音自动转化为中文语音 2012年 2014年 对抗生成网络 GAN被提出,GAN网络极大提高AI生成内容的逼真度 2017年 微软人工智能“小冰”创作世界首部100%由人工智能创作诗集 阳光失了玻璃窗 2018年 英伟达发布StyleGAN,其可以自动生成人眼难以分辨真假的高质量图片,2019年 谷歌DeepMind提出DVD-GAN是用AI自动生成连续视频 2021

69、年 OpenAI提出DALLE2 输入文字即可生成极高质量且风格多样的图片 早期萌芽阶段 20世纪50年代-90年代中期 受限于科技水平,AIGC仅限于小范围试验 沉淀积累阶段 1990s-2010s 由实验性向实用性转变 模型结构不断创新,AIGC内容多样性与逼真度不断提高 AIGC行业发展经历了三个主要时期 03 资料来源:中国通信研究院,国泰君安证券研究 AIGC发展经历了早期萌芽、沉淀积累和2014年之后的快速发展阶段 图44:AIGC经历了大致三个阶段的演化发展 诚信 责任 亲和 专业 创新 43 ChatGPT生成式AI迎来拐点,商用落地前景可期 请参阅附注免责声明 从分析式AI到

70、生成式AI逐步演化,生成式AI赋予AIGC创新力 03 生成式AI起源于分析式AI,分析式AI发展过程中的技术积累为生成式AI的产生奠定基础 分析式AI其学习的知识局限于数据本身;生成式AI在总结归纳数据知识的基础上可生成数据中不存在的样本 最新生成式AI技术如GAN,Diffusion等,催生多款AIGC产品如:OpenAI系列、DALLE2(Diffusion),Starry A.I.(基于GAN)等 资料来源:OpenAI官网,Starry A.I.官网,国泰君安证券研究 分析式AI 利用机器学习技术学习数据分布,进行如分类,预测等任务。发展过程中诞生了卷积神经网络,残差深度网络,Tra

71、nsformer网络结构等 推荐系统:挖掘用户与物品的关联关系 人脸识别:根据输入人脸信息进行身份判别 文字识别:根据文字图片输出文本 生成式AI 在学习归纳数据分布的基础上,学习数据产生的模式,并创造数据中不存在的新样本。在分析式AI技术基础上诞生大型Transformer网络,Diffusion等新模型 文字创作:通过提示文本生成完整文案 图像生成:根据关键信息生成风格多样图片,如博客配图,海报图片等 代码生成:根据上下文生成完整代码 数据学习 数据学习+新数据生成 图45:AIGC是在分析式AI的基础上,学习数据产生模式,实现新样本内容的创造 诚信 责任 亲和 专业 创新 44 Chat

72、GPT生成式AI迎来拐点,商用落地前景可期 请参阅附注免责声明 AIGC:学习范式更新奠定基础,模型结构升级助力腾飞 03 深度变分自编码器 对抗生成网路 卷积神经网络模型 在视觉识别任务上表现远超传统机器学习算法,开启深度学习序幕 通过将隐特征建模为可采样的分布,首次稳定地生成从未观测过的图像,极大推动AI生成技术发展 通过生成器与判别起的不断博弈学习,提高生成样本的清晰度与逼真度,可以生成真假难辨的内容 扩散模型 扩散模型在GAN基础上进一步提高样本多样性与逼真度 Transformer结构 提高上下文建模能力,并行的结构加快训练速度,使得构建超大规模模型成为可能 模型结构不断升级 学习范

73、式更新 基于规则的机器学习 基于预先定义的统计模型或规则完成任务,模型自身并不具有学习能力 基于损失函数 与梯度下降 通过损失函数与梯度下降更新模型参数,模型自身可对数据内容进行学习 人工智能技术推动AIGC行业不断发展,其中学习范式的更新赋予AI模型主动学习能力,模型结构升级提升AI模型学习、归纳与创新能力 资料来源:中国通信研究院,国泰君安证券研究 图46:AI模型的升级迭代为AIGC性能跨越式发展奠定基础 诚信 责任 亲和 专业 创新 45 ChatGPT生成式AI迎来拐点,商用落地前景可期 请参阅附注免责声明 AIGC产业链涵盖了从硬件到多类终端应用的广泛领域 03 资料来源:机器翻译

74、观察(微信公众号),国泰君安证券研究 AIGC关联产业可分为应用层、模型层、云计算平台与计算硬件层 计算硬件层结合云计算平台为AIGC提供机器学习训练与推理算力,其中GPU与TPU为硬件核心,主要参与厂商包括英伟达(GPU)与谷歌(TPU);云平台参与厂商则包含AWS,GCP,Azure以及Coreweave;计算硬件层中云计算平台厂商分布稳定,竞争出现于模型层面与应用层面。模型层面,闭源基础模型提供商如OpenAI通过API向用户提供服务,而开源基础模型则通过在托管平台如Hugging Face、Replica公开模型权重。模型训练其高计算力需求推动了模型层厂商与云计算厂商建立合作关系(如

75、OpenAI+Azure,GCP+DeepMind。模型层面闭源模型较为普遍,各厂商依靠模型建立技术壁垒 在应用层面,MidJourney,Runway等自主研发、持有模型;而Jasper,Github Copilot则通过调用闭源模型商提供的API或采用托管平台共享的模型。计算硬件层 提供模型训练与推理的加速芯片 如:GPU(英伟达),TPU(谷歌)闭源基础模型 通过API开放大规模预训练模型 如:Open AI的GPT-3 云计算平台 为开发者提供云计算服务 如:AWS,GCP,Azure,Coreweave 模型托管平台 储存与分享模型 如:Hugging Face,Replica 开源

76、基础模型 开放训练完成的模型权重 如:Stable Diffusion(stability)应用 面向B2B、B2C应用,自身不持有模型 如:Jasper,Github Copilot 端到端应用 自身持有模型 如:Midjourney,Runway 模型层 应用层 图47:AIGC市场框架可由基础设施层、模型层、托管平台以及应用层来进行划分 诚信 责任 亲和 专业 创新 46 ChatGPT生成式AI迎来拐点,商用落地前景可期 请参阅附注免责声明 AIGC产业链上下游玩家百花齐放 03 资料来源:中国信通院,国泰君安证券研究 数据供给方(业务数据联通、素材数据收集等,如第三方营销公司、版权图

77、库方)数据拆分及标注 创作者生态 生物资产及内容素材提供 底层配合工具 渲染引擎、混音设备等 相关算法/模型研究机构 相关开源算法 嵌入/结合能力的业务平台/业务生态 上游 下游 各类内容创作及分发平台(基于AIGC激发PGC及UGC活力 第三方分发渠道 内容终端生产厂商 新闻媒体机构、金融机构 消费品厂商 AIGC内容检测 第三方内容服务机构 如MCN、公关公司等 中游 内容设计 视觉设计、文案设计、结构设计等 内容制工具 音频/视频编辑工具、新闻采编、游戏制作 周边售卖 NFT个性化产品等 运营增效 智能客服、简单决策等 自动实时交互 数据梳理 内外部数据分享及更新、数据分析及算法训练 个

78、性化市场营销 广告植入、品牌虚拟形象打造、各模态营销内容生成 彩云小梦 赅推智能 智搜科技 秘塔科技-秘塔写作猫 香侬慧语-火龙果写作 黑狐科技-写作狐 文字 诗云科技 图像 视频 音频 灵动音科技 游戏 AIGC虚拟人 其他机构 垂直赛道初创公司 综合赛道初创公司 AIGC上游主要包括数据供给方、算法机构、创作者生态以及底层配合工具等,中游主要是文字、图像、音频和视频处理厂商,其中玩家众多;下游主要是各类内容创作及分发平台以及内容服务机构等。图48:AIGC产业链上下游参与者分类如下图所示 诚信 责任 亲和 专业 创新 47 ChatGPT生成式AI迎来拐点,商用落地前景可期 请参阅附注免责

79、声明 AIGC厂商之间的竞争在于模型层面竞争 03 资料来源:各公司官网,腾讯研究院,量子位,国泰君安证券研究 追根溯源,AIGC依赖于底层机器学习模型产生内容,因此模型为AIGC行业厂商真正竞争力所在 文本生成产品多依赖GPT系列模型,自己训练的模型在图像/视频模态产品中较为普遍(图像/视频模态产品通常拥有自己训练的模型,而不是如文本模态调用OpenAI提供的模型服务)比较而言,OpenAI依靠模型建立先发竞争优势,技术到产品转化相对亮眼 Open AI Stability AI Midjourney Meta GPT系列模型 ChatGPT,CLIP DALLE 2 Codex Midjo

80、urney Stable Diffusion Make-a-scene Make-a-video 模型 基于GPT-3:Snazzy AI,Copysmith,Copy.ai 基于Codex:Github Copliot 基于DALLE 2:DALLE 2 Dreamstudio 开源算法Stable Diffusion应用于DALLE 2,Diffusion等其他公司模型中 产品 图49:AIGC模型产品之间存在激烈竞争 诚信 责任 亲和 专业 创新 48 ChatGPT生成式AI迎来拐点,商用落地前景可期 请参阅附注免责声明 AIGC取长补短,有望成为主流内容生产模式 03 AIGC所属内

81、容生产生态的发展经历了专家生产内容(PGC)、用户生成内容(UGC)、AI辅助生产内容、AI生产内容(AIGC)四个阶段,目前处于一、二阶段为主,第三阶段为辅的境况 AIGC克服PGC与UGC存在的 质量、产量 无法兼具的缺点,其有望成为未来主流的内容生产模式 资料来源:foresightnews.pro,中国信通院,国泰君安证券研究 PGC UGC AIGC 辅助 由专业团队生产,内容质量高 内容生产门槛高,垄断严重 生产周期长,难以满足大规模生产需求 电视,电影,游戏等 创作工具下放,用户可自行生产内容,创作门槛、成本降低 内容生产参与者众多,创作生态繁荣,个性化程度高 创作者参差不齐,内

82、容质量不高 短视频,社交媒体文章,播客等 AI技术学习的专业知识辅助内容生产环节,提高内容质量 AI技术实现自动化内容生产,减少创作耗时,提高内容生产规模天花板 人在关键环节依然需要输入指令,没有做到完全自主性 AI辅助文字创作,图片创作等 AIGC 实现完全自主性 AI自主文字创作,图片创作等 图50:AIGC生态内容生产模式理论上会经历四个发展阶段 诚信 责任 亲和 专业 创新 49 ChatGPT生成式AI迎来拐点,商用落地前景可期 请参阅附注免责声明 AIGC生成技术可按模态进行分类 03 AIGC 视频 视频画质增强 视频内容创作 视频风格迁移 文本 文本创作 代码生成 对话问答 图

83、像 图片编辑 图片生成 3D图像生成 音频 文本合成语音 语音克隆 音乐生成 跨模态 文字合成图片 文字合成视频 AIGC根据其内容模态不同可分为文本、视频、图像,音频与跨模态生成 资料来源:各公司官网,中国通信研究院,国泰君安证券研究 图51:AIGC应用功能简单如下图所示 诚信 责任 亲和 专业 创新 50 ChatGPT生成式AI迎来拐点,商用落地前景可期 请参阅附注免责声明 AIGC不同模态对应着各种生成技术及应用场景 03 AIGC不同模态对应的技术应用场景也有着各自的细分品类 资料来源:量子位智库,国泰君安证券研究 图52:AIGC各技术应用场景对应的特征及细分品类如下图所示 文本

84、生成 分为非交互式文本和交互式文本 音频生成 包括语音克隆、文本生成特定语音,音乐生成 视频生成 视频属性编辑,视频自动剪辑,视频部分编辑 跨模态生成 文字生成图像,文字生成视频,图像/视频到文本 图像生成 分为图像编辑工具和图像自主生成工具 策略生成 AI基于特定问题和场景,自主提出解决方案的过程。此类技术在游戏、自动驾驶、机器人控制等领域有极高 应用价值。GameAl 游戏本身为AI提供了最佳的研发场景,有大量数据和贴近实 际场景 虚拟人生成 指存在于非物理世界(如图片、视频、直播、一体服务机、VR)中,并具有多重人类特征的综合产物。AIGC各模态应用领域 诚信 责任 亲和 专业 创新 5

85、1 ChatGPT生成式AI迎来拐点,商用落地前景可期 请参阅附注免责声明 AIGC文本生成技术场景可分为交互式和非交互式 03 结构化写作 基于结构化数据,在特定场景类型下生成结构化文本内容,如新闻,财报等简讯写作。现有产品如:WordSmith,AX Semantics等 创作型(非结构化)写作 相比结构化的文本,创作型文本具有更高的开放度与自由度,需要一定的创意与个性化,如社交媒体,营销文案,博客文案等。现有产品如:WriteSonic、Retresco等 闲聊机器人 在一个上下文中进行文本交互,如客服问答,机器人聊天等。现有产品如:小冰岛等 非交互式文本 交互式文本 文本交互游戏 使用

86、AI技术生成游戏内容,现有产品如AI Dungeon等 文本生成 AIGC非交互式文本生成技术中,结构化写作其形式相对固定,生成难度较小,商业化应用较为广泛;而创作型写作开放性较大,在长文本生成中难度较大,仍需技术进一步发展 随着通信互联网技术发展,线上社交需求快速增长,如闲聊机器人等交互式文本产品将迎来快速发展 资料来源:量子位智库,国泰君安证券研究 图53:文本内容生产领域相关细分特征如下架构图所述 诚信 责任 亲和 专业 创新 52 ChatGPT生成式AI迎来拐点,商用落地前景可期 请参阅附注免责声明 图54:文本生成技术商业化落地有比较优势 AIGC文本生成技术商业化落地有望优势先发

87、 03 文本领域预训练大模型技术成熟,文本领域细分垂类较多,产品数量居首位,模型数量发展超过其他模态技术 数字内容中,文字模态数据远大于图片/视频/音频等,发展前景相对较大 基于GPT-3的文字生成功能已嵌入如Writesonic、Conversion.ai、Copysmith等软件中,商业化前景相对清晰 资料来源:量子位智库,国泰君安证券研究 文本易于获得 相较于其他模态数据,文本数据易于获得且数量庞大,满足大规模预训练模型对数据量的需求 文本表达信息更为高效 相比图片,语音,视频等模态,文本信息在存储、处理、传输时占用资源少,而信息量不逊色于图片等。在这种优势文本将成为人机交互等领域的首选

88、 大模型趋势下文本预训练实现难度小 文本数据其离散的性质使得相同模型架构下大模型训练消耗资源低与图片/视频 BERT GPT UniLM ELMO word2vec XLNet T5 ALBERT ALBERT BART 图55:AIGC文本模态技术(包括文本与代码)商业化领跑视频/图像模态技术 资料来源:红杉,国泰君安证券研究 诚信 责任 亲和 专业 创新 53 ChatGPT生成式AI迎来拐点,商用落地前景可期 请参阅附注免责声明 AIGC图像生成技术随着模型结构的优化而明显提升 03 图像编辑工具 更改或复刻图片风格,或根据提示更改图片的其中一部分或在图片中添加新的构成元素等 现有产品如

89、:NightCafe、Metaphysics等 创意图像生成 自由或按照一定风格产生图像 现有产品如:Starry A.I.等 图像自主生成 图像生成 2D图像生成3D模型 输入2D图像,由AI生成图像中物体的3D模型 现有产品如:英伟达GANverse3D 功能性图像生成 按照指定要求产生海报,logo等有一定格式限制的图像 现有产品如:DeepDreamGenerator等 模型结构不断进化提高了AIGC生产图像的多样性,但要求较高的功能实现还有待于技术的进一步提升 “图像编辑”难度低于“图像生成”与“2D-3D”转换,目前已存在多款产品支持“图像编辑”,而对于“图像生成”任务,由于图片相

90、较包含更多元素,其生成效果仍存在不稳定性,对于要求较高的功能类图像生成仍需要技术上的提升。变分自编码器 对抗生成网络 Transformer网络 扩散模型 图57:模型结构进化不断提高了图像生成质量 图56:图像生成技术具体实现包括图像编辑、2D-3D转换以及自主生成 资料来源:量子位智库,国泰君安证券研究 资料来源:量子位智库,国泰君安证券研究 诚信 责任 亲和 专业 创新 54 ChatGPT生成式AI迎来拐点,商用落地前景可期 请参阅附注免责声明 AIGC音频生成技术正朝更富情感等人类特征演化 03 音频生成细分技术 文本到语音任务已比较成熟,语音质量已达到自然的标准,未来将朝更富情感、

91、富韵律的语音合成以及小样本语音学习方向发展 音乐生成任务中仍需解决音乐数据难以标注的问题,数据标注其颗粒度大小影响音乐生成任务的可控性。若可控性得以解决,则可指定风格、情绪等因素的音乐生成任务有希望在影视、游戏等场景下的到大量应用。资料来源:量子位智库,国泰君安证券研究 文本到语文本到语音合成音合成 音乐生成音乐生成 音乐音乐生成生成 输入文字,输出特定说话人的语音,主要应用于机器人,语音播报等任务 现有产品/厂商如:科大讯飞、思必驰、ReadSpeaker等 语音克隆语音克隆 语音克隆语音克隆 给定一段目标语音,将输入的语音或文字转换为目标语音中说话人的语音,其可视为指定说话人的语音合成任务

92、,主要应用于智能配音等场景 现有产品/厂商如:ResembleAI、Replica等 根据开头旋律或文字描述等利用AI自动生成特定乐曲 现有产品/厂商如:AmperMusic、IBM Watson Music等 文本到语音合成文本到语音合成 图58:AIGC音频细分生成技术特点如下图所示 诚信 责任 亲和 专业 创新 55 ChatGPT生成式AI迎来拐点,商用落地前景可期 请参阅附注免责声明 视频生成 为AIGC应用生态中的高潜力场景 03 资料来源:量子位智库,国泰君安证券研究 视频生成本质上与图片生成类似,通过对视频进行帧数级别的切割,实现对每一帧的处理 视频生成过程包括三个阶段:数据的

93、提取、训练和转换,当前技术正在着重提升视频修改精准度和实时性两个维度。鉴于视频本身的文本、图像和音频的综合属性,视频生成也是跨模态生成领域的重要应用场景。图59:视频生成技术具体包括视频属性编辑、视频自动剪辑、视频部分编辑 视频属性编辑 视频画质修复,添加特定内容,视频美颜等 其产品如:Runway ML、Wisecut等 视频自动剪辑 利用AI技术检测视频片段,生成预告片,宣传视频等 其产品如:IBM Watson 视频内容动态编辑 利用AI技术对视频中的内容进行动态编辑,更换演员面部等 其产品如:Faceswap,Deepfakes等 诚信 责任 亲和 专业 创新 56 ChatGPT生成

94、式AI迎来拐点,商用落地前景可期 请参阅附注免责声明 跨模态生成技术是真正实现认知和决策智能的转折点 03 资料来源:量子位智库,Nova AI官网,国泰君安证券研究 现实世界的信息是文本、音频、视觉、传感器以及人类各种触觉的综合体系,要更为精准地模拟现实世界,就需要将各种模态能力之间打通,例如文字-图像、文字-视频等跨模态生成能力 大型预训练模型的发展使得跨模态逐步成熟,“文本-图像”生成正在快速落地,“文字-视频”的实验效果也已较为理想(视频时长、清晰程度、逻辑等还有较大提升空间)。图60:跨模态生成 领域当前的主要功能类型如下所示 文字生成图像 根据文字描述生成创意图像 其产品如:Ope

95、n AI的DALLE2等 文字生成视频(拼接图片素材生成视频)其产品如:Lumen5等 文字生成视频(以端到端的方式生成视频)其产品如:CogView2等 图片/视频生成文字 用于视觉问答系统,自动字幕等 其产品如:Noval AI等 诚信 责任 亲和 专业 创新 57 ChatGPT生成式AI迎来拐点,商用落地前景可期 请参阅附注免责声明 AIGC改变数字内容生产模式 03 电商 传媒 其他 娱乐 影视 新闻采编 新闻稿写作 视频剪辑 新闻传播 商品虚拟化 虚拟主播 购物会场虚拟化 教育 金融 医疗 工业 趣味音视频合成 建立虚拟偶像 开发C端数字化身 剧本创作 拓展角色与创作空间 助力影片

96、剪辑 AIGC AIGC作为新的内容生产模式,其具有内容多样,可控性强与生产效率高的优点,符合传媒,电商,影视,娱乐等行业对内容数字化程度高、内容多样以及内容更新快的要求,AIGC在以上行业逐渐替代传统内容生产模式的趋势十分显著 资料来源:中国信通院,国泰君安证券研究 图61:AIGC对各大行业的影响维度如下图所示 诚信 责任 亲和 专业 创新 58 ChatGPT生成式AI迎来拐点,商用落地前景可期 请参阅附注免责声明 AIGC渗透传媒领域各个环节 03 新闻采编 新闻稿件写作 视频剪辑 新闻播报 AIGC技术逐渐渗透传媒领域包括采集、编辑、传播等环节,有助于加快内容生产效率,提高内容质量,

97、扩宽内容影响力 资料来源:中国信通院,国泰君安证券研究 语音转换文字:自动化录音整理,保证新闻时效性,减少机械性重复劳动 结构性文本写作:基于算法纂写新闻稿,加速内容生产,提高内容准确度 视频自动剪辑:从素材中快速生成视频,减少人工剪辑劳动量,加快视频发布 跨模态视频生成文字:自动生成与视频同步的字幕 视频属性编辑:视频增强工具提高视频清晰度,带给观众更好体验 跨模态视频合成:从新闻稿合成主播播报视频,提高了播报效率与准确度,带给观众不一样的播报体验 图62:AIGC对传媒领域的赋能如下图所述 诚信 责任 亲和 专业 创新 59 ChatGPT生成式AI迎来拐点,商用落地前景可期 请参阅附注免

98、责声明 AIGC化2D为3D,拓展电商展示维度 03 商品 3D模型 3D 虚拟会场 虚拟主播 基于不同角度的商品图像,借助视觉生成算法生成商品3D模型,720 全方位展示商品,减少消费者选品与沟通时间 3D商品模型提供线上虚拟“试、穿、看、戴”,高度还原商品真实效果,减小订单退换货率 通过AI技术打造虚拟主播介绍商品信息并提供客服服务,可实现直播24小时不间断,为客户提供更灵活的观看时间与更方便的购物服务 虚拟主播人设可控性强,因主播自身原因导致品牌受损的几率小 虚拟主播易于拉近品牌与年轻消费者的距离,同时构建元宇宙潮流下的品牌形象,为未来多元化的虚拟世界打下基础 通过从2D图像构建3D场景

99、的AI技术,降低商家搭建3D线上购物空间的门槛与成本。商家可向消费者提供线上沉浸式购物体验,可降低门店扩张成本,扩大品牌知名度 AIGC 2D图像生成3D模型技术为传统电商提供多维度的展示空间 虚拟合成主播为客户提供更及时、可靠、亲和的服务体验 资料来源:中国信通院,国泰君安证券研究 图63:AIGC对有助于为电商行业降本增效 诚信 责任 亲和 专业 创新 60 ChatGPT生成式AI迎来拐点,商用落地前景可期 请参阅附注免责声明 AIGC打破传统娱乐体验边界 03 趣味图像或音视频合成 打造虚拟偶像,释放IP价值 AIGC+娱乐 开发C端用户数字化身 为用户提供趣味性AIGC应用,在图像视

100、频方面如AI换脸,AI合影;音频方面如语音变声器等 1.通过粉丝创作词曲,真人提供声源,AI语音软件合成歌曲的方式,实现偶像粉丝共创,增加粉丝黏性 2.AI合成音视频及AI 3D建模等技术支撑虚拟偶像在多样场景下进行内容变现 通过用户的一张图片,可自动化生成具有“我”个人特色的虚拟形象,可在未来作为用户虚拟世界中的数字化身 AIGC技术打破物理边界,使粉丝可与偶像亲密互动,并形成新的发展点 AIGC为用户打开虚拟世界入口,通过趣味方式体验虚拟世界 图64:AIGC在娱乐领域也有诸多赋能点,有助于进一步提升产业空间 资料来源:中国信通院,国泰君安证券研究 诚信 责任 亲和 专业 创新 61 Ch

101、atGPT生成式AI迎来拐点,商用落地前景可期 请参阅附注免责声明 AIGC拓宽影视行业创意边际 03 助力剧本创作 拍摄中 拓展角色和场景创作空间 赋能视频剪辑,后期制作 利用AI技术分析学习海量剧本数据,并根据预设风格快速产生剧本,创作者再进行筛选与二次加工,可极大缩短剧本创作周期,并激发创作者创造力,激发创作灵感 1.减小演员自身局限对影视作品的影响,如通过AI“数字复活”已故演员或替换劣迹艺人;减小演员自身与角色的年龄差距并辅助拍摄高难度动作拍摄 2.通过AI合成虚拟场景,将无法实拍的场景呈现出来,拓宽作品想象力边界,给观众带来更好作品体验 1.利用AI技术可实现影视图像修复,还原,提

102、升清晰度等任务,提升画面质量 2.快速生成电影预告片 3.利用AI技术加速2D影视内容到3D的转制速度 资料来源:中国信通院,国泰君安证券研究 AIGC技术以其内容多样性为作品内容带来更多灵感 AIGC技术帮助拍摄突破物理限制,还原剧本效果,提高作品质量 图65:AIGC在剧本创作、拍摄过程以及后期制作方面均有助益 诚信 责任 亲和 专业 创新 62 ChatGPT生成式AI迎来拐点,商用落地前景可期 请参阅附注免责声明 AIGC促进各行业转型升级 03 教育 赋予教育材料新活力 金 融 实现降本增效 医疗 赋能诊疗全过程 工业 提升产业效率与价值 利用AI技术使抽象,平面的课本具体化,立体化

103、,使知识传播更生动,趣味 实现金融资讯、产品介绍视频内容的自动化生产,提升机构运营效率 塑造虚拟数字客服,完善金融服务 AIGC将工程设计中重复、耗时、低层次的任务自动化,缩短整体设计时间 将基于物理环境的数字几何图形快速转化为实时3D模型,高效创建工厂,设备等数字孪生系统 改善医学图像质量,录入电子病历,减轻医生工作压力 辅助病人康复治疗,如使用语音合成技术为失语者合成语言音频等 资料来源:中国信通院,国泰君安证券研究 AIGC技术在各行业数字内容相关领域均有发挥空间 图66:AIGC在教育、金融、工业、医疗领域的应用优势如下图所示 63 诚信 责任 亲和 专业 创新 ChatGPT生成式A

104、I迎来拐点,商用落地前景可期 请参阅附注免责声明 04 商业化:多领域多功能应用密集落地,ChatGPT商用前景可期 诚信 责任 亲和 专业 创新 64 ChatGPT生成式AI迎来拐点,商用落地前景可期 请参阅附注免责声明 ChatGPT试点订阅计划ChatGPT Plus发布,商业化序幕已经拉开 04 2023年2月2日,OpenAI发布ChatGPT试点订阅计划ChatGPT Plus,每月20美元 ChatGPT Plus订阅者可获得比免费版本更稳定、更快的服务,及尝试新功能和优化的优先权 资料来源:OpenAI官网,国泰君安证券研究 图67:ChatGPT Plus处于OpenAI官

105、网的醒目位置,凸显商业化倾向 图68:ChatGPT Plus订阅者可获得比免费版本更优质的服务 资料来源:OpenAI官网,国泰君安证券研究 诚信 责任 亲和 专业 创新 65 ChatGPT生成式AI迎来拐点,商用落地前景可期 请参阅附注免责声明 ChatGPT+传媒:实现智能新闻写作,提升新闻的时效性 04 ChatGPT可以帮助新闻媒体工作者智能生成报道,将部分劳动性的采编工作自动化,更快、更准、更智能地生成内容 资料来源:中国信息通信研究院,国泰君安证券研究 2014年3月,美国洛杉矶时报网站的机器人记者Quakebot,在洛杉矶地震后仅3分钟,就写出相关信息并进行发布 美联社使用的

106、智能写稿平台Wordsmith 可 以 每 秒 写 出2000篇报道 中国地震网的写稿机器人在九寨沟地震发生后7秒内就完成了相关信息的编发 第一财经“DT稿王”一分钟可写出1680字 图69:过往成功案例众多,ChatGPT在传媒领域的商业化大有可为 诚信 责任 亲和 专业 创新 66 ChatGPT生成式AI迎来拐点,商用落地前景可期 请参阅附注免责声明 ChatGPT+影视:拓宽创作素材,提升作品质量 04 ChatGPT可以根据大众的兴趣身定制影视内容,从而更有可能吸引大众的注意力,获得更好的收视率、票房和口碑 ChatGPT可以为剧本创作提供新思路,创作者可根据ChatGPT的生成内容

107、再进行筛选和二次加工,从而激发创作者的灵感,开拓创作思路,缩短创作周期。ChatGPT 有着降本增效的优势,可以有效帮助影视制作团队降低在内容创作上的成本,提高内容创作的效率,在更短的时间内制作出更高质量的影视内容 2016年,纽约大学利用人工智能编写剧本Sunspring,经拍摄制作后入围伦敦科幻电影48小时前十强 2020年,美国查普曼大学的学生利用OpenAI的GPT-3模型创作剧本并制作短片律师 国内海马轻帆科技公司推出的“小说转剧本”智能写作功能,服务了包括你好,李焕英流浪地球等爆款作品在内的剧集剧本30000多集、电影/网络电影剧本8000多部、网络小说超过500万部 图70:内容

108、生成在影视领域运用广泛,ChatGPT在影视领域的商业化大有可为 资料来源:中国信息通信研究院,国泰君安证券研究 案例1 案例2 案例3 诚信 责任 亲和 专业 创新 67 ChatGPT生成式AI迎来拐点,商用落地前景可期 请参阅附注免责声明 ChatGPT+营销:打造虚拟客服,赋能产品销售 04 ChatGPT 可以打造虚拟客服,助力产品营销 全天候营销 01 ChatGPT虚拟客服为客户提供24小时不间断的产品推荐介绍以及在线服务能力,同时降低了商户的营销成本,促进营销业绩快速增长 02 ChatGPT虚拟客服比人工客服更稳定可靠,在人工客服有限并且素质不齐的情况下,虚拟客服展现的品牌形

109、象和服务态度等由商户掌控,比人工客服的可控性、安全性更强 03 塑造品牌形象 ChatGPT虚拟客服能快速了解客户需求和痛点,拉近商户与消费人群的距离,塑造跟随科技潮流、年轻化的品牌形象 稳定可靠 图71:利用ChatGPT打造的虚拟客服,具备无可比拟的营销优势 资料来源:国泰君安证券研究 诚信 责任 亲和 专业 创新 68 ChatGPT生成式AI迎来拐点,商用落地前景可期 请参阅附注免责声明 ChatGPT+娱乐:人机互动加强,激发用户参与热情 04 ChatGPT可以成为线上的实时聊天对象,增加互动的趣味性和娱乐性 图72:ChatGPT的对话具备趣味性和娱乐性 资料来源:ChatGPT

110、,国泰君安证券研究 诚信 责任 亲和 专业 创新 69 ChatGPT生成式AI迎来拐点,商用落地前景可期 请参阅附注免责声明 ChatGPT+其他:促进数实共生,助力产业升级 04 ChatGPT+教育:赋予教育教材新活力,让教育方式更个性化、更智能 ChatGPT+金融:帮助金融机构降本增效,让金融服务更有温度 ChatGPT+医疗:赋能医疗机构诊疗全过程 ChatGPT给教育工作者提供全新的教学工具,学生可以通过自主提问的方式快速查缺补漏,让每个学生得到更个性化、更智能的教育 ChatGPT+教育 ChatGPT+金融 ChatGPT+医疗 一方面,金融机构可以通过ChatGPT实现金融

111、资讯、金融产品介绍内容的自动化生产,提升金融机构内容生产的效率;另一方面,可以通过ChatGPT塑造虚拟理财顾问,让金融服务更有温度 ChatGPT可以快速了解患者的病情并给出较合理的及时反馈,通过人性化的方式第一时间抚慰患者,从而舒缓患者的情绪,加速其康复;同时,让医者有更多的时间和精力集中在关键患者的关键治疗环节 图73:ChatGPT在教育、金融和医疗产业中也大有用武之地 资料来源:国泰君安证券研究 诚信 责任 亲和 专业 创新 70 ChatGPT生成式AI迎来拐点,商用落地前景可期 请参阅附注免责声明 短期来看,ChatGPT的快速推广阻力仍存 04 短期来看,ChatGPT仍存在诸

112、多不足,亟待解决的问题主要有两方面:合规性问题和技术性问题 资料来源:零壹财经,第一财经,国泰君安证券研究 SUCCESS 技术性问题 合规性问题 1.ChatGPT产生的答复是否产生相应的知识产权?2.ChatGPT进行数据挖掘和训练的过程是否需要获得相应的知识产权授权?3.ChatGPT是基于统计的语言模型,这一机制导致回答偏差会进而导致虚假信息传播的法律风险,如何降低其虚假信息传播风险?1.ChatGPT的回答可能过时,因为其数据库内容只到2021年,对于涉及2022年之后,或者在2022年有变动的问题无能为力 2.ChatGPT在专业较强的领域无法保证正确率,即使在鸡兔同笼此类初级问题

113、中仍然存在错误,并且英文回答和中文回答存在明显差异化 3.ChatGPT对于不熟悉的问题会强行给出一定的答案,即使答案明显错误,依然会坚持下去,直到明确戳破其掩饰的内容,会立马道歉,但本质上会在不熟悉的领域造成误导 图74:合规性问题和技术性问题是当前ChatGPT主要面临的挑战 本公司具有中国证监会核准的证券投资咨询业务资格 分析师声明 作者具有中国证券业协会授予的证券投资咨询执业资格或相当的专业胜任能力,保证报告所采用的数据均来自合规渠道,分析逻辑基于作者的职业理解,本报告清晰准确地反映了作者的研究观点,力求独立、客观和公正,结论不受任何第三方的授意或影响,特此声明。免责声明 本报告仅供国

114、泰君安证券股份有限公司(以下简称“本公司”)的客户使用。本公司不会因接收人收到本报告而视其为本公司的当然客户。本报告仅在相关法律许可的情况下发放,并仅为提供信息而发放,概不构成任何广告。本报告的信息来源于已公开的资料,本公司对该等信息的准确性、完整性或可靠性不作任何保证。本报告所载的资料、意见及推测仅反映本公司于发布本报告当日的判断,本报告所指的证券或投资标的的价格、价值及投资收入可升可跌。过往表现不应作为日后的表现依据。在不同时期,本公司可发出与本报告所载资料、意见及推测不一致的报告。本公司不保证本报告所含信息保持在最新状态。同时,本公司对本报告所含信息可在不发出通知的情形下做出修改,投资者

115、应当自行关注相应的更新或修改。本报告中所指的投资及服务可能不适合个别客户,不构成客户私人咨询建议。在任何情况下,本报告中的信息或所表述的意见均不构成对任何人的投资建议。在任何情况下,本公司、本公司员工或者关联机构不承诺投资者一定获利,不与投资者分享投资收益,也不对任何人因使用本报告中的任何内容所引致的任何损失负任何责任。投资者务必注意,其据此做出的任何投资决策与本公司、本公司员工或者关联机构无关。本公司利用信息隔离墙控制内部一个或多个领域、部门或关联机构之间的信息流动。因此,投资者应注意,在法律许可的情况下,本公司及其所属关联机构可能会持有报告中提到的公司所发行的证券或期权并进行证券或期权交易

116、,也可能为这些公司提供或者争取提供投资银行、财务顾问或者金融产品等相关服务。在法律许可的情况下,本公司的员工可能担任本报告所提到的公司的董事。市场有风险,投资需谨慎。投资者不应将本报告作为作出投资决策的唯一参考因素,亦不应认为本报告可以取代自己的判断。在决定投资前,如有需要,投资者务必向专业人士咨询并谨慎决策。本报告版权仅为本公司所有,未经书面许可,任何机构和个人不得以任何形式翻版、复制、发表或引用。如征得本公司同意进行引用、刊发的,需在允许的范围内使用,并注明出处为“国泰君安证券研究”,且不得对本报告进行任何有悖原意的引用、删节和修改。若本公司以外的其他机构(以下简称“该机构”)发送本报告,则由该机构独自为此发送行为负责。通过此途径获得本报告的投资者应自行联系该机构以要求获悉更详细信息或进而交易本报告中提及的证券。本报告不构成本公司向该机构之客户提供的投资建议,本公司、本公司员工或者关联机构亦不为该机构之客户因使用本报告或报告所载内容引起的任何损失承担任何责任。免责声明 北京地址:北京市西城区金融大街甲9邮编:200032电话:(010)83939888电话:(021)38676666上海深圳地址:深圳市福田区益田路6009号邮编:518026电话:(0755)23976888国泰君安证券研究所E-mail:地址:上海市静安区新闸路669号邮编:200041

友情提示

1、下载报告失败解决办法
2、PDF文件下载后,可能会被浏览器默认打开,此种情况可以点击浏览器菜单,保存网页到桌面,就可以正常下载了。
3、本站不支持迅雷下载,请使用电脑自带的IE浏览器,或者360浏览器、谷歌浏览器下载即可。
4、本站报告下载后的文档和图纸-无水印,预览文档经过压缩,下载后原文更清晰。

本文(ChatGPT研究框架(ChatGPT——生成式AI迎来拐点商用落地前景可期)-230207(72页).pdf)为本站 (XCAP) 主动上传,三个皮匠报告文库仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。 若此文所含内容侵犯了您的版权或隐私,请立即通知三个皮匠报告文库(点击联系客服),我们立即给予删除!

温馨提示:如果因为网速或其他原因下载失败请重新下载,重复下载不扣分。
会员购买
客服

专属顾问

商务合作

机构入驻、侵权投诉、商务合作

服务号

三个皮匠报告官方公众号

回到顶部