上海品茶

您的当前位置:上海品茶 > 报告分类 > PDF报告下载

2023年AI大模型行业发展现状及目前主流AI模型与其应用解读报告.pdf

编号:123899 PDF 35页 3.50MB 下载积分:VIP专享
下载报告请您先登录!

2023年AI大模型行业发展现状及目前主流AI模型与其应用解读报告.pdf

1、2023 年深度行业分析研究报告 4目录目录1 大模型发展历程及发展现状:科技巨头引领行业,国内大厂布局较早,众多厂商结合自身优势积极布局2 海外及国内的热门AI应用:国内自17年以来,一级市场AI+垂直赛道项目众多3 目前主流AI模型及应用解读:从文本生成辅助决策到视频生成4 国内一级市场及二级市场公司在AI领域百花齐放,有所积累5目录目录1 1 大模型发展历程及发展现状:科技巨头引领行业,国内大厂布局较早,众多厂商结合自身优势积极布局大模型发展历程及发展现状:科技巨头引领行业,国内大厂布局较早,众多厂商结合自身优势积极布局2 海外及国内的热门AI应用:国内自17年以来,一级市场AI+垂直赛

2、道项目众多3 目前主流AI模型及应用解读:从文本生成辅助决策到视频生成4 国内一级市场及二级市场公司在AI领域百花齐放,有所积累61.1 大模型发展历程:大模型发展历程:ChatGPT引领引领AI迎来“奇点”,开启迎来“奇点”,开启AGI序幕序幕资料来源:CSDN,OpenAI,Google博客,量子位,机器之星,华安证券研究所整理图表图表1 1:大模型发展历程图大模型发展历程图7CSDN,GitHub,界面,IT之家,Google博客,Meta AI,量子位,机器之星,华安证券研究所整理图表图表2 2:海外公司大模型与落地场景海外公司大模型与落地场景1.2 海外大模型布局:科技巨头持续创新,

3、引领行业发展方向海外大模型布局:科技巨头持续创新,引领行业发展方向模型公司模型公司模型类型模型类型大模型分类大模型分类技术能力技术能力应用场景应用场景落地产品(软件)落地产品(软件)微软微软/OpenAI多模态GPT2018年6月,GPT-1发布,参数量达到1.17亿个,语言泛化能力不足,无法解决通用的语言任务;2019年2月,GPT-2发布,参数量达到15亿个,舍弃模型微调,通过大模型进行预训练,开始能够解决多语言任务能力;2020年5月,GPT-3发布,参数量达到1750亿个,引入In-context训练方式学习上下文,翻译、聊天问答和文本填空等任务表现出色,能够生成难辩真假新闻的能力;2

4、022年3月,InstructGPT发布,参数量达到5400亿个;2022年11月,推出对话式AI模型ChatGPT,由GPT-3.5大型语言模型微调而来,并引入人工反馈的强化学习(RLHF)。能够处理复杂语言工作,包括自动文本生成、自动问答、编写和调试计算机程序及创作故事;2023年3月,GPT-4发布,能够阅读文字和识别图像并生成文本结果,回复的准确性较历史版本有提升生成、编辑和协助写作任务,例如作曲、写剧本和学习写作风格Office、GitHub Copilot、Codex;Inworld AI,多邻国、Yabble,Be My Eyes、Stripe、Khan Academy;Sale

5、sforce,Bain&Company,Snap,Shopify;Notion、newbing;Interact、Shop、Klarna谷歌谷歌多模态PaLM-E规模最大的模型“PaLM-E-562B”具有5620亿个参数,将5400亿的PaLM和220亿的ViT集成在一起,是目前已知最大的视觉-语言模型,可用于感知推理任务、视觉语言任务和语言任务生成文本、对话、总结书面材料、解决数学定理、预测蛋白质结构Bard、Chrome、Gmail、Google Workspace多模态Claude-Next隶属于AI研究初创公司Anthropic,公司成立于2021年,创始团队大都来自OpenAI,包

6、括前研究副总裁Dario Amodei;2023年2月Google以30亿美金投后估值投资3亿美金,合作涉及谷歌Cloud为Anthropic构建大规模GPU和TPU集群,以训练其AI系统;公司预计Claude-Next将需要10的25次方FLOPS的算力,比最大的模型还大上几个数量级。计划在18个月内投入10亿美元,公司称将比今天最大的AI还要强10倍运用“Constitutional AI”的训练技术使AI与人类思维一致。成为对标ChatGPT的对话式人工智能产品Notion、Robin AI、AssemblyAI、PeoMetaMeta多模态AV-HuBERT2023年3月发布MuAVi

7、C,是基于多语言的视听语料库,首次将视听学习应用于准语音翻译,应用于AV-HuBERT模型训练,可以进行有噪音环境下的端到端翻译;使用MuAViC情况下,AV-HuBERT模型能够结合面部特征和语音表现实现多模态输入,提升识别的准确度。在World Error Rate和BLEU Score评测中,Meta模型都在嘈杂环境下取得更好的表现,在清净环境下的表现与竞对一致利用视频和视觉输入对语音进行转录,视听语音、翻译成文本亚马逊亚马逊多模态Bloom(Hugging Face&AWS)Bloom是开源AI模型,在规模和范围上与OpenAI创建的ChatGPT模型竞争,并在AWS制造的专有人工智能

8、芯片Trainium上运行;2022年3月,Hugging Face联合众多学者宣布Bloom 1760亿参数模型开始训练;2022年5月,Bloom 1.0版本诞生。6月,epoch 1开始训练;2022年7月,Bloom 1.3版本诞生,模型训练结束;2023年2月,亚马逊云科技宣布与Hugging Face进一步合作,加速对大语言模型和视觉模型的训练、精调和部署,促进生成式AI应用的创建用户针对特定用例优化模型性能和降低成本以构建生成式AI应用BLOOM、Qualtrics81.3 国内大模型布局:老牌大厂国内大模型布局:老牌大厂AI大模型布局较早,持续进阶大模型布局较早,持续进阶图表图

9、表3 3:国内:国内公司大模型与落地场景公司大模型与落地场景模型公司模型公司模型类型模型类型大模型分类大模型分类技术能力技术能力应用场景应用场景落地产品(软件)落地产品(软件)标的公司标的公司百度文心大模型文心大模型与飞桨共享生态,围绕“产业级”和“知识增强”两大特色,构建适合产业应用的模型体系电力、燃气、金融、航天、传媒等领域小度科技、度小满、百度地图、集度汽车百度集团-SW(9888.HK)NLP文心 NLP大模型 业界首个开放的千亿参数的中文生成API智能创作、摘要生成、问答、语义检索、情感分析、信息抽取、文本匹配、文本纠错等各类自然语言理解和生成任务文心一格、文心百中(网页&小程序)C

10、V文心 CV大模型VIMER-CAE创新性地提出“在隐含的编码表征空间完成掩码预测任务”的预训练框架,实现图像分类、目标检测、语义分割等经典任务达到SOTA结果图像分类、图像检测、图像分割多模态文心 跨模态大模型基于知识增强的跨模态语义理解关键技术,实现跨模态检索、图文生成、图片文档的信息抽取等应用图像生成、艺术创作、虚拟现实、AI 辅助设计等科学计算 文心 生物计算大模型融合自监督和多任务学习,将生物领域研究对象的特性融入模型。构建面向化合物分子、蛋白分子的生物计算领域预训练模型,赋能生物医药行业小分子药物研发文心 行业大模型 与各行业头部企业合作,在通用大模型的基础上学习行业特色数据与知识

11、,建设行业AI基础设施能源、金融、航天、传媒、城市、影视、制造、社科太平洋网络(0543.HK)、财讯传媒(0205.HK)、超媒体控股(0072.HK)、掌阅科技(603533.SH)、华策影视(300133.SZ)、蓝色光标(300058.SZ)、风语筑(603466.SH);爱奇艺(IQ.O)、携程集团(9961.HK)、汽车之家(2518.HK)、能链智电(NAAS.O)、微盟集团(2013.HK)华为NLP盘古NLP大模型 Encoder-Decoder架构,兼顾NLP大模型的理解和生成能力,保证模型在不同系统的兼容性。仅需少量样本和学习参数,即可完成千亿规模大模型快速微调和下游适配

12、智能舆论、智能营销CV盘古CV大模型参数量30亿,训练数据10亿级图像,国内第一梯队,约国外2021-2022年水平 智能巡检、智慧物流科学计算气象大模型借助3DEST网格结构以及分层时间聚合算法,提供秒级天气预报气象预报、台风路径预测腾讯NLP混元大模型腾讯AI大模型是万亿参数,ChatGPT是1750亿,预计强于ChatGPT不如GPT4,偏自然语言处理。大模型被分到6个BG进行测试研发微信、游戏、短视频、广告和ToB业务腾讯控股(0700.HK)字节跳动NLPDA-Transformer 在大模型上已有布局,主要在语言和图像两种模态上发力。其中,语言大模型团队组建于今年,团队规模在十数人

13、左右,主要探索方向为同搜索、广告等业务线的结合AI视频创作,AI语音,数字人抖音,TikTok,Pico,电子阅读器掌阅科技(603533.SH)阿里巴巴多模态通义千问超大规模语言模型,能力包括多轮对话、文案创作、逻辑推理、多模态理解和多语言支持,目前钉钉、天猫精灵正测试接入大模型文案创作、续写小说、编写邮件,阿里所有产品未来将接入大模型全面升级钉钉(自动写工作方案)天猫精灵(提升智能化水平)阿里巴巴(9988.HK)多模态通义-M62021年11月推出的多模态大模型,参数由万亿跃迁至10万亿,成为当时全球最大的AI预训练模型。使用521张GPU在10天内训练出具有可用水平的10万亿模型,相比

14、GPT-3,M6同等参数规模,能耗仅为其1%模型实现架构、模态和任务统一,便于在M6基础上精调得到丰富的小模型电商场景电商场景:光云科技(688365.SH)、值得买(300785.SZ)、凯淳股份(301001.SZ)、青木股份(301110.SZ)、若羽臣(003010.SZ)、三江购物(601116.SH)智能音箱智能音箱:奋达科技(002681.SZ)、炬芯科技(688049.SH)、中科蓝汛(688332.SH)、漫步者(002351.SZ)、全志科技(300458.SZ)、智度股份(000676.SZ)传媒板块传媒板块:视觉中国(000681.SZ)、游族网络(002174.SZ)

15、、丝路视觉(300556.SZ)、佳云科技(300242.SZ)、智度股份(000676.SZ)、风语筑(603466.SH)、元隆雅图(002878.SZ)、捷成股份(300182.SZ)、焦点科技(002315.SZ)NLP通义-AliceMind 达摩院开源的深度语言模型体系,涵盖预训练模型、多语言预训练模型、超大中文预训练模型阅读理解、机器翻译、对话问答、文档处理CV通义-视觉基于英伟达A10 GPU、阿里云CIPU芯片以及IaaS+软件加速,实现新一代的GPU云服务,在AI计算和视觉计算能力获得大幅提升电子商务、AI医疗、智能农业、自动驾驶、城市大脑、工业视觉、手机牌照、AIOT行业

16、模型层平台解决方案服务商以通义大模型为底座,开发SaaS应用提供增值服务;传媒和游戏运用AIGC实现体验升级法律、医疗、电商、交通、娱乐CSDN,GitHub,界面,IT之家,Google博客,Meta AI,量子位,机器之星,公司官网,Wind,iFinD,华安证券研究所整理91.3 国内大模型布局:基于历史业务经验探索大模型国内大模型布局:基于历史业务经验探索大模型图表图表4 4:国内:国内公司大模型与落地场景公司大模型与落地场景模型公司模型公司模型类型模型类型大模型分类大模型分类技术能力技术能力应用场景应用场景落地产品(软件)落地产品(软件)标的公司标的公司网易多模态玉知多模态理解大模型

17、参数达到110亿,结构由深层Encoder和浅层Decoder组成,大模型有优秀的理解能力和生成能力,浪潮提供AI算力支持云音乐、长视频、广告网易云音乐、网易游戏网易-S(9999.HK)、云音乐(9899.HK)快手多模态快手该模型的专家数量接近200个,模型参数两达到100B快手短视频中的推荐、搜索和广告等核心业务快手快手-W(1024.HK)京东多模态织女大模型织女模型Vega v2凭借60亿参数量规模大幅超过谷歌提出的5400亿超大模型PaLM的复杂语言理解性能,刷新世界纪录多模态ChatJD1个平台、2个领域、5个应用作为落地路线图内容生成、人机对话、用户意图理解、信息抽取、情感分类

18、京东集团-SW(9618.HK)商汤科技多模态日日新SenseNova取名为“持续更新”之意,提供to B服务,为政企客户提供API接口。用户可根据大模型的不同AI技术能力,实现图片生成、自然语言处理、视觉感知通用任务与标注政企大模型使用商汤(0020.HK)三六零NLPTo C基于搜索场景推出人工智能个人助力类产品智能助理类产品360浏览器三六零(601360.SH)NLPTo SME基于生成式大模型推出SaaS化垂直应用,如结合生成式AI的“苏打办公套件”和“企业即时通讯工具-推推”,解决中小微企业数字化转型难题解决中小微企业数字化转型NLPTo G&B计划结合数字安全业务推出企业私有化A

19、I服务,满足客户对私有知识、资产的索引需求满足客户对私有知识、资产的索引需求云从科技多模态3月30日,云从科技发布定增募集说明书,定增36亿元用于行业大模型下游场景的应用研发重点行业大模型云从科技-UW(688327.SH)昆仑万维多模态天工巧绘SkyPaint文本生成图片模型,即提示词文本编码器模型和扩散模型两大部分产生高质量图片昆仑万维(300418.SZ)多模态天工乐府SkyMusic商用级作曲AI模型音乐和娱乐STARX,starmakerNLP天工妙笔SkyText拥有14B和3B的参数模型;中文GPT3预训练大模型,可以进行文章续写、对话、中英翻译、内容风格生成、推理、诗词对联等不

20、同任务文字创作OperaNLP天工智码SkyCode拥有2.6B的参数模型;采用GPT3模型结构,模型能够理解中文注释并对代码进行补齐编程NLPSkyChat基于中文GPT3 API研发的项目,可以像ChatGPT一样,实现人机聊天、问答、中英文互译、对对联和写古诗任务聊天机器人Minimax多模态(文本、视觉、声音)MiniMax与火山引擎合作建立了超大规模实验平台,实现千卡级常态化训练聊天社交软件及toB API Glow资料来源:CSDN,GitHub,界面,IT之家,Google博客,Meta AI,量子位,机器之星,公司官网,Wind,iFinD,华安证券研究所整理各垂直领域厂商百花

21、齐放,结合自身所在领域,进行大模型探索,在视频推荐、人机对话、智能助理、编程等多领域有所探索。各垂直领域厂商百花齐放,结合自身所在领域,进行大模型探索,在视频推荐、人机对话、智能助理、编程等多领域有所探索。10目录目录1 大模型发展历程及发展现状:科技巨头引领行业,国内大厂布局较早,众多厂商结合自身优势积极布局2 2 海外及国内的热门海外及国内的热门AIAI应用:国内自应用:国内自1717年以来,一级市场年以来,一级市场AI+AI+垂直赛道项目众多垂直赛道项目众多3 目前主流AI模型及应用解读:从文本生成辅助决策到视频生成4 国内一级市场及二级市场公司在AI领域百花齐放,有所积累11资料来源:

22、量子位,IT桔子,crunchbase,华安证券研究所整理图表图表5 5:海外热门应用所使用的模型技术梳理:海外热门应用所使用的模型技术梳理2.1 海外热门应用所用模型梳理:从文本生成与图像生成到视频生成与海外热门应用所用模型梳理:从文本生成与图像生成到视频生成与3D生成生成按照生成内容的种类,目前海外按照生成内容的种类,目前海外AIAI应用可以分为辅助决策类、文本生成类、图像生成类、视频生成类、代码生成类、应用可以分为辅助决策类、文本生成类、图像生成类、视频生成类、代码生成类、3D3D生成类等,生成类等,其中文本生成类和图像生成类应用相对较为成熟,视频生成类、代码生成类、其中文本生成类和图像

23、生成类应用相对较为成熟,视频生成类、代码生成类、3D3D生成类仍处于发展前期。生成类仍处于发展前期。文字生成及辅助决策类应用:文字生成及辅助决策类应用:以NLP领域中的transformer模型为主(transformer解决了RNN不能并行处理的问题,因此可以堆高模型参数)图像生成类应用:图像生成类应用:原本以CV领域中的GAN模型为主,现以多模态模型中的diffusion model为主(diffusion model解决了GAN模型效果不稳定的问题);4月以来,SAM、SegGPT、Grounded-SAM模型接连诞生,可以识别图像和视频中的一切物体,CV领域或亦迎来了“GPT-3时刻”

24、视频生成类应用:视频生成类应用:23年3月20日,首个多模态视频生成模型Gen-2诞生模型所模型所属公司属公司模型名模型名称称模型类模型类型型应用软件应用软件应用上线应用上线时间时间软件所属软件所属公司公司公司是公司是否上市否上市软件所属公司融资情况软件所属公司融资情况应用描述应用描述商业模式商业模式战略合作关系战略合作关系OpenAlOpenAlDavinciDavincimodelmodelNLPNLPFRASEFRASEIOIO2019FRASE Inc否种子轮:2018年融资约95万美金文本生成类:用于SEO(搜索引擎优化)营销,帮助用户创建高质量、契合搜索引擎的内容,以提高网站排名和

25、流量。收费,个人版$19.99每月digitas、ptc、talkspace等GPTGPT 3 3NLPNLPCopy.aiCopy.ai2020-10-1CopyAI Inc否种子轮:CraftVentures领投,融资数额290万美金文本生成类:用于自动化文案生成,包括广告文案、博客文章、社交媒体帖子、产品描述免费(有收费Pro版)groove、zoom、hubspot、confluent、seismic、datadogA轮:WingVentureCapital领投,红杉、Tiger、个人天使投资人EladGil跟投,融资数额1100万美金JasperJasper AIAI2021-1-1

26、Jasper否2022年10月:融资额1.31亿美金,估值15亿美元文本生成类:用于自动化生成高质量的营销和广告文案、博客文章、产品描述、电子邮件、社交媒体帖子等收费,基础版$29.99每月intel、klarna、zoom、Deloitte、ibm、Google、airbnb、digital marketerNotion.AINotion.AI2022-11-1Notion否天使轮:2013年融资200万美元A轮:2019年7月融资1800万美金B轮:2020年4月融资5000万美金C轮:2021年10月融资2.5亿美元,投后估值103亿美元文本生成类:能帮助用户快速生成和修改文本内容,可运

27、用在文学、会议日程、新闻稿、销售文案等内容的辅助性创作中免费(有收费Pro版)airbnb、nike、Amazon、uber、toyota、ibm等ReplicaReplica2016-02Luka Inc否A1轮:2016年4月获442万美元融资文本生成类:可以模拟人类对话,对用户的输入提供真实的反应,可用于心理健康咨询、语言学习、娱乐等。免费(有收费Pro版)A2轮:2017年11月获650万美元融资ElaiElai2021Elai.io否2022年获5万美元融资视频生成类:只需要文本就能制作出有真人主持的专业视频,可用于教育、营销、企业沟通、带货等用途收费,基础版$29每月partner

28、:nVidia、amazon、Microsoft、thinkific、Google for startupInworldInworld:AIAI2022-04Inworld:AI否种子轮:21年11月融资700万美元(投资方包括Meta)Pre-A轮:22年3月融资1000万美元A轮:22年8月获得Intel Capital领投的5000万美元3D生成类:文生NPC,可创建角色、设定场景、设定世界观常识等免费,(有收费基础版$10/月、专业版、定制版)DisneyDALLEDALLE 多模态多模态CraiyonCraiyon2021-06Boris Dayma(个人)否图像生成类:只需要在搜索

29、框中输入相应场景的文字描述,就能生成各种或唯美、搞笑又或者是画面惊悚的图片。免费(有收费Pro版)CLIPCLIP多模态多模态starryaistarryai2021Mo Kahn(个人)否图像生成类:能生成各种风格和主题的艺术作品,可为客户提供所创建图像的完全所有权,可用于个人或商业用途。免费(有收费会员和积分制度)GPTGPT-4 4 多模态多模态GitHubGitHubCopilotCopilot X X2023-03GitHub否A轮:2012年由Andreessen Horowitz领投,融资1亿美元代码生成类:具备对话、文本生成代码、语音生成代码、自动修复代码Bug,以及解释代码等

30、功能收费,个人版$10每月微软旗下的公司,与Open AI合作开发B轮:2015年由Sequoia Capital领投,融资2.5亿美元12资料来源:量子位,IT桔子,crunchbase,华安证券研究所整理图表图表6 6:海外热门应用所使用的模型技术梳理(续):海外热门应用所使用的模型技术梳理(续)2.1 海外热门应用所用模型梳理:从文本生成与图像生成到视频生成与海外热门应用所用模型梳理:从文本生成与图像生成到视频生成与3D生成生成模型所属公司模型所属公司模型名称模型名称模型类型模型类型应用软件应用软件应用上线时间应用上线时间软件所属软件所属公司公司公司是公司是否上市否上市软件所属公司融资情

31、况软件所属公司融资情况应用描述应用描述商业模式商业模式战略合作关系战略合作关系DeepMindDeepMindBigGANBigGANCVCVArtbreederArtbreeder2019-05StudioMorphoge(工作室)否图像生成类:用于创作人物肖像、人物形象、动漫角色、建筑、画作、自然景观等,还包括改变面部特征的能力免费(有收费Pro版)英伟达英伟达StyleGANStyleGANCVCVGoogleGoogleViTViTCVCVMurfMurf2020-10Murf否种子轮:Elevation Capital领投,获150万美元融资音频生成类:支持文本转语音、添加视频旁白、

32、幻灯片旁白、语音克隆,可用于Youtubers、播客、有声读物、游戏、产品和解说视频中免费(有收费基础版、专业版、企业版)A轮:Matrix Partners领投,获1000万美元融资基于基于transformetransformer rNLPNLPMemMem2021-06Mem Labs否A轮:22年11月获得OpenAI领投的2350万美元辅助决策类:AI驱动的办公记事应用,可以帮助用户快速记录和整理个人信息数据,并利用AI将这些数据连接成有意义的知识图谱免费(有收费个人版$8/月,企业版$15/月、定制版)Open AI为其投资方;为Twitter打造专属功能Mem itStabili

33、ty.aiStability.aiStableStable DiffDiffusion(usion(基于基于LatentLatent DiffDiffusionusionModelModels)s)多模态多模态Stability.Stability.aiai2022-08Stability.ai否种子轮:22年10月,由Coatue和Lightspeed领投,融资额1.01亿美金,估值10亿美元图像生成类:根据所需图像的文本描述,生成符合匹配该描述的高质量图像。免费(有收费Pro版)partner:Krikey.ai、亚马逊、GeeneeMidjourneyMidjourneyMidjourn

34、eyMidjourneyV5(V5(基于基于DiffusionDiffusion M Models)odels)多模态多模态MidjourneyMidjourney2022-03Midjourney否图像生成类:根据所需图像的文本描述,生成相对应的图片,可以选择不同画家的艺术风格,例如安迪华荷、达芬奇、达利和毕加索等,还能识别特定镜头或摄影术语。收费,基础版$10每月partner:MirrorX、Discard、NFT加州大学伯克加州大学伯克利分校、谷歌、利分校、谷歌、加州大学圣地加州大学圣地亚哥分校亚哥分校NeRFNeRF多模态多模态LumaLuma2021-09Luma AI否种子轮:2

35、021年10月,获得South Park Commons、Matrix Partners等投资,数额为430万美元A轮:23年3月,由Amplify Partners领投,NVIDIA(Nventures)等跟投,融资数额为2000万美元3D生成类:基于神经渲染技术,可以拍摄少量照片来生成、着色和渲染产品的逼真3D模型。按次收费,每个视频1美元,容量限制5GBAmplify Partners、General Catalyst投资RunwayRunwaygengen-2 2多模态多模态Runway AIRunway AI2023-03Runway否B轮:21年12月融资3500万美元C轮:22年

36、12月融资5000万美元视频生成类:允许用户从零开始生成视频,可以文生视频、文本+参考图像生视频、静态图片转视频gen-1免费,gen-2处于内测阶段,尚未开放使用参与开发Stable Diffusion模型13资料来源:公司官网,IT桔子、华安证券研究所整理图表图表7 7:海外热门应用的国内对标海外热门应用的国内对标2.2 国内主要应用:以文本生成、图像生成、音乐生成类为主国内主要应用:以文本生成、图像生成、音乐生成类为主模型所属模型所属公司公司模型名称模型名称模型类型模型类型软件所属公司融资情况软件所属公司融资情况应用软件应用软件应用上线应用上线时间时间应用描述应用描述商业模式商业模式战略

37、合作关系战略合作关系彩云科技彩云科技 文字模型“小梦文字模型“小梦V2”V2”NLPNLPA轮融资:2017年融资630万美元彩云小梦彩云小梦2021-2-1文本生成类:彩云小梦1.0主打功能是续写;彩云小梦2.0的新功能是对话,定位是一款AI聊天续写软件付费订阅制,非会员续写字数有限。会员价格为36元/季度,190元/年喜马拉雅:彩云小梦入驻喜马拉雅,其续写的小说故事将由喜马拉雅AI主播“喜小道”演播并发布在喜马拉雅平台必优科技必优科技BoleBole模型(全球首模型(全球首个中文人力资源模个中文人力资源模型)型)多模态多模态天使轮:2021年6月获得金山办公投资近千万人民币HRHR-Lin

38、kLink(全网首个(全网首个人力资源行业知识人力资源行业知识图谱)图谱)简历辅写与生成场景B端提供场景小模型能力,客户包括:金山办公、腾讯文档、实习僧、新浪等垂直场景C端应用采用会员订阅收费,用户200W+,均价百元人民币/年金山办公、腾讯文档为其客户金山办公为其投资人秘塔科技秘塔科技MetaLLMMetaLLM(基于基于TransfomerTransfomer自研)自研)LLMLLM大模型大模型天使轮:2018年获得思满科技、小豹AI音箱、猎豹移动数百万元Pre-A轮:2021年融资数千万元秘塔写作猫(秘塔写作猫(AIAI写写作辅助工具)作辅助工具)2020年文本生成类:有比较强大的纠正错

39、别字、语法错误等功能,可用于论文灵感、方案报告、作文、电商种草文、小说写作模板、广告语有免费版与付费版,付费版最低每月24元起,使用高级纠错创作算法模型,两种模型之间的性能有超过30%的差距猎豹移动为其投资人秘塔翻译(为法律秘塔翻译(为法律人训练的机器翻译人训练的机器翻译系统)系统)2019年文本生成类:主要用于法律、公文类翻译产品目前已在中国各大顶尖律师事务所、仲裁中心、数百家企业和其他法律相关机构中被使用。聆心智能聆心智能OPDOPD模型(采用模型(采用UniLM8UniLM8架构打造)架构打造)LLMLLM大模型大模型天使轮:2022年12月获得连星资本(领投)、智谱AI的投资数千万元P

40、re-A轮:2023年2月获得无限基金SEEFund投资AIAI乌托邦乌托邦2022年12月文本生成类:PC端、小程序,雏形阶段用户可选择与梅西、爱因斯坦、甄嬛等跨次元跨时空名人聊天,也可与程序员、心理咨询师等群体属性的角色交流,还可通过文字描述“捏出”自己想要的AI朋友即将推出商业化产品AI乌托邦pro,这一产品目前还在内测中已与一些游戏厂商和车厂落地深度合作项目,如与高端豪华电车品牌Beyonca合作,打造了新一代智能驾舱的贴心助手;基于知名IP合作,采用聆心智能的对话生成技术为品牌定制AI角色西湖心辰西湖心辰TextText-toto-ImageImage模型模型TextText-tot

41、o-ImageImage模型模型天使轮:2021年12月融资近千万美元Pre-A轮:23年3月获得百度风投(领投)等的投资数百万美元AIAI画图产品“造梦画图产品“造梦日记”日记”2022年8月图像生成类(现已开放视频生成功能内测):用户输入简单的描述词或上传参考图即可生成原创图片,可应用于绘画、动漫游戏、运营策划和电商等领域C端个人会员:按月付费(均价50/月)专属模型定制:按个数付费(均价20元/个)合作关系:浙江立同德医院、上海德济医院、杭州银行、中国电信等RIORIO语言大模型语言大模型LLMLLM大模型大模型HeyFriday”AIHeyFriday”AI智能智能写作产品写作产品20

42、23年1月文本生成类:为不同的写作场景开发和提供各种原创文本,包括产品描述、营销信息、各类主题文章和广告文案等主要为C端个人会员付费,共设3个付费套餐(每年188/388/1888元)RIORIO双模态图文模型双模态图文模型双模态双模态双模态对话系统双模态对话系统“心辰“心辰Chat”Chat”2023年2月文本生成+图片生成类:自助上网,与心辰Chat的对话中,用户除了能让它写作以外,还可以用它来生成图像心辰大模型心辰大模型多模态多模态研发中23年3月6日宣布开始研发首个可自助联网的多模态大模型“心辰大模型”退格数字退格数字TIAMATTIAMAT自研自研MorpherVLMMorpherV

43、LM多模态多模态天使轮:2022年10月融资数百万元A轮:2023年2月融资近千万美元小程序:小程序:TiamatAITiamatAI(AIAI绘画生成)绘画生成)2022文本生成图像,可为个人用户和企业客户提供创意生产、广告、数字藏品等场景形式下的服务现以toC为主,20%的用户群体是小B端的设计师,60%是泛设计行业人群已与知名科幻IP、央视网、时尚芭莎嘉人等时尚大刊建立合作,与头部游戏公司,特别是持有故宫文化相关IP的非遗文化IP机构知造局等开展了战略合作智谱华章智谱华章大规模中英文预训大规模中英文预训练语言模型练语言模型GLMGLM-130B130BLLMLLM战略投资:2019年8月

44、融资数千万元A轮:2021年9月获图灵创投等投资数亿人民币B轮:2022年9月获得君联资本和启明创投联合领投的数亿人民币聊天机器人聊天机器人XDAIXDAI和和ChatGLMChatGLM2022知识具象化的对话系统,支持中英双语问答免费,现有一定数量的政企客户2022年8月,智谱AI与清华大学KEG共同研发的大规模中英文预训练语言模型GLM-130B正式发布;目前联合开发预训练语言模型,参与悟道2.0研发。澜舟科技澜舟科技孟子系列大模型孟子系列大模型多模态多模态天使轮:2021年8月获创新工场投资Pre-A轮:2022年获联想创投等投资近亿元Pre-A轮:2023年3月获中关村科学城投资数亿

45、元AIGCAIGC智能创作平台智能创作平台 2022年12月包括文学辅助写作、营销文案协作、论文助写、文图生成(powered by stable diffusion)等功能主要以项目制合作方式提供底层技术能力接入客户现有产品业务流客户包括华为、中文在线、传神、数说旗下容徽、同花顺及华夏基金等目前已与华为云、传神语联网、中文在线等达成合作,并与北大、清华等10所高校进行产学研的合作机器翻译平台机器翻译平台2022年12月包括通用文本翻译和垂直领域翻译(针对财经金融、网络小说、法律合同等)生成式对话机器人生成式对话机器人MchatMchat2022年12月具备通用对话能力、小说续写能力、营销文案

46、生成、处理行业任务(如金融场景)澜舟金融澜舟金融NLPNLP平台平台2022年12月包括金融翻译、研报观点分析、实体抽取(从文本中识别公司实体)等DeepMusicDeepMusic自研自研AIGCAIGC音乐引擎音乐引擎“Mutrix”Mutrix”多模态多模态天使轮:2018年2月获清华控股投资A轮:2020年7月获完美世界投资A+轮:2023年4月获GGV纪源资本领投的近千万美金口袋乐队口袋乐队2022年1月 AI音乐工作站DeepMusic的音乐结构标准UMP已经被TME旗下全民K歌、QQ音乐多个场景应用BGMCATBGMCATAI音乐生成器,它可以快速生成BGM并对BGM进行智能化处

47、理LYRICALYRICAAI歌词生成器,通过关键字输入,可得到相关主题下的完整歌词,并对歌词进行智能化处理(如指定格式、定义韵脚、定义字数、逐句编辑)lazycomposerlazycomposerAI作曲软件国内自国内自20172017年以来,年以来,AIAI领域一级市场投资频繁,主要集中在特定领域的应用,如续写、法律公文翻译、简历生成、歌词生成、辅助领域一级市场投资频繁,主要集中在特定领域的应用,如续写、法律公文翻译、简历生成、歌词生成、辅助作曲、广告文案等作曲、广告文案等14目录1 大模型发展历程及发展现状:科技巨头引领行业,国内大厂布局较早,众多厂商结合自身优势积极布局2 海外及国内

48、的热门AI应用:国内自17年以来,一级市场AI+垂直赛道项目众多3 3 目前主流目前主流AIAI模型及应用解读:从文本生成辅助决策到视频生成模型及应用解读:从文本生成辅助决策到视频生成4 国内一级市场及二级市场公司在AI领域百花齐放,有所积累15资料来源:机器之心,CSDN,华安证券研究所整理3.1 文字生成及辅助决策类应用模型:从文字生成及辅助决策类应用模型:从RNN到到Transformer文字生成及辅助决策类应用:文字生成及辅助决策类应用:17年以前NLP领域中应用最为泛的模型是基于RNN架构的Seq2Seq模型,但RNN为序列模型,训练时间开销较大,且难以实现并行处理;2017.6谷歌

49、提出了Transformer模型,解决了RNN不能并行处理的问题,可以堆高模型参数,大大提高了训练和推理的速度。2020年5月,OpenAI发布GPT3,模型参数增大到了1750亿。GPT3在许多NLP数据集上都取得了很强的性能,包括翻译、问题回答以及一些需要即时推理或领域适应的任务RNN(循环神经网络)是NLP里最常用、最传统的深度学习模型。2017年之前,语言模型都是通过RNN、ISTM来建模,这样虽然可以学习上下文之间的关系,但是无法并行化,给模型的训练和推理带来了困难。2017.62018.102020.5RNN2017.6谷歌提出了Transformer模型。Transformer摆

50、脱了NLP任务对于RNN、ISTM的依赖,使用了self-attention的方式对上下文进行建模,大大提高了训练和推理的速度Transformer2018年底谷歌推出了BERT模型。作为一种基于Transformer encoder的双向编码预训练模型。BERT解决了之前Transformer模型无法直接学习到上下文信息的问题,提高了自然语言处理能力BERTGPT3TransformerGPT2适合生成任务BERT适合特征提取解码器编码器2019.6谷歌推出了XLNet模型。XLNet可以获得句子双向信息并可以学习token 之间的依赖关系,解决了BERT模型忽视mask单词间关系的问题。此

51、外XLNet使用了Transformer-XL,可以运用更广阔的上下文信息XLnet2019.6长句解决方案Transformer XLXlnet长句模型引入缺点改进图表图表8 8:辅助决策及文字生成类应用所使用模型发展图:辅助决策及文字生成类应用所使用模型发展图16资料来源:Copy AI,华安证券研究所整理图表图表9 9:Copy.aiCopy.ai的应用场景的应用场景1)文本生成类)文本生成类-Copy.ai(文本生成工具)文本生成工具)以营销文案为例,Copy.ai可以根据特定需求提供一站式解决方案Copy.ai是基于GPT3的文本生成工具,可应用于商业文章写作、营销文案、产品描述等场

52、景图表图表1111:Copy.aiCopy.ai的营销文案撰写演示的营销文案撰写演示生成文案生成文案1.选择营销模块博客内容输入产品/品牌名称输入产品描述选择语言风格资料来源:Copy AI,华安证券研究所整理线上营销文案电商广告文案营销文案社媒内容网页文案营销市场痛点营销市场痛点Copy.aiCopy.ai时间紧迫运用AI提升文案创作效率灵感缺失运用AI寻找营销灵感及思路文案缺乏亮点运用AI帮助进行头脑风暴外包费用高昂Pro版每月仅36美元图表图表1010:Copy.aiCopy.ai对营销市场痛点的对营销市场痛点的解决解决资料来源:Copy AI,华安证券研究所整理17资料来源:Notio

53、n AI,华安证券研究所整理2)文本生成类)文本生成类-Notion.AI(智能在线文档编辑工具)(智能在线文档编辑工具)功能:具有智能化的协作、搜索、分类和推荐功能,具体包括生成新内容、编辑现有内容、总结内容、翻译内容模型:基于GPT3应用场景:被广泛应用于知识管理、团队协作、个人笔记等领域。1.1.单击空白页面上的空格按钮单击空白页面上的空格按钮1)AI生成新内容2)AI续写3)AI总结图表图表1212:NotionNotion.ai.ai的使用说明的使用说明查找行动项目翻译解释该文本文本改善修改拼写与语法错误概括扩写更改语气简化语言让AI编辑头脑风暴博客文案提纲社媒文案发布会文稿创意故事

54、论文诗歌待办事项会议章程优缺点一览职位描述销售邮件扩写功能举例:扩写功能举例:2.2.选择功能选择功能1.1.输入文字输入文字2.2.选择“扩写”功能选择“扩写”功能3 3.输出内容输出内容18资料来源:智东西、CSDN,机器之心,华安证券研究所整理图表图表1313:图像生成类应用所用模型代际变化:图像生成类应用所用模型代际变化3.2 图像生成类应用:从图像生成类应用:从GAN到到diffusion model再到再到SAM类模型类模型 图像生成类应用:原本以CV领域中的GAN模型为主,现以多模态模型中的diffusion model为主(diffusion model解决了GAN模型效果不稳

55、定的问题);4月以来,SAM、SegGPT、Grounded-SAM模型接连诞生,可以识别图像和视频中的一切物体,CV领域或将迎来GPT-3时刻生成式对抗网络包括生成模型和判别模型。判别模型用于判断一张图片是不是真实的图片,生成模型用于创造一个看起来像真图片的图片,两个模型一起对抗训练,生成模型产生一张图片去欺骗判别模型,然后判别模型去判断这张图片是真是假,最终在这两个模型训练的过程中,两个模型的能力越来越强,最终达到稳态。GANGAN扩散模型在前向阶段对图像逐步施加噪声,直至图像被破坏变成高斯噪声,然后在逆向阶段学习从高斯噪声还原为原始图像和GAN相比,Diffusion Model只需要训

56、练生成模型,训练目标函数简单,而且不需要训练别的网络(判别模型等),所以可以实现更优的图像样本质量和更好的训练稳定性。diffusion modeldiffusion modelSegment Anything Model可以为任何图像或视频中的任何物体生成 mask,甚至包括在训练过程中没有遇到过的物体和图像类型(即具备零样本性能,初步验证了多模态技术路径及其泛化能力);此外,SAM开创性地与Prompt结合了起来,标志着自然语言处理的Prompt模式开始被应用在了计算机视觉领域。SAMSAMGrounded-SAM:可以通过文本描述就可以找到图片中的任意物体(检测一切),然后通过Segme

57、nt Anything强大的分割能力,细粒度的分割出mask(分割一切),最后还可以利用Stable Diffusion对分割出来的区域做可控的文图生成(生成一切)SegGPTSegGPTGroundedGrounded-SAMSAM2023.4.62023.4.62020202020142014可以通过上下文推理在图像或视频中执行任意的分割任务,与SAM的精细标注能力相比,SegGPT模型更偏重于批量化标注分割能力,无论是在图像还是视频环境,用户在画面上标注识别一类物体,即可批量化识别分割出其他所有同类物体19资料来源:Stability.ai,华安证券研究所整理图表图表1414:Drean

58、mDreanm StudioStudio使用界面使用界面1)图像生成类)图像生成类-Stable Diffusion(文生图文生图)+Stable Diffusion Reimagine(图生图图生图)Stable Diffusion和Stable Diffusion Reimagine都是Stability.ai创作的AI生成图像模型/工具。Stable Diffusion:是Stability AI公司开源的AI文生图扩散模型,通过DreamStudio的API将Stable Diffusion货币化。用户只用输入提示文本或者拼合的素材图+文本就可以获得完整的的设计图,可用于创造新颖和独特

59、的设计、辅助场景构图等。Stable Diffusion Reimagine:2023年3月17日,StabilityAI推出Stable Diffusion Reimagine,用图像编码器取代了原来的文本编码器,只要上传一张图片,就可以创作无数张外观相似、但细节和构图不同的图像,该功能目前由Clipdrop工具实现。输入描述图片的文字,包括但不限于主题色彩、风格等输入描述图片的文字,包括但不限于主题色彩、风格等输入原始图片输入原始图片根据原始图片生成的两张新图片根据原始图片生成的两张新图片图表图表1515:Stable Diffusion ReimagineStable Diffusion

60、 Reimagine使用界面使用界面资料来源:Stability.ai,华安证券研究所整理20资料来源:Midjourney,华安证券研究所整理图表图表16:16:与与Midjourney botMidjourney bot交互得到图片交互得到图片2)图像生成类)图像生成类-Midjourney(文生图文生图+图生文图生文)功能:Midjourney是一款图片生成应用,输入prompt即可生成图像。该产品搭载于该产品搭载于DiscordDiscord社区社区,用户可通过与机器人Midjourney bot进行对话式交互,并选择不同的主题、风格和分辨率,来生成图像作品,可广泛应用于游戏、影视等领

61、域;4月5日Midjourney是上线新功能“/describe”,可从图像中反推prompt,极大的节省了创作者学习prompt的时间、提升了图片输出的精准度。模型:2023年3月16日,Midjourney宣布推出V5模型,与前一代V4相比,V5拥有更多风格选择、更高分辨率、拥有刻画更丰富细节比如手部细节的能力、对Prompt指令的理解力更强。输入prompt即可生成图片图表图表17:17:MidjourneyMidjourney新功能新功能/describe/describe1)选择“/describe”或者直接在对话框中输入“describe”2)上传图像3)根据图像会产生4条prom

62、pt4)调整prompt即可输出风格类似的4张图片资料来源:Midjourney,华安证券研究所整理21资料来源:Runway,华安证券研究所整理图表图表1818:Runway GenRunway Gen-2 2功能演示功能演示3.3 视频生成类视频生成类-Runway Gen-2(文生视频、图生视频、文(文生视频、图生视频、文+图生成视频)图生成视频)功能:Runway是一款视频生成应用,其Gen-1版本功能为视频生视频,Gen-2版本功能包括文生视频、文本+参考图像生视频、静态图片转视频,该工具目前搭载于Discord社区。模型:23年2月公司推出模型Gen-1,通过提供初始视频、叠加文字

63、提示语或图片提示,生成新的视频;23年3月20日,首个多模态视频生成模型Gen-2诞生,相比Gen-1,Gen-2可实现从零开始自动创作短视频的功能,大幅缩短视频制作周期。应用领域:生成式AI视频有望在游戏、影视、营销等领域实现广泛应用1)输入文本prompt:在纽约市的一间阁楼里,傍晚的阳光透过窗户温柔地洒进屋内2)即可生成视频2)输入文本prompt:在一个低角度拍摄的画面中,男子正沿着街道行走,周围酒吧的霓虹灯照亮了他的身影3)即可生成视频文生视频文生视频1)输入图像:文文+图生视频图生视频2)即可生成视频1)输入图像:图生视频图生视频22资料来源:Luma,华安证券研究所整理功能:Lu

64、ma是一款3D内容方案平台,具有文生3D模型、图生3D、视频生3D等功能模型:基于NeRF(神经辐射场)模型,其原理是利用深度神经网络,从多个角度拍摄的图片中学习一个连续的三维场景表示,该表示可以用于合成任意视角下的新图片。Luma使用了NeRF的改进版本,可以在移动设备上实时运行,并提供了一些便捷功能,如自动对齐、背景消除、模型编辑等。3.4 3D生成类生成类-Luma(文生(文生3D、图生、图生3D、视频生、视频生3D)类似Midjourney,只需输入文字描述,即可生成对应的3D模型。例如输入:一只红绿配色的毛线狗文生文生3D3D1)输入视频:尽可能的全方位视频生视频生3D3D可在Lum

65、a网页上传图片压缩包,通常照片比视频质量更高,但需特定拍摄视角图图生生3D3D价格:按次收费,转换一个视频费用1美元,不管视频容量大小,转换时间在30分钟左右。2)输出3D:图表图表1919:LumaLuma功能演示功能演示23资料来源:Inworld AI,华安证券研究所整理3.4 3D生成类生成类-Inworld AI(AI生成生成NPC工具)工具)功能:Inworld AI是AI生成NPC工具,可以让开发者和玩家通过文字描述创建和定制虚拟世界中的人物角色模型:包括GPT-3、StyleGAN2、OpenAI Codex等20个不同的机器学习模型,负责角色个性的不同方面应用场景:游戏领域N

66、PC生成效率提升点:1)大幅降低NPC生产成本,降低游戏制作门槛:可赋能人物设定-2D手绘-3D建模-动画-配音的全过程2)提升游戏的沉浸感和社交性:接入LLM的NPC可以同玩家自由对话;围绕LLM搭建拟人技术课题使NPC具备推动剧情的能力核心描述基础信息设定个性、情绪背景知识选择音色、音速以及语调3 3.设定常识设定常识:用户可以定义所有角色都知道的世界观信息,或者定义只适用于特定角色群体的知识;这对角色保持基本的设定状态非常重要,合理的常识设置可以防止 AI NPC 脱离最初的设定,变得不受控制1 1.创建角色创建角色2 2.设定场景设定场景:描述角色所处的环境来提供故事背景。在写好场景描

67、述后,将相关的角色(1 个或多个)添加到场景之中。还可以添加场景触发器,为场景中可能发生的变化添加即时的背景,增加游戏体验的多变性。图表图表2020:Inworld AIInworld AI使用演示使用演示24资料来源:GitHub Copilot X,华安证券研究所整理3.5 代码生成类代码生成类-GitHub Copilot X(代码补全、代码建议、代码测试等功能)(代码补全、代码建议、代码测试等功能)功能:功能:GitHub Copilot X是微软与OpenAI共同推出的一款AI编程类开发工具,能够实现代码补全、代码建议、代码测试、代码重构、生成代码文档等功能模型:23年3月22日推出

68、的CopilotX基于GPT-4 模型,21年推出的GitHub Copilot基于OpenAI的Codex模型(GPT-3模型的低配版),帮助开发者提高了55%的开发速度。功能更新:功能更新:相比GitHub Copilot,CopilotX新增了聊天和语音功能等,具体包括:1)Copilot Chat聊天功能:集成与VS Code和Visual Studio的聊天界面,帮助分析代码、生成单元测试和修复bug2)Copilot Voice 语音功能:开发者通过口头指令进行自然语言陈述意图,Copilot Voice即可生成代码片段2 2)提出请求:请求帮忙找出)提出请求:请求帮忙找出bugb

69、ug1 1)输入原始代码)输入原始代码3 3)输出正确代码)输出正确代码4 4)点击此按钮可将错误)点击此按钮可将错误代码一键替换为正确代码代码一键替换为正确代码图表图表2121:GitHub Copilot X GitHub Copilot X 找找bugbug功能功能使用演示使用演示25目录1 大模型发展历程及发展现状:科技巨头引领行业,国内大厂布局较早,众多厂商结合自身优势积极布局2 海外及国内的热门AI应用:国内自17年以来,一级市场AI+垂直赛道项目众多3 目前主流AI模型及应用解读:从文本生成辅助决策到视频生成4 4 国内一级市场及二级市场公司在国内一级市场及二级市场公司在AIAI

70、领域百花齐放,有所积累领域百花齐放,有所积累26功能功能:把一个类似“游戏引擎”的交互式平台开放给开发者,让开发者在上面可以开发出各种3D渲染的虚拟元宇宙空间,可以让开发者在上面通过摆放角色,摆放场景物件,和加入实时交流功能,搭建出互动式的3D虚拟空间,最终可以用于会议,营销,电商,现场活动,及游戏等。用例:用例:公司的平台可以用户搭建以下的场景并提供实时互动的交互体验,包括在企业内部会议虚拟交互空间,市场营销广告巡展,线上购物商品展示及互动,和现场活动带来沉浸式体验。资料来源:Yahaha,华安证券研究所整理图表图表22:Yahaha功能演示功能演示4.1 Yahaha:元宇宙:元宇宙UGC

71、生产工具(搭建虚拟生产工具(搭建虚拟3D元宇宙空间及组件)元宇宙空间及组件)企业内部沟通企业内部沟通市场营销市场营销电商电商/购物购物现场活动27核心产品“混沌球”:采用强化学习的算法,可以通过算法自定义或生成剧情故事,故事的走向会随着玩家交互行为改变而发生变化。用例:通过输入文档和基本信息,提取出角色核心的要素,通过调整参数,进行强化学习,运算出在各种触发条件下可以生成的情节走向,最终生成有别于传统叙事方法的“基于混沌球式的交互式叙事(即包含多种结局,无限种剧情树)”。资料来源:RCT AI,华安证券研究所整理图表图表23:RCT AI功能演示功能演示4.2 RCT AI:为游戏开发提供人工

72、智能解决方案:为游戏开发提供人工智能解决方案输入文档和基本信息输入文档和基本信息传统叙事方法传统叙事方法调整参数和边界情况,运算出调整参数和边界情况,运算出各种各样的情节可能性各种各样的情节可能性基于混沌球的交互式叙事28秘塔写作猫采用自研的大规模概率语言模型,是中文秘塔写作猫采用自研的大规模概率语言模型,是中文AIAI生成文本内容的一项应用突破。生成文本内容的一项应用突破。发展历程:发展历程:2018 年 4 月,专门为法律从业者及其他文字工作者研发了包括翻译功能在内的各类 AI 办公工具;2020 年正式上线一款文书写作助手:秘塔写作猫,功能类似于中文 Grammarly 的 AI 软件,

73、可以自动进行文档纠错、文书改写、文字优化,适用于所有文字工作者如今在基于多年的 AI 研发经验基础上,进一步推出了对话写作猫,弥补了交互聊天的短板,除了日常对话、知识解答、算数之外,具备写小说、写影评、制定财务计划等数百种技能,采用秘塔科技自研的采用秘塔科技自研的 MetaLLM MetaLLM 大模型,这是一个超级大模型,有上亿的大模型,这是一个超级大模型,有上亿的参数,截至目前,对话写作猫训练花费不足参数,截至目前,对话写作猫训练花费不足1 1 亿美金。亿美金。模型特点:模型特点:注意力结构注意力结构:自研模型与GPT-3相比,优化了注意力结构,配合集成学习方法,降低对数据传输和GPU型号

74、的要求,降低训练和使用成本;语料库内容语料库内容:GPT-3是基于英文语料训练的模型,生成英文文本并适用英文语境;秘塔通过自研大模型训练,语料库来自全国各新闻网页或其他公开资料清洗后的高质量数据,使中文AI生成本文产品能够投入使用。产品功能:产品功能:文本校对、文章润色、AI辅助创作:根据标题或文本一键生成大纲、文章,能够自行纠错和改写,无限次数生成图表图表25 25:秘塔写作猫功能展示:秘塔写作猫功能展示4.3 秘塔写作猫:文档写作助手及交互聊天工具秘塔写作猫:文档写作助手及交互聊天工具资料来源:量子位,华安证券研究所图表图表2424:秘塔写作猫与其他大厂:秘塔写作猫与其他大厂AIAI写作功

75、能对比写作功能对比产品/公司功能收费情况是否支持中文秘塔写作猫根据标题/文本一键生成大纲和文章,可自主修改;多种键盘快捷指令;10种写作模板;其他功能:改写纠错可免费体验AI写作;每月24元档(5000字/月);每月48元档(20000字/月)是百度文心7种形式:写作文、写摘要、自由问答、对对联、写小说、补全文本、自定义;可选文本长度-是阿里达摩院小说续写、专业文稿、诗词生成、菜谱生成等-是Jasper博文、广告、文章、邮件等50+细分模板;支持25种语言;快捷指令等每月40+美元档(2万英文,不支持修改/指令,仅支持短文案);每月82美元档(所有功能支持)是NotionAI输入标题或指令生成

76、指定类型文本,如博客、新闻稿、微博等-否2920192019年与阅文集团合作的年与阅文集团合作的3030部部AIAI翻译网文作品,上线阅文旗下海外门户起点国际;翻译网文作品,上线阅文旗下海外门户起点国际;20222022年年AIAI续写应用彩云小梦入驻喜马拉雅,由其续写应用彩云小梦入驻喜马拉雅,由其AIAI续续写的小说故事由喜马拉雅写的小说故事由喜马拉雅AIAI主播“喜小道”演播并发布。主播“喜小道”演播并发布。模型原理模型原理:彩云小梦2.0基于大规模语言模型的自然语言处理模型,进行各种类型文本创作;用 NLP 技术驱动对话场景,情节续写的基础上实现用户与虚拟人物对话,提供互动和情感陪伴;模

77、型功能模型功能:AI文字聊天、AI语音通话、AI剧情文本续写。应用领域包括文本营销领域、剧情写作领域、文本交互游戏领域模型效果模型效果:经过测试,对比1.0版本及其他开源模型。创新得分/逻辑得分/通顺得分为43.889/52.778/64.444,均为最高产品定价产品定价:会员单价为2525元/月,按季售价36元,续费方式灵活;相比非会员,会员服务增加了续写字数上限(100K字/月)、语音通话时长400分钟/月和海量文本对话消息数。“字数加量包”能够增加续写字数,50K/100K/1000K字分别售价30/50/298元图表图表2727:模型效果对比图:模型效果对比图创新创新逻辑逻辑通顺通顺模

78、型模型28.88943.33357.222 某开源100亿参数模型41.11147.22261.667 某开源1000亿+参数模型43.88952.77864.444 彩云小梦V2模型图表图表2626:产品功能图:产品功能图-AIAI写作及写作及AIAI聊天聊天4.4 彩云小梦:彩云小梦:AI文本及语音工具,与阅文及喜马拉雅合作文本及语音工具,与阅文及喜马拉雅合作资料来源:彩云小梦官网,华安证券研究所资料来源:彩云小梦微信公众号,华安证券研究所图表图表28 28:彩云小梦续写界面:彩云小梦续写界面资料来源:彩云小梦官网,华安证券研究所30发展历程发展历程:2021年成立,2023年2月完成近千

79、万美元融资,孵化自中科院上海科技大学的AI绘画工具,可以实现AI生成图像(Text-to-image),支持中文输入、创意生产、广告设计、手办设计等。与搭建在Discord上的Midjourney类似,TIAMAT也强调社区。应用原理应用原理:采用自研大模型MorpherVLM,通过异构的视觉编码-解码网络结构,引入基于用户反馈的强化学习(RLHF)和细粒度的提示-隐变量对齐技术,提高模型对图像多尺度信息的建模能力,更好地理解用户Prompt目前模型参数1010亿左右亿左右使用领域使用领域:服装领域、广告领域、动漫领域、游戏领域、知名IP、时尚领域等体验效果:人工体验效果:人工 VS Tiam

80、atVS Tiamat用时:人工绘画23天/张,Tiamat分快速模式与慢速模式,快速模式下1分钟可出4张图;费用:根据绘画要求、难易程度和绘画者能力,费用为几百到上千元/张不等,一般1500元。按照入门套餐,Tiamat绘画单价为0.58元/张;变现方式变现方式:正处于内测阶段,获得邀请码的用户有20次免费生成图片的限额,超出部分需订阅,价格在58338元不等。22H1,月度新增活跃用户数已逾数万人,1/3的用户有付费意愿;Tiamat已获得数百万合同订单,与知名科幻IP、央视网、时尚芭莎等媒体或刊物建立合作,与持故宫文化IP的文化机构知造局开展战略合作4.5 TiamatAI:AI绘画工具

81、,可用于广告设计、手办设计等绘画工具,可用于广告设计、手办设计等图表图表2929:Tiamat2022Tiamat2022年生成图片示例年生成图片示例图表图表3030:Tiamat2023Tiamat2023年生成图片示例年生成图片示例资料来源:Tiamat官网,华安证券研究所资料来源:Tiamat官网,华安证券研究所多模型训练及图像生成,由蓝振忠博士带领的西湖大学深度学习实验室和西多模型训练及图像生成,由蓝振忠博士带领的西湖大学深度学习实验室和西湖心辰科技有限公司共同推出,蓝振忠此前曾在谷歌担任研究科学家,也是湖心辰科技有限公司共同推出,蓝振忠此前曾在谷歌担任研究科学家,也是轻量化大模型轻量

82、化大模型ALBERTALBERT的第一作者。的第一作者。软件功能软件功能:创意绘画,模型定制,姿势识别,轮廓检测,线稿上色,AI鉴图,创意社区,创意生成器。使用模型使用模型:在Stable Diffusion的基础上加以改进,形成由多个部分和模型一起构成的系统。效果提升效果提升:大幅提高绘画效率,减少作画时间与用人成本。原本需要20+小时完成的图片仅需2秒即可用AI生成。接入Diffusion方法后,AI Art的生成速度被大幅提高,原本需要20+小时完成的图片仅需2秒即可用AI生成。图片生成的速度是决定是否能够留住用户的关键,一旦用户在图片生成的过程中切出,再次切回应用页面的可能性就会降低,

83、可能造成用户流失。应用领域应用领域:绘画、平面设计、广告、游戏、心理咨询等。4.6 造梦日记:造梦日记:AI绘画工具,可用于绘画、设计、动漫游戏等绘画工具,可用于绘画、设计、动漫游戏等服务类服务类型型收费标准收费标准出图速出图速度度普通单张12元/150造梦星,28元/600造梦星,88元/2500造梦星平均3秒/张模型定制(每个模型赠送100张免费出图额度)首单非首单19.9元/1个64.9元/5个119.9元/10个69元/1个255元/5个408元/10个会员1个月3个月12个月平均0.8秒/张50元送600星128元送2000星388元送8000星人工头像插画漫画/动画关键帧海报宣传图

84、风景/场景画公众号/微博/网站配图1-100+小时不等根据个人能力及图片完成度决定私稿100-600元/张300-5000元/张200-500/页1000-2000元/张200-8000元300-1000元/张商稿版权的报价一般是使用权报价的3-5倍图表图表3232:造梦日记服务类型和收费:造梦日记服务类型和收费资料来源:公司官网、华安证券研究所整理图表图表3131:造梦日记使用界面:造梦日记使用界面32资料来源:各公司互动平台,华安证券研究所整理4.7.1 上市公司上市公司AI领域布局:领域布局:AI+内容创作内容创作AIGCAIGC应用:目前内容创作、游戏、影视、电商、营销为较早应用应用:

85、目前内容创作、游戏、影视、电商、营销为较早应用AIAI的领域,可利用的领域,可利用AIAI技术赋能文字、图片、视频内容的创作。技术赋能文字、图片、视频内容的创作。1.AI+1.AI+内容创作应用具体包括:内容创作应用具体包括:1 1)文生文)文生文2 2)生成图像及视频(文生图、图生图、文生视频、图生视频):)生成图像及视频(文生图、图生图、文生视频、图生视频):一键生成图片、人机共创画作、静态照片生产三维体积视频等;3 3)文字配图:)文字配图:通过AI智能搜索为新闻稿件、创意文案、新媒体推文、教师课件等内容高效配图;4 4)其他:)其他:包括生成音乐、音频、代码等领域。建议关注:中文在线、

86、昆仑万维、万兴科技、浙文互联、神州泰岳、利欧股份、视觉中国、当虹科技。建议关注:中文在线、昆仑万维、万兴科技、浙文互联、神州泰岳、利欧股份、视觉中国、当虹科技。公司名称公司名称股票代码股票代码日期日期公司业务对公司业务对AIGCAIGC技术的应用技术的应用是否接入是否接入ChatGPTChatGPT/GPTGPT是否接是否接入文心入文心一言一言其他模型其他模型中文在线300364.SZ3月8日公司目前已上线3款AIGC产品,分别为AI主播、AI绘画和AI文字创作产品;澜舟科技自研的类ChatGPT大语言模型公司基于澜舟科技自研的类ChatGPT大语言模型,并以公司海量正版内容为数据和生态支撑,

87、探索AIGC技术在文学创作领域的应用,包括AIGC辅助创作、文本自动生成等3月24日 公司海外产品Chapters和My Escape已在做接入ChatGPT测试,应用在故事创作生成、剧本生成及改编、用户与AI交互聊天等方面3月29日 海外公司已申请GPT4的API接口4月10日 国内多家模型公司就采购公司中文数据正在合作磋商昆仑万维300418.SZ2月9日 公司宣布与奇点智源就ChatGPT、图像视频生成等技术达成战略合作,启动ChatGPT的联合开发,将在今年内发布中国版类ChatGPT代码开源2月24日公司AIGC产品包括天工巧绘、天工乐府、天工妙笔、天工智码,布局AI生成图像、音乐、

88、文本及代码领域;公司Opera浏览器已接入ChatGPT4月10日 公司将全力推进“昆仑天工”系列模型的研发与迭代升级,即将推出对标ChatGPT的双千亿级大语言模型“天工”3.5,并定于4月17日启动邀请测试万兴科技300624.SZ2月13日 公司旗下海外视频创意软件Wondershare Filmora接入OpenAI,用户在创作视频时,可自由调用OpenAI的AI绘图功能,一键即可生成图片素材2月14日公司旗下万兴爱画推出“AI简笔画”新功能,成为全球首款交互型“图生图”AI绘画软件,支持AI文字绘画、AI以图绘图、AI简笔画三种模式,用户只需简单描摹几笔,“人机共创”5秒内便可绘出一

89、幅高品质画作3月11日 公司已有商用账号开通GPT4的API接口;浙文互联600986.SH 3月20日公司旗下元宇宙艺术创作社区米塔数字艺术利用Stable Diffusion模型支持AI绘画和手动绘画两种模式;公司自主研发并孵化“君若锦”“兰 Lan”两位虚拟形象,为东风风光mini定制的虚拟人“可甜”已交付使用Diffusion神州泰岳300002.SZ2月14日子公司鼎富智能已在语言理解、语音合成、语音识别等方向应用Transformer自研的预训练语言模型公司在NLP领域积累了较为深厚的技术,已研发出语音机器人、文本机器人等产品3月4日 公司的文本机器人、语音机器人等能够结合上下文信

90、息,理解用户意图,进行多轮问3月28日 AI领域公司拥有的关键技术包括预训练语言模型、数据增强、算法的运用、语音合成等利欧股份002131.SZ 3月22日公司在集团内网搭建AI平台,自己做原生模型,采用Diffusion开源的底层大模型,在此基础上架构Lora模型,并对模型进行训练实现定制和效果微调,生成更符合设计师要求、品牌调性的内容。目前产品奇思妙想(奇思为文字生成产品,妙想为图片生成产品)已在测试阶段Diffusion视觉中国000681.SZ 3月23日公司旗下VCG.com网站推出首个AIGC应用产品AI智能搜索(Beta版),使用多模态、自然语言理解以及知识图谱等人工智能技术,可

91、为新闻稿件、创意文案、新媒体推文、教师课件等内容高效配图当虹科技688039.SH 3月30日公司与咪咕视频发布跨模态AIGC产品,能以静态照片生产三维体积视频,并在不同模态之间相互切换。体积视频可以让用户在任何位置、任何方向自由地观看,可应用于体育赛事、大型综艺6DOF直点播以及出行元宇宙等场景网达软件603189.SH2月3日网达视频实时智能云剪系统,可以边直播、边录制、边剪辑,具有集锦自动制作、智能封面提取、热点视频自动制作、图集快速制作、智能字幕剪辑等功能,在重大赛事中取得了非常良好的应用效果2月16日公司可对媒资内容进行视频结构化分析,实现自动打点、自动标注、自动快剪、自动人物集锦等

92、功能,以减少了人工标注的工作量;实现了智能场景分析,智能抽图截图,智能实现情节分段,完成媒资的智能编目工作图表图表3333:AI+AI+内容创作领域上市公司布局内容创作领域上市公司布局334.7.2 上市公司上市公司AI领域布局:领域布局:AI+游戏游戏AIGCAIGC应用:目前内容创作、游戏、影视、电商、营销为较早应用应用:目前内容创作、游戏、影视、电商、营销为较早应用AIAI的领域,可利用的领域,可利用AIAI技术赋能文字、图片、视频内容的创作。技术赋能文字、图片、视频内容的创作。2.AI+2.AI+游戏主要应用在:游戏主要应用在:1 1)赋能)赋能PGCPGC,降低生产成本、提升游戏研发

93、效率:,降低生产成本、提升游戏研发效率:AI赋能剧情生成及动画生成系统、语音互动、美术创作(图片生成、游戏NPC生成、原画设计等)、玩法设计等环节;2 2)赋能)赋能UGCUGC,提升内容丰富度:,提升内容丰富度:AI赋能玩法、地图、身份技能、皮肤等UGC创作;3 3)赋能运营环节:)赋能运营环节:包括投放买量、游戏营销、社区运营(AI自动生成攻略、头像、表情包等)、智能游戏主播等等运营环节。建议关注:三七互娱、吉比特、汤姆猫、凯撒文化、电魂网络、巨人网络、盛天网络。建议关注:三七互娱、吉比特、汤姆猫、凯撒文化、电魂网络、巨人网络、盛天网络。公司名称公司名称股票代码股票代码日期日期公司业务对公

94、司业务对AIGCAIGC技术的应用技术的应用是否接入是否接入ChatGPTChatGPT/GPT/GPT是否接入是否接入文心一言文心一言其他模型其他模型汤姆猫300459.SZ3月1日公司已尝试应用ChatGPT模型进行AI语音互动产品功能原型测试,并已将汤姆猫IP形象植入产品功能原型当中,加入语音识别、语音合成、性格设定、内容过滤等功能Diffusion3月23日 公司海外美术团队已在局部美术创作中使用Stable Diffusion进行美术创作凯撒文化002425.SZ3月1日 公司在AI视频图像和深度学习等领域和上海交大合作,积极攻关研发剧情动画生成系统3月6日 代号“动物星球”游戏项目

95、会用到AI相关技术电魂网络603258.SH 3月10日 目前公司已在部分在研游戏的研发过程中应用AI图片生成及AI对战博弈等AI技术巨人网络002558.SZ2月21日公司将接入百度人工智能新产品“文心一言”,运用到游戏营销、游戏NPC以及游戏原画设计等游戏业务应用中3月21日公司旗下品牌“脑白金”正式推出老头老太首个数字人形象,并与集团内的征途IP达成战略合作,相关数字化资产将在原始征途的数字化营销领域开展应用。3月24日公司旗下太空行动与百度文心一言联合推出首个国产AI生成的手游形象“太空鲨”,用户进入百度“涂鸦一格”微信小程序,通过自定义关键词可以为其设计专属形象;太空行动将进一步依托

96、百度AI技术赋能玩法、身份技能、皮肤等多元化UGC创作3月28日已经在积极推动相关工具在游戏NPC、原画设计、玩法设计、游戏营销等业务场景的应用,未来将继续加大“游戏+AI”的投入盛天网络300494.SZ3月5日盛天网络打造了通过声音社交的平台“带带电竞”,通过声音鉴别技术分析用户音色、性别、年龄,结合用户兴趣、行为标签构建用户多维画像,进行深度学习和协调精准过滤等十几种算法结合智能推荐给用户精准内容服务和社交匹配用户图表图表3434:AI+AI+游戏领域上市公司布局游戏领域上市公司布局资料来源:各公司互动平台,华安证券研究所整理344.7.3 上市公司上市公司AI领域布局:领域布局:AI+

97、视频视频AIGCAIGC应用:目前内容创作、游戏、影视、电商、营销为较早应用应用:目前内容创作、游戏、影视、电商、营销为较早应用AIAI的领域,可利用的领域,可利用AIAI技术赋能文字、图片、视频内容的创作。技术赋能文字、图片、视频内容的创作。3.AI+3.AI+视频领域应用包括:视频领域应用包括:1 1)内容制作:)内容制作:影视剧本创作、AI换脸及换声、场景及分镜制作、数字人模拟虚拟角色、预告片剪辑、特效处理、配乐等2 2)内容宣发与运营:)内容宣发与运营:AI海报制作、渠道运营、内容宣发等3 3)IPIP版权库:版权库:影视公司手握充足IP版权,AI降低内容创作门槛的背景下,IP版权价值

98、有望迎来价值重估建议关注:华策影视、光线传媒、上海电影、奥飞娱乐。建议关注:华策影视、光线传媒、上海电影、奥飞娱乐。公司名称公司名称 股票代码股票代码日期日期公司业务对公司业务对AIGCAIGC技术的应用技术的应用是否接入是否接入ChatGPTChatGPT/GPT/GPT是否接入是否接入文心一言文心一言其他模型其他模型华策影视 300133.SZ2月11日公司设立科技数字增长中心,推进正版影视素材库、版权系统建设与升级、数字资产管理系统等的建设;公司已开通了ChatGPT的使用权限2月15日宣布成为百度“文心一言”首批生态合作伙伴,文心一言将在影视生产全链路中协助进行内容制作、内容宣发等,优

99、化中后台工作等4月3日公司已全面接入百度文心一言,将充分利用 AIGC技术提升影视行业全管线效率,包括影视剧本创作、AI 换脸及换声、场景及分镜制作、数字人模拟虚拟角色、预告片剪辑、特效处理、AI 海报制作等未来将构建中国最大的影视素材版权运营平台,已打造完整的版权运营管理平台,正版视频素材版权库“华策元视界”已拥有574个在存IP,包括33部电影、34部网络电影、248部电视剧,版权数量合计约3万小时;在版权管理上建立了可确权可持续售卖的资产管理系统光线传媒 300251.SZ3月20日公司已在内部部署对AI技术的探索式实践,已参与百度文心一言的测试;海外动画制作团队已在摸索ChatGPT在

100、业务上的应用Diffusion3月22日光线传媒官宣将推出动画电影去你的岛,并放出首张海报。去你的岛的制作将有大量AI技术深度参与,仅影片的首张宣传海报,就用到了图片生成AI工具Midjourney、Stable Diffusion以及最新发行的GPT-4模型,辅以人类设计师给出的设计理念和关键词生成上海电影 601595.SH3月7日上海电影拟收购上影元文化51%股权,上影元文化具有众多IP:包括上美影的大闹天宫葫芦兄弟黑猫警长的独占许可以及中国奇谭小蝌蚪找妈妈等普通许可,还有上影集团的庐山恋阿Q正传的独占许可4月11日上海电影集团有精品内容、大IP开发、数字化转型三大核心战略。转型方面,A

101、I绘画等对原创IP的开发有着推进作用,公司正积极推进类似AI、ChatGPT新技术和公司战略间的融合。奥飞娱乐 002292.SZ2月27日公司把“超级飞侠”“巴啦啦小魔仙”等知名IP形象打造为虚拟偶像,应用场景包括客串电视台晚会嘉宾、驻场线下活动参与互动、线上参与带货助播等计划在今年推出“飓风战魂:剑旋陀螺”下半部、“超级飞侠”第十四季和第十五季、“喜羊羊与灰太狼”系列剧集及全新恐龙IP动画片等;“超级飞侠”首部大电影及“贝肯熊3”等动画电影计划在今年内上映3月26日 公司参股光年无限,其产品为AI对话机器人产品,开发者可自行快速接入并创建个性化机器人资料来源:各公司互动平台,华安证券研究所

102、整理图表图表3535:AI+AI+视频领域上市公司布局视频领域上市公司布局354.7.4 上市公司上市公司AI领域布局:领域布局:AI+电商电商AIGCAIGC应用:目前内容创作、游戏、影视、电商、营销为较早应用应用:目前内容创作、游戏、影视、电商、营销为较早应用AIAI的领域,可利用的领域,可利用AIAI技术赋能文字、图片、视频内容的创作。技术赋能文字、图片、视频内容的创作。4.AI+4.AI+电商主要应用在:电商主要应用在:1 1)导购类:)导购类:类比Shopify,采用AI聊天对话模式为用户提供导购服务、精准推荐、人工智能选品;2 2)工具类:)工具类:包括自动生成商品文本描述及智能客

103、服;3 3)营销类:)营销类:图文和视频广告素材制作、广告语智能输出、广告智能投放及搜索引擎优化等业务。建议关注:返利科技、焦点科技、吉宏股份、联络互动、华凯易佰、值得买。建议关注:返利科技、焦点科技、吉宏股份、联络互动、华凯易佰、值得买。公司名称公司名称股票代码股票代码日期日期公司业务对公司业务对AIGCAIGC技术的应用技术的应用是否接入是否接入ChatGPTChatGPT/GPT/GPT是否接入是否接入文心一言文心一言其他模型其他模型返利科技600228.SH2月10日ChatGPT等新人工智能技术方案的部署在内测中,功能包括:精准推荐、自动比价、智能问答和交互式导购(7*24小时的在线

104、客服服务)等3月21日 公司与OpenAI的接口已升级至GPT 4.0版本,并组织技术团队进行导购领域的产品开发3月20日推出基于ChatGPT的电商导购APP“如意”,采用AI聊天对话模式为用户提供导购服务,尚未正式上线焦点科技002315.SZ3月24日 公司研发端已接入ChatGPT,运用于商品文本描述自动生成、智能客服等业务方向4月4日公司研发端目前接入的是CHATGPT 3.5Turbo,GPT4正在接入审核中吉宏股份002803.SZ3月17日公司23年1月接入ChatGPT的API接口赋能跨境电商业务,功能包括人工智能选品、图文和视频广告素材制作/广告语智能输出、广告智能投放、智

105、能客服回复等3月28日 公司已申请接入openAI的plugin联络互动002280.SZ3月31日子公司Newegg已接入OpenAI Api接口,用于PC Builder购物工具、优化Newegg网站的文本内容、智能客服、搜索引擎优化等业务中,目前处于测试运营阶段光云科技688365.SH3月20日公司旗下客服机器人快麦小智是针对全类目电商,基于自然语言处理和个性化推荐技术所搭建的电商智能客服产品华凯易佰300592.SZ3月27日公司自主研发的智能应用系统有效提升了公司核心业务环节的运营效率和单位人效,包括调价、刊登、推广、备货四个环节值得买300785.SZ2月8日公司具有基于机器学习

106、的AI推荐系统,包括根据用户画像提供个性化的推荐信息、根据特定文章提供推荐文章和商品信息、根据特定商品提供相似产品推荐和文章信息2月15日公司已建立包含大量商品内容和用户行为的大数据库及用于千人千面推荐算法的精准用户画像,自2017年公司就尝试通过算法和机器的方式生产内容,并称为MGC(Machine-Generated Content),2021年MGC占比为18.97%资料来源:各公司互动平台,华安证券研究所整理图表图表3636:AI+AI+电商领域上市公司布局电商领域上市公司布局364.7.5 上市公司上市公司AI领域布局:领域布局:AI+营销营销AIGCAIGC应用:目前内容创作、游戏

107、、影视、电商、营销为较早应用应用:目前内容创作、游戏、影视、电商、营销为较早应用AIAI的领域,可利用的领域,可利用AIAI技术赋能文字、图片、视频内容的创作。技术赋能文字、图片、视频内容的创作。5.AI+5.AI+营销领域应用包括:营销领域应用包括:1 1)赋能内容及创意生成(文生文)赋能内容及创意生成(文生文/文生图):文生图):通过文本对话模式完成策划案撰写、品牌slogan批量输出、模板海报生成等工作2 2)赋能策略生成:)赋能策略生成:AI赋能行业分析、投放策略等建议关注:易点天下、蓝色光标、风语筑、天地在线。建议关注:易点天下、蓝色光标、风语筑、天地在线。公司名称公司名称股票代码股

108、票代码日期日期公司业务对公司业务对AIGCAIGC技术的应用技术的应用是否接入是否接入ChatGPTChatGPT/GPT/GPT是否接入是否接入文心一言文心一言其他模型其他模型易点天下 301171.SZ3月23日公司基于AI能力的CyberCreative创意平台实现了多项前沿技术的商业化测试,包括视频人脸融合、多图视频生成、文本+绿幕生成多语种视频、单文本生成数字人多语种视频等3月27日公司已接入文心一言和CHATGPT,GPT4正在等待接入;公司配备了专业的团队针对ChatGPT的语料输出,进行二次训练,与广告业务场景相结合蓝色光标 300058.SZ2月21日销博特公测“萧助理”移动

109、端Beta版本,将聊天机器人程序与销博特AIGC输出能力结合,通过文本对话模式,用户可完成策划案撰写、品牌slogan批量输出、模板海报生成等工作申请中3月9日公司旗下蓝标传媒宣布与Microsoft广告达成战略合作,成为中国区官方代理商3月16日 蓝标已在申请接入GPT-4;公司作为微软的ISV(独立软件开发商)后,会跟微软产出联合解决方案风语筑603466.SH2月14日 正在尝试将公司打造的数字人接入ChatGPT以强化数字虚拟人的场景识别和更新能力3月16日已与百度签署战略合作协议共同探索并推进AIGC在文字、图片、音视频以及虚拟人、虚拟空间模型生成等3D内容场景的模型训练、落地应用和

110、模型优化;公司基于文心大模型ERNIE和Stable Diffusion打造击鼓舞狮的AI交互体验天地在线 002995.SZ2月7日公司参股的虚拟技术提供商世优科技已将ChatGPT技术接入数字人产品当中,正在通过数字人自身的人设背景等相关数据集,基于OpenAI形成数字人专有大脑形成人性化模型。2月23日旗下子公司启元天地自主研发的元宇宙虚拟数字商业综合体“无限盒子”APP正式上线,是一款支持pc、vr、app、web等全终端接入使用产品,并具备AI序列化生成3d城市建筑、优化渲染技术,可快速并轻量化生成客户元宇宙空间场景3月16日公司技术团队已掌握包括建模、驱动和渲染等多项核心技术,硬件

111、设施方面已配备了白/绿箱数字影棚、广播级演播室系统,光学&惯性动作捕捉设备等专业级软硬件设施,在虚拟数字人和虚拟内容打造方面已形成了一套较为完善的技术操作流程和服务体系。3月22日公司目已在内部尝试将ChatGPT与自身广告业务场景做结合,辅助广告创意、营销内容创作、营销方案生成等;公司正在持续关注品牌营销、数字人、数字资产创造等方面与ChatGPT等模型的整合应用3月29日已在内部尝试应用GPT-3.5模型,辅助业务团队完成在行业分析、投放策略、广告素材创意等环节的工作资料来源:各公司互动平台,华安证券研究所整理图表图表3737:AI+AI+营销领域上市公司布局营销领域上市公司布局374.7

112、.6 上市公司上市公司AI领域布局:其他(如数字人、领域布局:其他(如数字人、AI内容检测等)内容检测等)AIGCAIGC应用:目前游戏、创作、电商、营销为较早应用应用:目前游戏、创作、电商、营销为较早应用AIAI的领域,可利用的领域,可利用AIAI技术赋能文字、图片、视频内容的创作。技术赋能文字、图片、视频内容的创作。6.6.其他其他AIAI应用包括:数字人(用于直播、主持、代言等)、应用包括:数字人(用于直播、主持、代言等)、AIAI内容检测等。内容检测等。建议关注:天娱数科、捷成股份、遥望科技、新华网、博瑞传播、人民网。建议关注:天娱数科、捷成股份、遥望科技、新华网、博瑞传播、人民网。资

113、料来源:各公司互动平台,华安证券研究所整理图表图表3838:数字人、:数字人、AIAI内容检测上市公司布局内容检测上市公司布局类型类型公司名称公司名称股票代码股票代码日期日期公司业务对公司业务对AIGCAIGC技术的应用技术的应用是否接入是否接入ChatGPT/GPTChatGPT/GPT是否接入是否接入文心一言文心一言其他模型其他模型数字人天娱数科002354.SZ3月1日公司接入ChatGPT,并结合自研多模态智能算法,完成了AIGC互动直播功能的落地3月8日公司虚拟数字人已接入ChatGPT模型,GPT-4的正式接入正在申请中;目前公司采用的算法包括但不限于人脸拟合动态背景生成、表情驱动

114、、TTS等捷成股份300182.SZ2月1日参股子公司世优科技数字人已接入chatGPT,正在通过数字人自身的数据集训练数字人专有大脑形成个性化模型2月14日世优科技数字人“阿央”已接入正在开发的ChatGPT微信小程序世优数字人元宇宙,接入ChatGPT后的数字人将进行实时内容解答,未来计划重点尝试在智能客服、电商、虚拟主播等领域拓展业务3月8日公司作为新媒体影视版权运营商,正尝试将公司IP角色引入世优科技的虚拟技术中;世优科技的数字人已接入chatGPT并进行训练,未来拟应用于线下展厅的AI讲解介绍数字人、线上AI主播、AIGC快速短视频系统等遥望科技002291.SZ4月3日公司在数字虚

115、拟人IP、数字化场景构建等方向上有规划与布局,公司数字虚拟人孔襄是目前市场承接广告代言最多的数字虚拟人之一;为提升直播业务中用户的沉浸式体验,公司直播中使用了较多的虚拟数字场景新华网603888.SH3月10日公司旗下新华智云发布元卯“极速数字人API”,在媒体、文旅、会议会展、金融等领域都有广泛应用,例如数字主播、文化IP、代言人IP、游客数字分身等博瑞传播600880.SH2月24日公司参股的成都每经传媒有限公司旗下的虚拟主播是与微软小冰合作的,目前已实现AI写稿、信息抓取生成稿件及虚拟主播报播的功能。每日经济新闻已作为文心一言首批合作伙伴3月23日公司参股的成都每经传媒有限公司通过与红棉小冰公司合作了包括AI电视、“虚拟主播”等项目,推出了应用数字孪生技术的虚拟主持人N小黑和N小白,并于2021年12月上线了7x24小时不间断播出的每经AI电视。AI内容检测人民网603000.SH3月1日国内首个AI生成内容检测工具AIGC-X开始公测,可快速区分机器生成文本与人工生成文本,从而检测出AI技术生成的假新闻、内容抄袭、垃圾邮件,在内容版权、网络钓鱼、虚假信息和学术造假检测等内容安全、内容风控方面有广阔的应用前景。未来,AIGC-X还会扩展为对人工智能生成文本、图像乃至视频的通用智能识别模型

友情提示

1、下载报告失败解决办法
2、PDF文件下载后,可能会被浏览器默认打开,此种情况可以点击浏览器菜单,保存网页到桌面,就可以正常下载了。
3、本站不支持迅雷下载,请使用电脑自带的IE浏览器,或者360浏览器、谷歌浏览器下载即可。
4、本站报告下载后的文档和图纸-无水印,预览文档经过压缩,下载后原文更清晰。

本文(2023年AI大模型行业发展现状及目前主流AI模型与其应用解读报告.pdf)为本站 (2200) 主动上传,三个皮匠报告文库仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。 若此文所含内容侵犯了您的版权或隐私,请立即通知三个皮匠报告文库(点击联系客服),我们立即给予删除!

温馨提示:如果因为网速或其他原因下载失败请重新下载,重复下载不扣分。
会员购买
小程序

小程序

客服

专属顾问

商务合作

机构入驻、侵权投诉、商务合作

服务号

三个皮匠报告官方公众号

回到顶部