您的当前位置：上海品茶 > 报告分类 > PDF报告下载

报告预览

计算机行业AIGC系列之六：百度文心一个符合预期的起点-230317（16页）.pdf

编号：118935

PDF 16页 1.81MB 下载积分：VIP专享

下载报告请您先登录！

计算机行业AIGC系列之六：百度文心一个符合预期的起点-230317（16页）.pdf

1、行业及产业行业研究/行业点评证券研究报告计算机 2023 年 03 月 17 日百度文心：一个符合预期的起点看好 AIGC 系列之六相关研究跨模态：更多应用场景出现，中国公司得到更大机会-AIGC 系列之五 2023 年3 月 13 日数据局，国资云，AIGC，中东进：全面数字经济！-计算机行业周报20 2023 年 3月 11日证券分析师洪依真 A0230519060003 林起贤 A0230519060002 李国盛 A0230521080003 杨海燕 A0230518070003 联系人洪依真(8621)2329

2、7818 3 月 16 日，百度正式发布了文心一言，能够与人对话互动，回答问题，协助创作。我们认为：1）一些 NLP 人机对话中基础的问答、总结、推理、创作能力基本具备；2）部分特定场景的中文理解可能超过了 GPT；3）具备了初步的数理逻辑能力；4）有特色的多模态生成能力，某几个功能点很实用。但同时，我们认为相比 GPT4 功能文心一言仍有较大差距，目前水平约在 GPT3 左右。发布会中有部分体现大模型强大指出的核心功能尚未充分展示。包括多轮对话、代码能力、长文本理解等 GPT-4 具有的能力，文心一言未进行展示。同时目前文心一言仍未全面公测，企业和个人用户可以在官网申请邀请后试用。整体来看，

3、文心一言展示出的水平符合我们预期：即从参数量、迭代路径看，国内 NLP大模型水平介于 BERT 和 GPT-3 之间，与海外差距在 2-3 年。2021 年 GPT-3 推出时，代码、长文本、语境等能力也较弱。在此后 1 年中，OPEN AI 快速迭代增加了 codex、RLHF 等尝试，并继续优化了 PPO，在 2022 年推出 instructGPT，其后能力才出现较大提升。我们认为百度文心已经初步具备 LLM 底座，期待后续迭代。技术上，我们分析了百度 NLP 大模型 ERNIE 1.0-3.0 迭代，优势总结如下：1）ERNIE 1.0到 3.0 完整迭代，截至 3.0 已是相对可用状

4、态，3.0 模型结构便于下游二次开发部署；2）强大的百度内部特色中文语料库；3）基于 BERT 结构基础加上了知识图谱等特色功能，在部分规则训练场景有更好可控性；4）国内领先的开源 AI 训练框架，较强的算力基础设施。但同时，我们也看到现阶段 ERNIE 底座的一些不足：1）模型结构仍然基于 BERT，但目前海外巨头主流结构转变为 GPT 为代表的 decoder-only，未来百度是否会在模型结构上继续迭代？2）根据 3 月 16 日百度文心一言发布会，目前百度在 Prompt 和 RLHF 已经掌握方法论，但实际训练量仍然有待提升；3）百度都使用了有特色是知识图谱训练，这一方式可以有效降低

5、训练模型所需要消耗的算力。但当大语言模型达到千亿或者更高参数级别时，似乎自然具备了知识图谱训练下的能力。4）ERNIE 使用了百度内部特色中文数据，提升模型中文能力。但是百度体系内高质量语料库相比庞大的英文互联网语料库仍然不足。相关标的：互联网行业重点关注计划国内推出类 GPT 产品的三六零；应用相关，重点关注海外业务占比高，有望通过 AI 优化运营效率和产品体验的公司，海外业务贡献较多的巨人网络（持有 playtika 股权）、盛天网络、汤姆猫、昆仑万维、蓝色光标、神州泰岳、恺英网络；易点天下、鸿合科技。国内未来随着大模型迭代，合作伙伴也有望受益，关注风语筑、三人行、姚记科技、华策影视、创维

6、数字。计算机行业：建议重点关注跨模态应用，包括多模态应用：1）文生图：虹软科技（基于stable diffusion 的多种 2B 图像应用）、新国都、中科创达（移动端文生图工具部署）；2）机器人：三花智控等；3）其他应用：润达医疗（申万医药、医疗诊断 AI）、福昕软件、万兴科技；视频、图像、文本素材：大华股份（工业场景视频素材和标注），AI 领军、当虹科技；视觉和跨模态算法：商汤（港股）、云从科技、科大讯飞。风险提示：大模型技术中美仍存在差异，部分技术尚处于早期实验室阶段，存在落地风险；实体清单等可能对训练硬件产生影响。请务必仔细阅读正文之后的各项信息披露与声明行业点评请务必仔细阅读正文

7、之后的各项信息披露与声明第 2 页共 16 页简单金融成就梦想百度“文心”大模型：纯 NLP 能力国内领先，跨模态也有较多布局。应用场景涵盖：NLP 大模型、CV 大模型、跨模态大模型、生物计算大模型、行业大模型。API 包括了：1）ERNIE3.0 文本理解与创作：预置作文生成、文案创作、情感分析等任务提示，2）ERNIE-ViLGAI 作画大模型，3）PLATO 大模型开放域对话服务。图 1 百度文心大模型和多行业工具平台资料来源：百度文心官网，申万宏源研究 1、从 NLP 基础底座 ERNIE 看文心一言核心能力 NLP 是百度能力核心，也是本次文心一言的基础。目前百度已有多

8、个针对不同任务的优化预训练模型。1）ERNIE 3.0：具备语言理解能力以及写小说、歌词、诗歌、对联等文学创作能力；2）ERNIE 3.0 Zeus：基于知识增强的千亿模型；3）鹏城-百度文心：参数规模达到 2600 亿的知识增强大模型；4）ERNIE 3.0-Tiny：首个基于多任务知识注入的下游无关蒸馏模型。图 2 百度 NLP 预训练大模型底座 oOoPXXdUaYbZpXeXwV8O9R9PsQmMnPnOfQpPmPjMrQyR8OsQnNwMqRoQvPtRmR 行业点评请务必仔细阅读正文之后的各项信息披露与声明第 3 页共 16 页简单金融成就梦想资料来源：百度文心官

9、网、申万宏源研究此外，百度 NLP 大模型有大量下游应用。包括医疗、金融、跨语言、代码、搜索等领域都有布局。百度 NLP 核心能力是 ERNIE 大模型，类似 GPT 之于 open AI。特点是基于知识图谱强化，基于中文训练。另外需要关注百度在模型结构上的选择、和对于是否人类反馈（prompt 和 RLHF）的选择，以及百度使用的中文语料库高质量数据是否足够。NLP大模型 ERNIE 2019年开始多轮迭代，起点是 2019年的1.0，受到google BERT的较大启发。ERNIE 1.01在 2019 年 4 月推出，模型结构基于 BERT 模型的进一步优化，在中文的 NLP 任务上得

10、到了当时较好的结果。ERNIE1.0 选择的模型结构是类似 BERT 的 encoder-only。ERNIE 1.0 类似 BERT，使用了多层编码器结构的 transformer，模型大小也与 BERT 相同，12 个编码器层，768个隐单元，12 个注意力头（12 encoder layers,768 hidden units and 12 attention heads）。图 3 ERNIE 1.0 使用了 encoder-only 的结构，和 BERT 类似 1 ERNIE:Enhanced Representation through Knowledge lntegration，g

11、ithub 开源https:/ 请务必仔细阅读正文之后的各项信息披露与声明第 4 页共 16 页简单金融成就梦想资料来源：申万宏源研究但这一结构区别于 GPT，且目前 google 也开始从 encoder-only 过渡到encoder-decoder 再到 decoder-only，所以后续百度是否仍然沿用这一模型结构迭代，值得关注。1）此前在 2018-2021 年，谷歌路线为 encoder-only（只有编码器）2或encoder-decoder（编码解码器）3，而同一时期，open ai一直基于 decoder-only（只有解码器）路

12、线迭代自己的 AGI 生成式大模型。2)直到 2021 年 10 月，Google 推出 FLAN（1370 亿参数），并从此开始重新转向只有 decoder-only 模型，还提出了 ChatGPT 用到的 Instruction Tuning 概念。2023 年google 的最新跨模态大模型 palm-e 在 NLP 部分也使用了 decoder-only 结构。3）即中间有约 20 个月时间，google 并未使用 decoder-only 结构，部分 AI 学者认为这是 google 在 AGI 产品上暂时落后于 open ai 的原因之一。区别于 BERT 的特在在于“先验知识”和

13、“异构数据整合”。特点一：ERNIE 1.0 区别于 BERT，在 mask 上采取不同做法，特点是“先验知识”的学习。在绝大多数的研究中，仅仅通过上下文来预测丢失的单词并对其进行建模。这些模型没有考虑句子中的先验知识。如下图案例，在句子“哈利波特是由罗琳（J.K.Rowling）创作的一系列幻想小说”中。哈利波特（Harry Potter）是小说的名字，而罗琳（J.K.Rowling）是作家。BERT 可以通过实体内部的单词搭配来预测实体 Harry Potter 的缺失单词，而无需借助较长的上下文。ERNIE 则假设如果模型学习更多有关先验知识的信息，则该模型可以获得更可靠的语言表示。ER

14、NIE 不是直接添加知识嵌入（knowledge embedding），而是隐式地学习有关知识和较长语义依赖性的信息，例如实体之间的关系，实体的属性和事件的类型，以指导单词嵌入学习。图 4 ERNIE1.0 和 BERT 在 mask时选取了不同方式 2 2018 年 10 月，谷歌提出 3 亿参数的 BERT（Bidirectional Encoder Representation from Transformers）。只有编码器，用一种完形填空的方法，其训练效果超过人类表现，宣告 NLP 范式的改变。3 2019 年 10 月，Google 发布了统一的模型框架 T5，基于编码解码器的 T

15、5（BERT 只有编码，GPT 只用解码），最大模型 110 亿参数并开放。行业点评请务必仔细阅读正文之后的各项信息披露与声明第 5 页共 16 页简单金融成就梦想资料来源：ERNIE:Enhanced Representation through Knowledge Integration、申万宏源研究特点二：采用百度内部的异构语料库进行预训练。收集百度贴吧、百度新闻、百度百科的混合语料，其中百度百科包含以正式语言撰写的文章，是模型训练的强大基础；百度新闻提供了最新的电影名、演员名、球队名等；百度贴吧中的每个帖子可以看作是对话，被用于 DLM 任务。ERNIE 1.0 做到在多

16、项中文任务上优于 BERT。且通过消融研究(Ablation Studies)证实，知识整合和对异构数据的预训练都能使模型获得更好的语言表示。图 5 Results on 5 major Chinese NLP tasks 资料来源：ERNIE:Enhanced Representation through Knowledge Integration、申万宏源研究注：XNLI 是自然语言推理数据集；LCQMC 是语义相似度数据集；MSRA-NER 是用于命名实体识别的数据集；ChnSentiCorp 是用于句子情感分析的数据集；NLPCC-DBQA 是用于问答系统的数据集继续迭代，目前版本

17、 ERNIE 3.0 已在中文任务上取得较好效果。2019 年 7 月百度推出 ERNIE 2.04，该框架通过不断的多任务学习来逐步构建和学习预训练任务，最大限度地从训练语料库中提取词汇、句法和语义信息。2021 年 7 最新大版本是 ERNIE 3.05。4 ERNIE 2.0:A Cntinual PreTraining Framework for Language Understanding 5 ERNIE 3.0:Large-scale Knowledge EnhancedPre-training for Language Understanding and Generation 先

18、验知识生效行业点评请务必仔细阅读正文之后的各项信息披露与声明第 6 页共 16 页简单金融成就梦想特点一：模型结构多层框架 ERNIE 3.0 在模型结构上的思路渭：NLP 不同任务范式对底层特征提取要求一致，但对顶层具体特征要求不一致，其中 NLP 学习语义连贯性，而自然语言 NLP 生成则期望进一步的语境信息。如下图，ERNIE 3.0 不同的任务范式能够共享在一个共享网络中学习的底层抽象特征，并分别利用在他们自己的特定任务网络中学习的特定任务顶层具体特征。图 6 ERNIE 3.0 模型结构资料来源：ERNIE:Enhanced Representation throug

19、h Knowledge Integration、申万宏源研究该框架还支持随时引入各种定制任务，因此可以更好的支持下游二次开发。当给定一个新任务时，ERNIE3.0 框架可以根据以前的训练参数逐步训练分布式表征，而不需要从头开始训练。特点二：大规模知识图谱学习，通用知识-文本预测（UKTP）任务百度 ERINE 3.0 认为，google T5 和 open ai GPT-3 尽管很成功，但是在没有引入语言知识和世界知识的情况下对普通文本进行训练的。为了解决这一个问题，ERNIE 3.0 在一个由普通文本和大规模知识图谱组成的 4TB 语料库上用 100 亿个参数训练该模型。百度构建中文文本

20、语料库，存储量达 4TB，分 11 个不同类别。语料库包含 ERNIE 2.0（包括百科、Feed 等）、百度搜索（包括百家号、知乎、贴吧、经验）、网络文本、QA-long、QA-short、Poetry 2&Couplet 3、医疗、法律、金融等领域的特定数据以及百度知识图谱（超过 5000 万条事实）。图 7 通用知识-文本预测行业点评请务必仔细阅读正文之后的各项信息披露与声明第 7 页共 16 页简单金融成就梦想资料来源：ERNIE:Enhanced Representation through Knowledge Integration、申万宏源研究特点三：既有有监督的

21、微调（fine-tuning），也有零样本、少样本学习。在数学、翻译等任务中使用了微调。在中文新闻分类、语义相似度等任务中零样本学习，也取得较好效果。最终经验结果表明，该模型在 54 个中文 NLP 任务上的表现优于最先进的模型，其英文版本在SuperGLUE 基准测试中获得第一名，比人类表现高出0.8%（90.6%对89.8%）。百度底座的其他优势，paddlapaddle 国内第一个开源神经网络框架。2016 年 8 月，百度在 Github 上 100%开源内部使用多年的深度学习平台 PaddlePaddle。paddlepaddle 中文环境下较多的优势：1）能够应用于自然语言处理、图

22、像识别、推荐引擎等多个领域，其优势在于开放的多个领先的预训练中文模型，适应中文环境。2）模型库丰富，来自百度各个业务部门贡献；3）较多企业级的包，可以直接在产业界落地使用；4）兼容大量国产 AI 芯片。超大规模集群分布式计算能力。paddlepaddle 设计研发了具备更强扩展能力的端到端自适应大规模分布式训练架构6。该架构可以针对不同的模型和硬件，抽象成统一的分布式计算视图和资源视图，并通过硬件感知细粒度切分和映射功能，搜索出最优的模型切分和硬件组合策略，将模型参数、梯度、优化状态按照最优策略分配到不同的计算卡上，达到节省存储、负载均衡、提升训练性能的目的。国内领先的算力底座。在此前文心一言

23、的压力测试中，亚洲目前最大的单体智算中心山西阳泉百度智算中心，已经将算力提升到每秒可以完成 400 亿亿次浮点运算。总结：6 https:/arxiv.org/abs/2112.02752 行业点评请务必仔细阅读正文之后的各项信息披露与声明第 8 页共 16 页简单金融成就梦想百度在 NLP 大模型上走出了特色道路，并且毫无疑问是国内第一梯队水平，优势总结如下：1）ERNIE 1.0 到 3.0 完整迭代，截至 3.0 已是相对可用状态，3.0 模型结构便于下游二次开发部署；2）强大的百度内部特色中文语料库；3）基于 BERT 结构基础加上了知识图谱等特色功能，在部分规则训练场景有

24、更好可控性；4）国内领先的开源 AI 训练框架，较强的算力基础设施。但同时，我们也看到现阶段 ERNIE 底座的一些不足：1）模型结构上仍然基于 BERT，但目前海外巨头主流结构转变为 GPT 为代表的decoder-only，未来百度是否会在模型结构上继续迭代？2）截至 3.0，百度仍然使用 fine-tuning 等传统方法对细分任务微调。而国际常见做法是 Prompt 或者 RLHF（人类反馈强化学习）。根据 3 月 16 日百度文心一言发布会，目前百度在后者已经掌握方法论，但实际训练量仍然有待提升；3）从 1.0 到 3.0，百度都使用了有特色是知识图谱训练，这一方式可以有效降低训练模

25、型所需要消耗的算力（3 月 16 日文心一言发布会也提到了这一特点）。但当大语言模型达到千亿或者更高参数级别时，似乎自然具备了知识图谱训练下的能力。是否“暴力出奇迹”才是 AI 大预言模型的最终答案？4）百度 ERNIE 使用了百度内部特色中文数据，提升模型中文能力。但是是否百度体系内高质量语料库相比庞大的英文互联网语料库仍然不足？尽管有以上不足，我们仍然认为百度在 NLP 能力上属于国内第一梯队，也期待后续模型的进一步迭代提升。2、如何看待百度文心一言发布 3 月 16 日，百度文心一言正式发布，发布会上百度展示了多项能力。我们认为：1）一些 NLP 人机对话中基础的问答、总结、推理、创作能

26、力基本具备文学创作：总结和推理能力。文言一心可以以问答式方式文学作品作者的详细信息，总结概括文学作品的主要内容，并可以连贯生成如何尝试续写三体。该 AI 采用了知识增强和检索增强技术，在训练过程中采用了 5500 亿知识图谱数据。图 8 要求文心一言总结和续写三体行业点评请务必仔细阅读正文之后的各项信息披露与声明第 9 页共 16 页简单金融成就梦想资料来源：百度文心一言发布会、申万宏源研究商业文案创作：表达和创作能力。文言一心可以智能的给公司起名，提供公司的服务Slogan，可以根据具体需求创造数百字的新闻稿。创作基本连贯清晰，理解了提问者意图。图 9 按照要求提供公司 s

27、logan 资料来源：百度文心一言发布会、申万宏源研究 2）部分特定场景的中文理解可能超过了 GPT。发布会上展示了根据成语的白话理解反推询问的成语，用成语写藏头诗。图 10 对文心一言要求写藏头诗图 11 GPT-4 无法理解藏头诗含义行业点评请务必仔细阅读正文之后的各项信息披露与声明第 10 页共 16 页简单金融成就梦想资料来源：百度文心一言发布会、申万宏源研究资料来源：量子位公众号、申万宏源研究 3）具备了初步的数理逻辑能力。数学问题一直被认为是 nlp 是否具有初级逻辑能力的考查标准。发布会中示范了一个简单数学题，文心一言答案展示了部分思维链（chain of th

28、ought）能力。图 12 文心一言解答数学问题资料来源：百度文心一言发布会、申万宏源研究 4）有特色的多模态生成能力，某几个功能点很实用。文言一心特色功能是对话中直接文生图，根据一段简单的文字生成视频（可以在百家号中使用），根据内容生成粤语、东北话、闽南话等相关方言的语音。以上跨模态功能是目前 GPT-4 未整合的。图 13 根据一段话直接生成视频资料来源：百度文心一言发布会、申万宏源研究但同时，我们认为发布会中有部分体现大模型强大指出的核心功能尚未充分展示。包括多轮对话、代码能力、长文本理解等 GPT-4 具有的能力，文心一言未进行展示。行业点评请务必仔细阅读正文之后的各项信息披露

29、与声明第 11 页共 16 页简单金融成就梦想 3、文心一言商业化：拉动百度搜索、小度、智能驾驶和云，赋能传媒、软件、金融等行业百度披露更多商业机会。一方面，与现有的搜索、小度、智能驾驶、云、投资公司爱奇艺等业务结合，提升入口流量价值和云的份额；另一方面，文心一言通过牵手合作伙伴，建立产业生态，相关接入公司为 AI 提供落地场景，也有望借助 AI 提升运营效率或产品体验，尤其是在内容（文本、影视、游戏、营销等）生成、数字人、办公、智能家居、金融等领域。商业化-对内：文心一言将与百度多项业务结合。百度搜索，提供交互和聊天体验；微软证明了搜索引擎+类 GPT 产品是可行路线。2023年

30、2 月 8 日，微软发布基于 ChatGPT 的新版 EDGE 浏览器和 Bing 搜索引擎，在提供传统搜索内容的同时，用户可以与搜索引擎进行对话交流，获得更全面的答案，3 月 8 日微软宣布，在超过百万的新 Bing 预览用户推动之下，Bing 每日活跃用户已突破 1 亿。同时，他还坦言：在新版 Bing 的数百万活跃用户中，有大约三分之一是新用户。虽然 ChatGPT 或减少搜索广告的加载率，对于谷歌而言是个风险，但对于份额原来不高的微软 Bing 而言反而是一个提升流量入口地位的机会。百度始终在中国搜索引擎市场占据龙头地位，但近年来移动端站内搜索对传统的搜索引擎有分流，文心一言与搜索引擎

31、的结合有望加强搜索的入口低位。百度的搜索份额保持在 70%-80%之间；PC 时代，搜索引擎是互联网的流量入口，行业竞争格局相对稳固。但移动互联网时代，流量分散在各互联网巨头的头部 App 中，流量相对分散，且各个 App均积极布局移动端的站内搜索分流 PC 端搜索和手机百度搜索量，尤其是抖音、微信的站内搜索。图 14 中国移动搜索引擎份额行业点评请务必仔细阅读正文之后的各项信息披露与声明第 12 页共 16 页简单金融成就梦想资料来源：Statecounter，申万宏源研究表 1：腾讯和字节跳动对搜索的布局公司时间事件腾讯 2017 年微信上线“搜一搜”和“看一看”

32、2020 年微信边聊边搜成为了聊天场景里搜索的最短路径 2020 年腾讯收购搜狗 2021 年微信搜一搜月活用户达 5 亿字节跳动 2017 年依托今日头条，尝试搜索业务 2019 年头条搜索网页版上线 2020 年推出头条搜索独立 app 2020 年抖音日均视频搜索次数突破 4 亿，视频搜索月活用户已超 5.5 亿资料来源：晚点 LatePost，申万宏源研究小度：小度将融合“文心一言”的全面能力，提升小度与用户进行多轮对话的体验，打造针对智能设备场景的人工智能模型“小度灵机”，并应用到小度全系产品。小度科技原是百度旗下智能生活事业群组业务，后独立融资，作为国内市场规模

33、最大的对话式人工智能操作系统和全球智能屏最大的出货厂商，小度科技已发布多款小度人工智能产品，包括智能音箱、智能屏、智能耳机，以及语音车载支架、电视伴侣、智能灯泡、智能红外遥控、智能按钮等周边产品，还拥有小度助手（DuerOS)，小度与诸多智能设备厂商建立合作。自动驾驶&智能座舱：文心一言背后大模型应用至自动驾驶将加深车辆对复杂城市路况的理解；文心的智能语音能力将搭载到 Apollo 智舱系列产品，提升人车语音交互体验。集度接入文心一言大模型后，文心一言的车企朋友圈不断扩大，岚图、红旗、长城、东风日产、爱驰、零跑、吉利汽车、海马汽车等近 10 家车企加入文心一言的朋友圈。爱奇艺：双方共同探索将

34、AIGC 技术应用于爱奇艺内容搜索、内容宣发、内容创作工具、小说创作等业务。此次合作将把爱奇艺丰富的在线视频娱乐资源与百度的前沿技术相结合，进一步赋能爱奇艺，拓展其在影视内容创意、制作效率、用户体验等方面的生产能力。长视频具有项目周期长、人力密集型的特点，AI 有望提升内容生产的工业化程度。商业化-对外：结合垂直领域 Know-how，实现垂直领域赋能。将通过百度智能云对外提供服务，目前已有各领多家企业进入文心一言生态圈。涵盖媒体内容、智能设备、金融、汽车、软件服务、智能家居等领域，涵盖融媒体（游戏营销影视媒体）、智能设备、金融、汽车、软件服务、数字人、金融等领域；其中融媒体类接入最多；

35、包括传媒上市公司蓝色光标、风语筑、爱奇艺、掌阅科技、华策影视、值得买、巨人网络子公司世优科技等。行业点评请务必仔细阅读正文之后的各项信息披露与声明第 13 页共 16 页简单金融成就梦想表 2：文心一言生态圈（部分公司）行业接入企业融媒体工信部新闻宣传中心（人民邮电报社）、广州日报、上海证券报澎湃新闻、36 氪等阅读七猫、掌阅科技等教育艺术宝、达内 IT 教育集团广告营销新潮传媒、蓝色光标、利欧股份等搜索火狐社交 Soul 视频爱奇艺等音乐太合音乐集团智能设备和家电小度科技、酷开科技、联想小新、美的、长虹等金融中国邮政储蓄银行、百信银行、广发证

36、券等汽车集度汽车、红旗汽车、岚图汽车等数字场景飞天云动、风语筑、凡拓数创软件服务汉得信息、金蝶软件、宇信科技、中软国际、软通动力等资料来源：各公司，申万宏源研究百度云在 AI 领域已经积累多年，对外服务加速，将打开智能云业务收入及利润空间。2022 年，百度智能云推出“云智一体 3.0”架构，涵盖底层的芯片（昆仑芯片）-深度学习框架（飞桨 PaddlePaddle）-大模型（文心大模型）-应用（搜索等）。中国 AI 公有云服务市场增速均高于中国整体 AI 软件市场的增速，主要玩家包括百度云，阿里云，华为云和腾讯云等，百度智能云连续四年居第一，并且在人脸人体、图像视频两个规模最

37、大的子市场继续保持第一，百度云今年对百度的业务贡献在增加。百度核心非在线营销收入保持正增长；通过复用标准化解决方案以及从低利润率项目中转移，百度智能云利润率持续优化，22Q4 利润率提升。展望后续，随着文心一言加速对外服务，智能云有望从提供基础的算力、存储等业务向智能服务转型，打开收入及利润空间。图 15 百度核心业务收入（亿元）图 16 百度核心业务分业务 YoY 资料来源：百度财报，申万宏源研究资料来源：百度财报，申万宏源研究图 17 百度核心业务收入（亿元）图 18 22H1 中国人工智能公有云服务市场份额 04590022Q122Q222Q322Q4在线营销收

38、入非在线营销收入-15%0%15%30%45%22Q122Q222Q322Q4在线营销收入非在线营销收入行业点评请务必仔细阅读正文之后的各项信息披露与声明第 14 页共 16 页简单金融成就梦想资料来源：百度财报，申万宏源研究资料来源：IDC，申万宏源研究 4相关标的互联网行业：重点关注计划国内推出类 GPT 产品的三六零；应用相关，重点关注海外业务占比高，有望通过 AI 优化运营效率和产品体验的公司，海外业务贡献较多的巨人网络（持有 playtika 股权）、盛天网络、汤姆猫、昆仑万维、蓝色光标、神州泰岳、恺英网络；易点天下、鸿合科技。国内未来随着大模型迭代，合作伙伴也有望

39、受益，关注风语筑、三人行、姚记科技、华策影视、创维数字。计算机行业：建议重点关注跨模态应用，包括多模态应用：1）文生图：虹软科技（基于 stable diffusion 的多种 2B 图像应用）、新国都、中科创达（移动端文生图工具部署）；2）机器人：三花智控等；3）其他应用：润达医疗（申万医药、医疗诊断 AI）、金山办公、福昕软件、万兴科技；视频、图像、文本素材：大华股份（工业场景视频素材和标注），AI 领军、当虹科技；视觉和跨模态算法：商汤（港股）、云从科技、科大讯飞。表 3：AI 行业重点公司估值表证券代码公司名称 2023/3/16 Wind 一致预期归母净利润（亿元）PE PB(L

40、F)总市值 2021A 2022E 2023E 2024E 2021A 2022E 2023E 2024E（亿元）688088.SH 虹软科技 117 1.41 0.56 1.69 2.57 83 207 69 45 4.52 002236.SZ 大华股份 527 33.78 26.43 33.66 39.93 16 20 16 13 2.10 603108.SH 润达医疗 85 3.80 4.08 5.21 6.40 22 21 16 13 2.34 601360.SH 三六零 872 9.02-24.69 4.94 11.89 97-35 177 73 2.80 002558.SZ 巨人网

41、络 208 9.95 9.39 12.24 14.43 21 22 17 14 1.71 688039.SH 当虹科技 56 0.61-0.99 1.02 1.48 92-55 38 4.12 300130.SZ 新国都 92 2.01 2.97 4.73 6.13 46 31 19 15 3.00 300496.SZ 中科创达 473 6.47 7.69 11.08 14.90 73 62 43 32 5.21 002050.SZ 三花智控 850 16.84 24.71 30.66 37.73 50 34 28 23 7.31 300624.SZ 万兴科技 90 0.28 1.06 1.5

42、5 2.07 325 85 58 44 10.73 300494.SZ 盛天网络 53 1.25 2.24 3.03 3.76 42 24 17 14 3.52 300418.SZ 昆仑万维 317 15.47 11.65 13.13 15.20 20 27 24 21 2.63 300459.SZ 汤姆猫 210 7.08-30-5.46 0%5%10%15%20%25%30%007022Q122Q222Q322Q4调整后净利润利润率行业点评请务必仔细阅读正文之后的各项信息披露与声明第 15 页共 16 页简单金融成就梦想 603466.SH 风语筑 86

43、4.39 1.28 3.88 4.76 20 67 22 18 4.09 688327.SH 云从科技-uw 200-6.32-8.51-5.23-0.37-9.45 002230.SZ 科大讯飞 1,135 15.56 7.70 18.53 26.13 73 148 61 43 7.13 688111.SH 金山办公 1,428 10.41 0.00 16.54 22.44 137#DIV/0!86 64 17.03 688095.SH 福昕软件 70 0.46-0.02 0.52 0.84 150-3594 133 83 2.61 300058.SZ 蓝色光标 198 5.22-6.

44、74 5.57 6.88 38-29 36 29 2.04 300002.SZ 神州泰岳 122 3.85 5.48 6.70 7.88 32 22 18 15 2.52 002517.SZ 恺英网络 182 5.77 10.78 14.18 17.53 32 17 13 10 4.18 301171.SZ 易点天下 115 2.59 3.07 3.82 4.99 45 38 30 23 3.60 002955.SZ 鸿合科技 75 1.69 4.24 5.26 6.47 44 18 14 12 2.09 605168.SH 三人行 131 5.05 7.32 10.24 13.32 26 1

45、8 13 10 6.11 002605.SZ 姚记科技 77 5.74 3.80 4.80 6.00 13 20 16 13 2.87 300133.SZ 华策影视 112 4.00 4.70 5.53 6.40 28 24 20 18 1.67 000810.SZ 创维数字 199 4.22 8.88 10.98 13.41 47 22 18 15 3.34 资料来源：Wind、申万宏源研究风险提示：大模型技术中美仍存在差异，部分技术尚处于早期实验室阶段，存在落地风险；实体清单等可能对训练硬件产生影响。行业点评请务必仔细阅读正文之后的各项信息披露与声明第 16 页共 16 页简单金

46、融成就梦想信息披露证券分析师承诺本报告署名分析师具有中国证券业协会授予的证券投资咨询执业资格并注册为证券分析师，以勤勉的职业态度、专业审慎的研究方法，使用合法合规的信息，独立、客观地出具本报告,并对本报告的内容和观点负责。本人不曾因，不因，也将不会因本报告中的具体推荐意见或观点而直接或间接收到任何形式的补偿。与公司有关的信息披露本公司隶属于申万宏源证券有限公司。本公司经中国证券监督管理委员会核准，取得证券投资咨询业务许可。本公司关联机构在法律许可情况下可能持有或交易本报告提到的投资标的，还可能为或争取为这些标的提供投资银行服务。本公司在知晓范围内依法合规地履行披露义务。客户可通过索

47、取有关披露资料或登录信息披露栏目查询从业人员资质情况、静默期安排及其他有关的信息披露。机构销售团队联系人华东 A 组陈陶华东 B 组谢文霓华北组李丹华南组李昇 L 股票投资评级说明证券的投资评级：以报告日后的 6 个月内，证券相对于市场基准指数的涨跌幅为标准，定义如下：买入（Buy）增持（Outperform）中性(Neutral)减持(Underperform)：相对强于市场表现20以上；：相对强于市场表现520；：相对市场表现在55之间波动；：相对弱于市场表现5以下。

48、行业的投资评级：以报告日后的6个月内，行业相对于市场基准指数的涨跌幅为标准，定义如下：看好（Overweight）中性(Neutral)看淡(Underweight)：行业超越整体市场表现；：行业与整体市场表现基本持平；：行业弱于整体市场表现。我们在此提醒您，不同证券研究机构采用不同的评级术语及评级标准。我们采用的是相对评级体系，表示投资的相对比重建议；投资者买入或者卖出证券的决定取决于个人的实际情况，比如当前的持仓结构以及其他需要考虑的因素。投资者应阅读整篇报告，以获取比较完整的观点与信息，不应仅仅依靠投资评级来推断结论。申银万国使用自己的行业分类体系，如果您对我们的行业分类有兴趣，可以向我

49、们的销售员索取。本报告采用的基准指数：沪深300指数法律声明本报告仅供上海申银万国证券研究所有限公司（以下简称“本公司”）的客户使用。本公司不会因接收人收到本报告而视其为客户。客户应当认识到有关本报告的短信提示、电话推荐等只是研究观点的简要沟通，需以本公司 http:/ 网站刊载的完整报告为准，本公司并接受客户的后续问询。本报告上海品茶列示的联系人，除非另有说明，仅作为本公司就本报告与客户的联络人，承担联络工作，不从事任何证券投资咨询服务业务。本报告是基于已公开信息撰写，但本公司不保证该等信息的准确性或完整性。本报告所载的资料、工具、意见及推测只提供给客户作参考之用，并非作为或被视为出售或购买

50、证券或其他投资标的的邀请或向人作出邀请。本报告所载的资料、意见及推测仅反映本公司于发布本报告当日的判断，本报告所指的证券或投资标的的价格、价值及投资收入可能会波动。在不同时期，本公司可发出与本报告所载资料、意见及推测不一致的报告。客户应当考虑到本公司可能存在可能影响本报告客观性的利益冲突，不应视本报告为作出投资决策的惟一因素。客户应自主作出投资决策并自行承担投资风险。本公司特别提示,本公司不会与任何客户以任何形式分享证券投资收益或分担证券投资损失，任何形式的分享证券投资收益或者分担证券投资损失的书面或口头承诺均为无效。本报告中所指的投资及服务可能不适合个别客户，不构成客户私人咨询建议。本公司未

51、确保本报告充分考虑到个别客户特殊的投资目标、财务状况或需要。本公司建议客户应考虑本报告的任何意见或建议是否符合其特定状况，以及（若有必要）咨询独立投资顾问。在任何情况下，本报告中的信息或所表述的意见并不构成对任何人的投资建议。在任何情况下，本公司不对任何人因使用本报告中的任何内容所引致的任何损失负任何责任。市场有风险，投资需谨慎。若本报告的接收人非本公司的客户，应在基于本报告作出任何投资决定或就本报告要求任何解释前咨询独立投资顾问。本报告的版权归本公司所有，属于非公开资料。本公司对本报告保留一切权利。除非另有书面显示，否则本报告中的所有材料的版权均属本公司。未经本公司事先书面授权，本报告的任何部分均不得以任何方式制作任何形式的拷贝、复印件或复制品，或再次分发给任何其他人，或以任何侵犯本公司版权的其他方式使用。所有本报告中使用的商标、服务标记及标记均为本公司的商标、服务标记及标记。

友情提示

1、下载报告失败解决办法
2、PDF文件下载后，可能会被浏览器默认打开，此种情况可以点击浏览器菜单，保存网页到桌面，就可以正常下载了。
3、本站不支持迅雷下载，请使用电脑自带的IE浏览器，或者360浏览器、谷歌浏览器下载即可。
4、本站报告下载后的文档和图纸-无水印,预览文档经过压缩，下载后原文更清晰。

本文（计算机行业AIGC系列之六：百度文心一个符合预期的起点-230317（16页）.pdf）为本站（蒸蒸日上）主动上传，三个皮匠报告文库仅提供信息存储空间，仅对用户上传内容的表现方式做保护处理，对上载内容本身不做任何修改或编辑。若此文所含内容侵犯了您的版权或隐私，请立即通知三个皮匠报告文库（点击联系客服），我们立即给予删除！

温馨提示：如果因为网速或其他原因下载失败请重新下载，重复下载不扣分。