上海品茶

您的当前位置:上海品茶 > 报告分类 > PDF报告下载

拓尔思-深度报告:语义智能领军者大数据+AI双轮驱动打开公司广阔空间-221129(41页).pdf

编号:108320 PDF 41页 2.86MB 下载积分:VIP专享
下载报告请您先登录!

拓尔思-深度报告:语义智能领军者大数据+AI双轮驱动打开公司广阔空间-221129(41页).pdf

1、证券研究报告|深度报告|软件开发 http:/ 1/41 请务必阅读正文之后的免责条款部分 拓尔思(300229)报告日期:2022 年 11 月 29 日 语义智能领军者,大数据语义智能领军者,大数据+AI 双轮驱动打开公司广阔成长空间双轮驱动打开公司广阔成长空间 拓尔思拓尔思深度报告深度报告 投资要点投资要点 公司是国内最早从事自然语言处理(公司是国内最早从事自然语言处理(NLP)技术研发的企业,在语义智能领域)技术研发的企业,在语义智能领域具备深厚技术积累,形成大数据、人工智能、网络安全三大核心业务。公司经具备深厚技术积累,形成大数据、人工智能、网络安全三大核心业务。公司经过多年的商业化

2、探索,应用场景从政府、公安,向金融、知识产权等多领域延过多年的商业化探索,应用场景从政府、公安,向金融、知识产权等多领域延伸,并且未来在虚拟人、人形机器人领域伸,并且未来在虚拟人、人形机器人领域应用前景广阔。对标国外搜索引擎数应用前景广阔。对标国外搜索引擎数据库龙头据库龙头 Elasticsearch 和知识图谱服务厂商龙头和知识图谱服务厂商龙头 Palantir,我们认为公司在信创,我们认为公司在信创浪潮驱动下,有望保持业务快速增长,并通过业务场景延伸打开成长空间。浪潮驱动下,有望保持业务快速增长,并通过业务场景延伸打开成长空间。对标对标 Elasticsearch,公司搜索引擎数据库有望加

3、速国产替代,公司搜索引擎数据库有望加速国产替代 大数据时代下,对半/非结构化数据的检索和分析需求加速成长,传统的关系型数据库难以满足通用/专业信息检索需求,搜索引擎数据库应用优势突显,全球潜在市场空间约 450亿美元,核心市场规模达 80亿美元。对标国外搜索引擎数据库龙头 Elasticsearch,公司自主研发海贝大数据管理系统核心代码自主率达到100%,可实现国外产品的平滑替代,完全满足信创需求并且在中文全文检索具备显著优势。知识图谱引导认知智能发展,对标知识图谱引导认知智能发展,对标 Palantir 公司成长空间广阔公司成长空间广阔 知识图谱以 NLP 为核心技术,旨在将多模态信息数据

4、进行挖掘后以知识形态进行存储,赋予 AI 认知理解和自主推理决策的功能,被认为是实现强人工智能的关键技术。对标国外龙头厂商 Palantir,公司人工智能产品结合大数据技术支撑,在金融、公安、政府等多领域应用前景广阔,伴随 AI 商业化进程的加速,未来相关业务有望实现加速成长。公司业务场景持续延伸,产品公司业务场景持续延伸,产品 SaaS 化进程推动业务成长化进程推动业务成长 NLP 及知识图谱技术在虚拟人、人形机器人领域应用前景广阔,公司积极布局技术研发,与国内外头部厂商形成深度合作,未来有望带来业务新增量;公司持续推进产品 SaaS化转型,近年来云和数据服务收入占比持续升高,驱动公司产品盈

5、利能力的不断提升。盈利预测与估值盈利预测与估值 我们预计公司 2022-2024 年实现营业收入分别为 13.11/16.45/20.40 亿元,同比增长分别为 27.41%/25.48%/24.02%;对应归母净利润分别为 3.15/4.01/5.14 亿元,同比增速分别为 28.24%/27.32%/28.04%,对应 EPS为 0.44/0.56/0.72 元,对应 PE分别为 27.76/21.80/17.03 倍。首次覆盖予以“买入”评级。风险提示风险提示 1、行业竞争加剧带来的风险;2、新业务开拓进展不及预期带来的风险;3、宏观经济下行导致业务波动带来的风险。投资评级投资评级:买入

6、买入(首次首次)分析师:程兵分析师:程兵 执业证书号:S02 基本数据基本数据 收盘价¥12.24 总市值(百万元)8,748.98 总股本(百万股)714.79 股票走势图股票走势图 相关报告相关报告 财务摘要财务摘要 Table_Forcast(百万元)2021A 2022E 2023E 2024E 营业收入 1028.71 1310.64 1644.57 2039.58(+/-)(%)-21.44%27.41%25.48%24.02%归母净利润 245.75 315.15 401.25 513.77(+/-)(%)-34.57%28.24%27.32%28.04%每

7、股收益(元)0.34 0.44 0.56 0.72 P/E 35.60 27.76 21.80 17.03 资料来源:浙商证券研究所 -31%-13%6%24%42%61%21/1122/0122/0222/0322/0422/0522/0622/0722/0822/0922/1022/11拓尔思深证成指拓尔思(300229)深度报告 http:/ 2/41 请务必阅读正文之后的免责条款部分 投资案件投资案件 我们与市场的观点的差异我们与市场的观点的差异(1)市场普遍对于公司搜索引擎数据库的产品性能及国产化替代前景保持怀疑态度,我们认为公司目前是国内搜索引擎数据库的领军者,有能力打破市场担忧。

8、目前公司搜索引擎数据库已实现核心技术全部自主可控,并且可以实现海外产品的平滑替代,产品性能优势显著、客户置换成本低叠加国家对数据安全可靠的要求不断提升,未来公司大数据产品及服务业务完全有望进入加速成长阶段。(2)市场对于公司以语义智能为核心的人工智能产品服务应用前景保持怀疑态度,我们认为随着 AI 商业化进程加速,公司未来将会成为强人工智能时代 AI 商业化的强有力竞争者。不同于语音智能,公司深耕语义智能赛道,融合了信息挖掘、知识存储等技术,均是未来元宇宙(虚拟人)、人形机器人等领域的核心技术,目前公司已经与相关赛道头部厂商建立深度合作,未来人工智能业务有望实现加速成长。股价上涨的催股价上涨的

9、催化因素化因素 搜索引擎数据库国产替代政策出台推动行业发展加速,搜索引擎数据库国产替代政策出台推动行业发展加速,公司在大数据搜索引擎领域技术优势显著,可平滑替代海外龙头产品,2022年 11 月 17日中国信通院召开国内首次“搜索型数据库”技术研讨会,标志着我国对搜索引擎数据库国产替代关注度提升,未来相关政策出台有望推动行业加速发展,公司大数据产品服务在政府、公安、金融等领域已有成熟应用和高粘客户积累,未来有望受益政策加速成长。语义语义智能智能产品产品发布发布及及应用场景应用场景持续持续延伸延伸,公司深耕语义智能赛道,NLP技术被认为是人工智能“皇冠上的明珠”,目前公司相关产品服务已在政务、公

10、安、互联网等领域有成熟应用,未来公司业务有望随着 AI 商业化进程和下游需求的扩张,产品服务延伸到知识产权、虚拟人、机器人等领域,打开公司成长空间。风险提示风险提示 行业竞争加剧带来的风险:行业竞争加剧带来的风险:政务、金融等信息化分为多个细分领域,细分领域竞争有加剧的可能;另外公司向其他行业渗透将面对细分领域已有竞争者的竞争。新业务开拓进展不及预期带来的风险:新业务开拓进展不及预期带来的风险:公司在专利检索、虚拟人、机器人等创新业务均有开展,而且在行业内也属于率先开拓相关业务的探索者。未来业务拓展中可能遇到困难,导致业务拓展进度存在不确定性。宏观经济下行导致业务波动带来的风险:宏观经济下行导

11、致业务波动带来的风险:公司业务产品与下游政府及商业客户的战略转型规划关系较为紧密,宏观经济下行可能导致企业自身财力受影响或政府在大数据、人工智能方面预算缩紧,导致下游景气度提升缓慢,未来仍有波动可能。EZhV8VqUiZlXnPoMoM7NdN8OnPoOtRpNiNmNoMfQnNnQ7NqQzQxNmNnRNZoNtP拓尔思(300229)深度报告 http:/ 3/41 请务必阅读正文之后的免责条款部分 正文目录正文目录 1 对标对标 Elasticsearch,公司搜索引擎数据库有望加速国产替代,公司搜索引擎数据库有望加速国产替代.6 1.1 大数据时代,搜索引擎数据库迈入快速发展阶段

12、.6 1.1.1 搜索引擎数据库专注信息检索,解决大数据时代信息复杂关联问题.6 1.1.2 搜索引擎以全文检索技术为核心,未来满足多样化应用需求.7 1.2 美国 Elasticsearch 为搜索引擎数据库龙头,应用场景丰富.9 1.3 搜索引擎数据库国产替代进程加速,公司行业积累深厚产品优势显著.11 1.3.1 数据安全要求加速数据库国产替代,公司 G 端客户比例较高有望率先受益.11 1.3.2 公司实现搜索引擎数据库核心技术自主可控,满足信创和国产化替换需求.12 1.4 公司持续延伸大数据业务新场景,知识产权业务有望贡献新增量.14 1.4.1 专利处理需求快速成长创造专利代理市

13、场广阔空间,NLP 技术应用前景可期.14 1.4.2 公司布局专利搜索引擎赛道,基因专利检索云服务平台有望赋能行业效率提升.16 2 知识图谱引导认知智能发展,对标知识图谱引导认知智能发展,对标 Palantir 公司成长空间广阔公司成长空间广阔.17 2.1 坚持“语义智能+”为核心战略,公司 AI 产品应用空间广阔.17 2.2 对标美国 Palantir,从市场规模和产品边际贡献率出发看公司成长空间.17 2.2.1 业务从 G 端向 B 端延伸,稳步发展成为知识图谱领域独角兽.17 2.2.2 营收规模持续成长,边际贡献率升高彰显产品化能力.20 2.2.3 业务潜在规模广阔,政府+

14、商业端客户双轮驱动打开成长空间.21 2.3 知识图谱应用领域广泛,有助于公司提高核心竞争力.22 2.3.1 知识图谱应用前景广阔,市场有望迎来加速发展.22 2.3.2 公司人工智能产品持续迭代提升,成为政府、金融等多行业决策大脑.24 3 公司业务场景持续延伸,产品公司业务场景持续延伸,产品 SaaS 化进程推动业务成长化进程推动业务成长.26 3.1 虚拟人作为元宇宙核心角色,公司深度布局虚拟人“灵魂”.26 3.2 人形机器人风起,公司联手赛道头部玩家入局有望受益行业发展.29 3.3 云和数据服务转型加速,SaaS 化进程加速有望助力公司提升盈利能力.31 4 拓尔思,三十年耕耘成

15、就语义智能领军者拓尔思,三十年耕耘成就语义智能领军者.33 4.1 深耕语义智能赛道,打造完整业务版图.33 4.2 公司股权结构稳定,核心团队经验优势丰富,研发实力雄厚.34 4.3 公司营收稳健成长,费用结构合理,发展步伐坚定.35 4.4 公司覆盖多行业优质客户,现金流保持健康.36 5 盈利预测与估值盈利预测与估值.37 5.1 盈利预测.37 5.2 投资建议与估值.38 6 风险提示风险提示.39 拓尔思(300229)深度报告 http:/ 4/41 请务必阅读正文之后的免责条款部分 图表目录图表目录 图 1:搜索引擎分布式索引哈希分片过程图.6 图 2:全文搜索引擎工作原理.7

16、 图 3:全文检索系统的基本结构与功能.7 图 4:2022 年全球搜索引擎数据库各细分市场规模(单位:亿美元).8 图 5:Elasticsearch 产品应用场景.9 图 6:半/非非结构化数据量爆发式成长.9 图 7:阿里云 Elasticsearch 日志数据查询界面.10 图 8:Elastic 监测工具 Kibina 界面.10 图 9:2021 年公司营业收入分行业占比结构.12 图 10:2021年中国智能语音语义市场份额.12 图 11:2022-2030 年中国 NLP 市场规模与增长预测.12 图 12:中国专利申请量持续高速增长.14 图 13:2011-2022 年中

17、国知识产权代理市场规模统计及预测.15 图 14:中国专利代理机构数量快速增长.15 图 15:各行业对专利提供“研发情报价值”态度.15 图 16:弱人工智能和强人工智能的对比.17 图 17:Palantir 公司发展历程.18 图 18:Palantir 2018-2022H1 营业收入及毛利率.20 图 19:Palantir2018-2022H1 毛利率.20 图 20:2019Q1-2022Q3 Palantir 产品边际贡献率.21 图 21:拓尔思营业收入剔除营业成本及销售费用后余值占比.21 图 22:Palamtir 产品潜在市场规模(TAM)结构(2020 年).21 图

18、 23:Palantir 政府及商业业务收入结构.21 图 24:2021 年中国知识图谱市场行业结构.23 图 25:20192026 年中国知识图谱核心市场规模及预测.23 图 26:2019-2026年中国按行业分知识图谱核心市场规模增长趋势(单位:亿元).24 图 27:公司安拓知识图谱平台.24 图 28:虚拟人整体市场规模趋势及预测.27 图 29:语义智能构成数字虚拟人“大脑”.28 图 30:公司所处虚拟人产业链环节.28 图 31:全球服务型机器人市场规模增长趋势及预测.29 图 32:我国服务型机器人市场规模增长趋势及预测.29 图 33:人形机器人人机交互模块.29 图

19、34:小米人形机器人 CyberOne 情绪感知模块.30 图 35:特斯拉机器人 AI 智能交互架构.30 图 36:2018-2022H1 公司云和数据业务收入规模及占比.32 图 37:2015-2023年中国 SaaS 行业市场规模及预测.32 图 38:2011-2020 年中美两国 SaaS 占 IT 投入比例.32 图 39:公司产品矩阵.33 图 40:公司发展历程.33 图 41:公司员工教育程度结构.35 图 42:公司 2017-2022H1 营业收入情况.35 拓尔思(300229)深度报告 http:/ 5/41 请务必阅读正文之后的免责条款部分 图 43:公司 20

20、17-2022H1 归母净利润情况.35 图 44:公司 2018-2021 各项费率结构.36 图 45:公司 2017-2022H1 毛利率、净利率情况.36 图 46:公司货币资金储备(单位:百万元).36 表 1:五类非关系型数据库对比.6 表 2:全球数据库使用度排名(截至 2022 年 11月).7 表 3:数据库与搜索引擎的特点对比.10 表 4:我国数据安全相关政策梳理.11 表 5:公司拥有多款大数据相关产品.13 表 6:公司海贝大数据管理系统与 Elasticsearch 搜索引擎产品对比.13 表 7:公司海贝大数据管理系统特点.14 表 8:公司基因专利检索云服务平台

21、产品可实现多种功能服务.16 表 9:Palantir 行业拓展时间表.18 表 10:Palantir Gotham平台应用工具.19 表 11:Palantir Foundry平台应用工具.19 表 12:Palantir 产品核心竞争力梳理.20 表 13:Palantir 公司典型客户与业务关系.22 表 14:知识图谱主流产品形态梳理.23 表 15:公司水晶球分析师平台产品优势.25 表 16:近期全国部委及各省市元宇宙专项政策.26 表 17:虚拟人应用领域、场景及角色.27 表 18:公司虚拟人技术应用场景及客户.28 表 19:公司 TRS 小思智能问答机器人功能及优势亮点.

22、30 表 20:公司拥有多款 SaaS产品.31 表 21:公司前五大股东明细(截至 2022H1).34 表 22:公司主要子公司主营业务布局.34 表 23:公司主要行业客户及覆盖情况.36 表 24:可比公司估值分析(Palantir、Elasticsearch).38 表 25:可比公司估值分析(科大讯飞、美亚柏科).39 表附录:三大报表预测值.40 拓尔思(300229)深度报告 http:/ 6/41 请务必阅读正文之后的免责条款部分 1 对标对标 Elasticsearch,公司搜索引擎数据库有望加速国产替代,公司搜索引擎数据库有望加速国产替代 1.1 大数据时代,搜索引擎数据

23、库迈入快速发展阶段大数据时代,搜索引擎数据库迈入快速发展阶段 1.1.1 搜索引擎数据库专注信息检索,解决大数据时代信息复杂关联问题搜索引擎数据库专注信息检索,解决大数据时代信息复杂关联问题 搜索引擎数据库是一类专门用于数据内容搜索的非关系数据库。搜索引擎数据库是一类专门用于数据内容搜索的非关系数据库。搜索引擎数据库使用索引对数据中的相似特征进行归类,并提高搜索能力。搜索引擎数据库经过优化,以处理可能很长、半结构化或非结构化的数据,它们通常提供专业的方法,例如全文搜索、复杂搜索表达式和搜索结果排名。表1:五类非关系型数据库对比 分类分类 模型模型 优势优势 劣势劣势 典型系统典型系统 搜索引擎

24、数据库搜索引擎数据库 倒排索引倒排索引 可处理半结构化与非结可处理半结构化与非结构化数据,检索效率构化数据,检索效率高,且支持复杂查询高,且支持复杂查询 Solr、Elasticsearch、海贝大数据平台海贝大数据平台 键值数据库 哈希表 查找速度快 数据无结构化,通常只被当做字符串或者二进制数据 Redis 列存储数据库 列式数据存储 查找速度快;支持分布横向扩展;数据压缩率高 数据插入效率偏低,按行的数据操作性能受限 HBase 文档型数据库 键值对扩展 数据结构要求不严格;表结构可变;不需要预先定义表结构 查询性能不高,缺乏统一的查询语法 MongoDB、CouchDB 图数据库 图结

25、构 针对关联关系的建模、操作非常高效 对高度结构化的数据处理能力不如关系型数据库 Neo4j、JanusGrapgh、Stellar DB 资料来源:清华大学人工智能研究院,浙商证券研究所整理 搜索引擎搜索引擎的的本质是根据用户的输入完成分词匹配。本质是根据用户的输入完成分词匹配。搜索是以 token 词为最基本的搜索单元,一个搜索语句经过搜索引擎的分词器会产生几个 token,利用分词去构建对应的倒排倒排索引索引,在用户搜索的时候,搜索对应的分词器分出的一个 token 时和索引中所存储的一个分词找到需要的文档。这种索引方式不需要去遍历所有的文档,而只需要遍历索引词,即可以满足对应的效果,大

26、大提高了搜索速度。图1:搜索引擎分布式索引哈希分片过程图 资料来源:一种智能搜索引擎的设计与实现,浙商证券研究所整理 目前国外厂商占据搜索引擎引擎数据库行业领先地位。目前国外厂商占据搜索引擎引擎数据库行业领先地位。目前全球范围内主要全文搜索引擎有:Lucene、Elasticsearch、Splunk、Solr。其中 Lucene 是一个开放源代码的全文检索拓尔思(300229)深度报告 http:/ 7/41 请务必阅读正文之后的免责条款部分 引擎工具包,不是一个完整的全文检索引擎,而是一个全文检索引擎的架构,ES和 Solr均基于此架构。根据 DB-Engines 的排名显示,Elasti

27、csearch 自 2016 年至今始终是最受欢迎的企业搜索引擎,其次是 Splunk 和 Solr。表2:全球数据库使用度排名(截至 2022年 11月)排名排名 厂商厂商 数据库类型数据库类型 得分得分 排名排名 厂商厂商 数据库类型数据库类型 得分得分 1 Oracle 关系型 1241.69 8 IBM Db2 关系型 149.56 2 MySQL 关系型 1205.54 9 Microsoft Access 关系型 135.03 3 Microsoft SQL Server 关系型 912.51 10 SQLite 关系型 134.63 4 PostgreSQL 关系型 623.16

28、 14 Splunk 搜索引擎 94.23 5 MongoDB 分布式文件存储 477.90 24 Solr 搜索引擎 51.33 6 Redis 键值数据库 182.05 48 OpenSearch 搜索引擎 10.30 7 Elasticsearch 搜索引擎搜索引擎 150.32 57 Algolia 搜索引擎 7.83 资料来源:DB-Engines,浙商证券研究所整理 1.1.2 搜索引擎以全文检索技术搜索引擎以全文检索技术为核心,未来满足多样化应用需求为核心,未来满足多样化应用需求 全文检索技术是搜索引擎数据库的技术源头。全文检索技术是搜索引擎数据库的技术源头。计算机的索引程序通过

29、扫描源文本中的每一个词,对每个词构建索引,并指出该词在源文本中出现的次数和出现的位置,当用户检索数据时,计算机检索程序对预先构建好的索引文件来进行查找,并把检索的结果反馈给用户的检索方式。全文检索的核心技术通常包括索引建立和索引检索两个功能:(1)索引索引建立:建立:索引是指扫描源文档后建立索引文件。首先将不同格式的文档数据进行格式化,抽取其中的文本文件,然后把每一个不同的字符都保存为一个字表,并且记录下相同的字在文档中出现的所有位置。(2)检索检索检索:检索:指基于预先构建的索引文件的位置匹配。全文搜索引擎通常由五部分组成全文搜索引擎通常由五部分组成:数据采集数据采集、数据处理数据处理、数据

30、索引、数据搜索和用户数据索引、数据搜索和用户接口。接口。在结构方面,全文检索系统的核心应该具备文本分析引擎、索引引擎、查询引擎、对外接口和外层应用系统。在功能方面,全文检索系统应该具备索引建立、增量索引、索引优化、查询结果返回等功能,外层则应有各种不同的应用。图2:全文搜索引擎工作原理 图3:全文检索系统的基本结构与功能 资料来源:大数据搜索引擎原理分析,浙商证券研究所整理 资料来源:大数据搜索引擎原理分析,浙商证券研究所整理 拓尔思(300229)深度报告 http:/ 8/41 请务必阅读正文之后的免责条款部分 目前全文检索技术主要发展方向体现在以下几个方面目前全文检索技术主要发展方向体现

31、在以下几个方面:(1)智能检索:智能检索:传统的全文检索是基于关键词进行匹配,常出现查全率和查准率不高的问题。在信息量呈爆炸式增长的大数据时代,利用关键词匹配的全文检索存在很大的局限性。智能检索技术中,除了分词词典外还包括同音词典、同义词典、相关级词典等,能够形成一个较完整的概念网络和知识体系,提供较为智能的知识提示。(2)数据挖掘同信息检索技术相结合:数据挖掘同信息检索技术相结合:数据挖掘则主要包括分类、聚类自动摘要和相似性查询等方面,帮助用户更好地发现、组织和表示信息,通过提取知识来满足更高层次的检索需求。自动摘要技术可自动地从原始文献中摘取文章摘要,帮助用户快速对检索结果进行相关度评价;

32、相似性检索根据文档内容特征来对与之相关或者相似的文档进行检索,可用于去重分析和用户个性化反馈。(3)垂直领域数据库:垂直领域数据库:目前通用搜索引擎很难收集全所有主题的网络信息且成本较高,对于专业性要求更高的主题难以做到精确搜索。因此垂直主题的搜索引擎以其高度的目标化和专业化在各类搜索引擎中占据了一席之地。(4)分布式全文检索技术分布式全文检索技术:分布式系统的本质就是网络互连的多个服务器共同处理某些任务。传统的集中式全文检索系统已经不能满足大容量数据的存储需求,数据量和访问量的爆发式增长对系统的高效率和扩展性提出了更高的要求,仅仅依靠单台服务器运行的检索服务已经很难满足要求。因此,为了提高检

33、索效率,企业为了节省成本普遍选择通过机器组成分布式集群来满足服务器的性能要求。搜索引擎数据库潜在市场规模搜索引擎数据库潜在市场规模约约 450 亿美元,发展空间广阔。亿美元,发展空间广阔。根据 IDC 测算,2022 年全球搜索引擎数据库的市场规模约为 450亿美元,其中搜索系统、内容分析和认知/AI 软件平台的市场规模约 80亿美元;IT 运营管理约 90亿美元;大数据和分析软件(高级预测分析、空间和位置分析、非关系分析数据存储、分析数据的集成和完整性)约 230亿美元;安全分析(安全信息和事件管理、政策和合规、取证和事件调查)约 50亿美元。图4:2022年全球搜索引擎数据库各细分市场规模

34、(单位:亿美元)资料来源:IDC,浙商证券研究所整理 拓尔思(300229)深度报告 http:/ 9/41 请务必阅读正文之后的免责条款部分 1.2 美国美国 Elasticsearch 为搜索引擎数据库龙头,应用场景丰富为搜索引擎数据库龙头,应用场景丰富 Elasticsearch(ES)是一个伴随着大数据存储以及快速检索的需求所产生的分布式、可扩展、实时的搜索与数据分析引擎。ES使用 Lucene 搜索库作为其核心,又同时避免了Lucene 复杂的操作方式,能够存储结构化和非结构化的大数据,并且实现对其存储数据的全文检索,速度达到毫秒级。它还包括了结构化搜索、数据分析、复杂语言处理、对象

35、间关联关系等内容,可以通过数据建模在生产环境中配置和监视大数据集群。其特色包括:1)分布式的文件实时存储工具,并且保证每个字段都能被索引和检索;2)分布式的实时搜索引擎,并具备数据实时分析功能;3)可拓展到上百台服务器,处理PB 级别的结构化或非结构化数据。图5:Elasticsearch 产品应用场景 资料来源:阿里云开发者社区,浙商证券研究所整理 非结构化数据量的爆发式成长,叠加信息检索准确度需求增加,驱动非结构化数据量的爆发式成长,叠加信息检索准确度需求增加,驱动 Elasticsearch 业业务快速成长。务快速成长。从数据结构角度看,web2.0 时代非结构化数据量的爆发拉动了对非关

36、系型数据库需求,极大提高了系统对数据库高并发读写、可扩展性和高可用性的要求。此外,在对海量数据存储和访问效率上方面,传统的关系型数据库也难以满足需求。根据浪潮信息数据,非结构化数据自 2015 年开始呈几何倍数增长,包括 HTML、JSON、文档、图片、音视频等形式,预计未来还将加速爆发。图6:半/非非结构化数据量爆发式成长 资料来源:浪潮信息企业互联网化下的数据平台升级,浙商证券研究所整理 拓尔思(300229)深度报告 http:/ 10/41 请务必阅读正文之后的免责条款部分 Elasticsearch 在信息检索性能上相比在信息检索性能上相比数据库自身的搜索功能数据库自身的搜索功能优势

37、显著优势显著。功能上,数据库的首要目的是存储数据,其自身的模糊搜索功能没有索引,无法实现对搜索词的逻辑及范围搜索,因此无法对查询条件进行延伸分析。而对于搜索引擎和搜索引擎数据库来说,全文检索才是目的,因此其更关注信息搜集和关联等能力,灵活度也更高,在检索时无需精确的数据结构,可以对查询条件进行延伸解析,比如近义词和联想等功能。表3:数据库与搜索引擎的特点对比 数据库数据库 搜索引擎搜索引擎 核心目标 数据存储 全文检索 查询条件 对关键词没有限制,但需要明确的数据结构 关键词一般数目有限但无需十分精确,对输入的文档会进行分词,不需要明确数据结构 检索方式 全表扫描 需要索引,以倒排索引方法为主

38、 查询速度 取决于数据库大小和数据读取速度,时间从几秒到几分钟不等 非常快,秒级 搜索结果 实时性更好;无法对检索条件进行近义词分析和联想 因为有创建索引的过程,实时性不如数据库及时;会对查询条件进行延伸解析 资料来源:Github,浙商证券研究所整理 目前,Elasticsearch 实时全文搜索引擎框架已经被广泛使用。GitHub 使用 Elasticsearch 对超过 1300 亿行的源码进行检索,并且用户量和数据量还在持续增长;维基百科使用 Elasticsearch 对 PB 级数据实现了全文检索、高亮展示关键词、针对输入的关键词进行搜索建议等功能;英国卫报使用 Elasticse

39、arch 来处理海量访客日志,并实时把公众对文章的看法反馈给编辑;StackOverflow 通过使用 Elasticsearch 把全文搜索、地理位置和其他相关信息进行结合,实现 more-like-this 功能。图7:阿里云 Elasticsearch 日志数据查询界面 图8:Elastic监测工具 Kibina界面 资料来源:阿里云,浙商证券研究所整理 资料来源:Elasticsearch官网,浙商证券研究所整理 拓尔思(300229)深度报告 http:/ 11/41 请务必阅读正文之后的免责条款部分 1.3 搜索引擎数据库国产替代进程加速,公司行业积累深厚产品优势显著搜索引擎数据库

40、国产替代进程加速,公司行业积累深厚产品优势显著 1.3.1 数据安全要求加速数据库国产替代,公司数据安全要求加速数据库国产替代,公司 G端客户比例较高有望率先受益端客户比例较高有望率先受益 数据库是我国信创重点,数字安全法出台将加速国产替代。数据库是我国信创重点,数字安全法出台将加速国产替代。2021 年是我国数据安全的政策元年,2021 年 9 月我国第一部数据安全的专门立法数据安全法正式出台,个人信息保护法于同年 11 月起正式施行。从国家层面,未来各监管部门将加大对数据安全监管力度。从企业层面,数据安全责任也将从过去被动地接受机构风险监督,逐渐转向主动合规建设。根据 Gartner 报告

41、,数据库的高技术壁垒导致 Oracle、IBM、微软等海外大厂长期霸占数据库市占率排行的前几名,我国数据库产品的市占率虽然在过去十几年间有了大幅提升,但仍然于海外大厂产品有着较大差异,国产化率相对较低,属于重点关注领域。表4:我国数据安全相关政策梳理 发布时间发布时间 数据安全政策文件数据安全政策文件 政策内容摘要政策内容摘要 2022.04 电力可靠性管理办法(暂行)自 2022年 6月 1日起施行,办法新增“第七章 网络安全“专章,并重点提出了网络安全防护、网络安全监测、风险评估、隐患排查治理、网络安全责任落实等电力行业网络安全相关要求。2022.04 工业互联网专项工作组2022年工作计

42、划 从夯实基础设施、深化融合应用、强化技术创新、培育产业生态、提升安全保障、完善要素保障等方面,提出了网络体系强基、标识解析增强、平台体系壮大、数据汇聚赋能、新型模式培育、融通赋能“举手”等 15大类任务 83项具体措施。2021.12 网络安全审查办法 掌握超过 100万用户个人信息的网络平台运营者赴国外上市,必须要向网络安全审查办公室申报网络安全审查。2021.12 互联网信息服务算法推荐管理规定 旨在规范互联网信息服务算法推荐活动,维护国家安全和社会公共利益,保护公民、法人和其它组织的合法权益,促进互联网信息服务健康发展。2021.08 汽车数据安全管理若干规定(试行)为了规范汽车数据处

43、理活动,包括汽车设计、生产、销售、使用、运维等过程中的涉及个人信息数据和重要数据进行安全监管,保护个人、组织的合法权益,维护国家安全和社会公共利益,促进汽车数据合理开发利用。2021.08 中华人民共和国个人信息保护法 为了保护个人信息权益,规范个人信息处理活动,促进个人信息合理利用,根据宪法,制定本法。个人信息是以电子或者其他方式记录的与已识别或者可识别的自然人有关的各种信息,不包括匿名化处理后的信息。2021.08 儿童个人信息网络保护规定 鼓励互联网行业组织指导推动网络运营者制定儿童个人信息保护的行业规范、行为准则等,加强行业自律,履行社会责任。2021.07 关键信息基础设施安全保护条

44、例 对事关国计民生、涉及大规模数据的重要领域的信息基础设施加强安全保护 2021.06 中华人民共和国数据安全法 为了规范数据处理活动,保障数据安全,促进数据开发利用,保护个人、组织的合法权益,维护国家主权、安全和发展利益,制定本法。资料来源:公司年报,浙商证券研究所整理 公司政府客户比例高且信息敏感度高,有望率先受益于国产化需求。公司政府客户比例高且信息敏感度高,有望率先受益于国产化需求。从 1985年开始,公司前身依托自身在中文检索领域的专业优势便开始为人民日报社提供新闻资料检索系统服务;公司于 1995年搭建了数据库服务器并开始为新华社服务。公司公司的检索产品很早的检索产品很早完成了政府

45、客户的验证流程,具备了先发优势。完成了政府客户的验证流程,具备了先发优势。公司自 04 年开始,陆续为国家知识产权局、国宝局等优质国家机构提供企业搜索服务,并且开始覆盖金融、能源、公共安全等涉密领域,涉及公安、军工客户。2021 年公司政府及公共安全业务收入占比达到 58.81%。公司深耕语义智能赛道,处于行业领先者地位。公司深耕语义智能赛道,处于行业领先者地位。根据 IDC 数据显示,2021 年我国语音语义市场规模达 21.7 亿美元,其中科大讯飞占据 13.7%的市场规模位居第一。公司以 2.9%的市场份额占比位居第四,考虑语义智能相比于语音智能,结合了语言理解、知识获取等更高级别的人工

46、智能技术,未来发展空间广阔。拓尔思(300229)深度报告 http:/ 12/41 请务必阅读正文之后的免责条款部分 图9:2021年公司营业收入分行业占比结构 图10:2021年中国智能语音语义市场份额 资料来源:公司年报,浙商证券研究所整理 资料来源:IDC中国,浙商证券研究所整理 自然语言处理市场预计未来几年内保持高增长速度,到自然语言处理市场预计未来几年内保持高增长速度,到 2030 年是市场规模有望突破年是市场规模有望突破2000 亿。亿。随着 NLP 技术在金融、政务、教育、医疗等诸多行业应用落地的加速,预计未来中国 NLP 市场规模将加速成长。根据赛迪研究院预测,2022年相关

47、市场规模约为 174.5 亿元,并在未来几年内保持约 36.5%的复合增长率,预计到 2030 年,我国 NLP 市场规模将突破 2000亿,达到 2105 亿元。图11:2022-2030年中国 NLP 市场规模与增长预测 资料来源:赛迪研究院,浙商证券研究所整理 1.3.2 公司实现搜索引擎数据库核心技术自主可控,满足信创和国产化替换需求公司实现搜索引擎数据库核心技术自主可控,满足信创和国产化替换需求 公司信创生态完备,数据库核心技术自主可控。公司信创生态完备,数据库核心技术自主可控。公司多次被大数据相关产业联盟评为领军企业,深度参与到中国数据库标准制定。产品方面,公司海贝数据库是目前国内

48、少有从底层数据收集,到分词和索引算法,以及储存技术的国产数据库引擎。其核心代码自主率达到 100%,且通过多家国家机构认证,可彻底摆脱对 Elasticsearch 和 Lucene 等国外数据库的技术依赖。拓尔思(300229)深度报告 http:/ 13/41 请务必阅读正文之后的免责条款部分 表5:公司拥有多款大数据相关产品 类别类别 产品产品 功能功能 主要客户主要客户 大数据-通用产品 TRS 海贝大数据管理系统 全文检索引擎(可实现图文检索)信用中国、国家市场监督管理总局、公安部等 TRS 网络信息雷达系统 大数据采集 中央办公厅、中宣部、国家统计局、农业银行、中石油等 TRS 分

49、布式数据整合系统 大数据治理整合 大数据-行业专用产品 TRS 海云-集约化智能门户平台 政府集约化智能门户平台 中央人民政府门户网站、外交部全球网站群、首都之窗等 TRS 海融-智能媒体融合平台 智能媒体融合 经济日报、浙江日报、新疆日报、西藏网、中国建筑集团、航空工业集团等 数据安全产品 数据安全交换产品,数据安全分析产品 数据传输与交换的安全与分析 公安部、人民银行、工商银行、海关总署等 资料来源:公司年报,浙商证券研究所整理 在大数据领域,拓尔思突破异构数据对大数据搜索引擎的限制,为索引数据加密提供全方位安全保障,实现 了文本、图像特征、二进制的统一索引和跨数据类型跨语言的检索,并采取

50、最新的集群技术提高了 可支持的数据规模和多用户并发检索性能,为数据安全和信创领域应用提供全面保障。2021 年公司 基于技术突破迭代创新推出了 TRS 海贝大数据管理系统 V9.0、TRS 数据中台等核心产品。同时公司 研发完成了面向云原生支撑的技术中台和 AI 驱动的数据中台,推出了 TRS 数星智能风控大数据平台、TRS 数家开放服务平台、TRS 网察大数据分析平台等 SasS 数据智能服务平台产品。表6:公司海贝大数据管理系统与 Elasticsearch 搜索引擎产品对比 海海贝贝 Elasticsearch 数据规模 亿万亿 亿百亿 并发支持 可伸缩 较强 分词器 单一分词器处理全语

51、种 多语种支持(分别处理)查询语法 Lucene语法/TRS语法 支持段句位等专业表达式 Lucene语法/JSON 图像检索 支持 不支持 易用性 全中文可视化数据管理后台 Kibana 冷热分区 支持 不支持 读写分离 支持 不支持 访问隔离 支持 不支持 数据加密 支持,并支持国产加密卡 不支持 安全控制 支持 不支持 资料来源:公司官网,浙商证券研究所整理 公公司司海贝海贝大数据搜索引擎产品在自主可控、数据安全、综合能力等层面均具备显著优大数据搜索引擎产品在自主可控、数据安全、综合能力等层面均具备显著优势势。产品支持所有数据类型,功能完备,安全可靠,兼容 ES常用接口,对接主流生态,具

52、备良好的产品力,未来有望在信创浪潮下实现国产化平滑替代。拓尔思(300229)深度报告 http:/ 14/41 请务必阅读正文之后的免责条款部分 表7:公司海贝大数据管理系统特点 特点特点 具体描述具体描述 自主可控 海贝是目前国内少有的从底层分词算法到全文搜索引擎,以及上层系统都完全自研的纯国产搜索引擎数据库,已完成与龙芯、海光、飞腾等国产芯片以及中标麒麟、统信 UOS等国产操作系统的适配工作,完全满足信创要求和国产化替换需求。数据安全 海贝采用多副本机制解决数据的可用性问题,通过数据校验以及 WAL技术解决数据的完整性问题,通过完善的权限管理机制、HTTPS、加密存储等机制解决数据访问和

53、数据存储的机密性问题。加密可以配合国产加密卡达到金融级数据安全,还具有黑白名单、用户隔离、删除保护等安全机制。综合能力 海贝对系统资源的使用更加合理可控,复杂搜索响应性能更优,不会出现因为数据索引、超长表达式检索、通配符检索等操作导致系统无法响应的情况。海贝提供了更加专业的段句位检索、XML检索,支持度量衡数据的数值区间检索等高级功能。生态兼容 海贝具有高度开放性,不仅兼容 ES常用接口,还可对接 Hadoop、Spark/SparkSQL、OpenStreetMap等。资料来源:公司官网,浙商证券研究所整理 1.4 公司持续延伸大数据业务新场景,知识产权业务有望贡献新增量公司持续延伸大数据业

54、务新场景,知识产权业务有望贡献新增量 1.4.1 专利处理需求快速成长创造专利代理市场广阔空间,专利处理需求快速成长创造专利代理市场广阔空间,NLP 技术应用前景可期技术应用前景可期 国家政策层面支持发展知识产权行业,中国专利申请量持续成长。国家政策层面支持发展知识产权行业,中国专利申请量持续成长。2021 年国家提出“知识产权强国战略”,力图实现从“中国制造”到“中国创造”的创新驱动转型。通过知识产权强国建设纲要(2021-2035)以及“十四五”国家知识产权保护和运用规划等纲领性文件,未来中国知识产权发展将致力于实现知识产权“得到更好保护”、“形成更好市场价值”、“发挥更强经济支撑”、“具

55、备更强影响力”的发展目标,成为真正的“知识产权强国”。中国专利申请量于 2011年跃居全球第一,并在近几年内保持快速增长态势,2021年中国专利申请量达到 495.7 万件,2008-2021 年间复合增长率达到 18%。根据世界知识产权组织数据,中国 2020 年发明、实用新型和外观这三项专利的申请总量分别达到 149.71 万件、292.7 万件和 77.0 万件,同比增长 6.9%、29.0%和 8.3%,均显著高于全球增速。预计未来几年中国专利数量仍将保持快速增长,并将成为拉动经济增长不可或缺的力量。图12:中国专利申请量持续高速增长 资料来源:智慧芽2022中国支持产权年度调研报告,

56、浙商证券研究所整理 拓尔思(300229)深度报告 http:/ 15/41 请务必阅读正文之后的免责条款部分 专利申请数量快速成长拉动知识产权代理市场需求。专利申请数量快速成长拉动知识产权代理市场需求。知识产权代理是指代理当事人处理知识产权事务的行为,主要包括国内外专利代理和商标代理、版权登记代理。专利代理的业务范围包括专利申请、专利诉讼、专利战略布局、专利咨询等方面的业务内容。国家政策支持叠加制度不断完善,知识产权国家政策支持叠加制度不断完善,知识产权代理业务迅速发展。代理业务迅速发展。根据共研网数据统计显示,2021 年中国支持产权代理行业市场规模约为 511.89 亿元,并预计 202

57、2 年市场规模将超过 600亿元,未来将伴随着知识产权市场的成长而保持较快增长态势。图13:2011-2022年中国知识产权代理市场规模统计及预测 资料来源:共研网,浙商证券研究所整理 专利代理机构数量快速增长。专利代理机构数量快速增长。国家知识产权局数据统计显示,截至 2021 年底,我国专利代理机构数量达到 3934家(不含港澳台地区),执业专利代理师达 26840 人,行业发展势头迅猛。专利为各科技创新赛道提供高情报价专利为各科技创新赛道提供高情报价值,值,专利信息检索专利信息检索查询创造新需求。查询创造新需求。在生物、新材料、新能源等高新科技领域,企业依赖专利情报所提供的重要价值,专利

58、工作支撑企业研发创新成为近年来专利工作的重要价值探索。对于专利代理机构来说,专利服务涉及专利信息的检索、匹配等工作,NLP 技术可讲传统专利数据库中的非结构化信息转化为结构化数据,可大幅提升知识产权服务的效率提升和质量提高。图14:中国专利代理机构数量快速增长 图15:各行业对专利提供“研发情报价值”态度 资料来源:国家知识产权局,浙商证券研究所整理 资料来源:智慧芽2022中国支持产权年度调研报告,浙商证券研究所 拓尔思(300229)深度报告 http:/ 16/41 请务必阅读正文之后的免责条款部分 1.4.2 公司布局专利搜索引擎赛道,基因专利检索云服务平台有望赋能行业效率提升公司布局

59、专利搜索引擎赛道,基因专利检索云服务平台有望赋能行业效率提升 公司自主研发公司自主研发基因专利检索云服务平台基因专利检索云服务平台,为生物技术发展创新提供有力支撑。,为生物技术发展创新提供有力支撑。公司联合知识产权出版社,基于生物技术领域产业发展及用户需求,在强化搜索引擎技术与数据资源优势基础上,研发能够提供序列检索与基因专利检索的 SaaS云服务系统。平台涵盖全球 40 多个国家和组织的生物序列相关专利数据及 32个公共资源库,通过对区域创新趋势和区域头部专利申请人的分析,帮助用户识别潜在的创新者和未来可能合作的重要伙伴。公司可实现基因专利信公司可实现基因专利信息的结构化处理和检索结果呈现,

60、大幅提升专利服务效率。息的结构化处理和检索结果呈现,大幅提升专利服务效率。公司基因专利检索云服务平台可实现基因序列检索、专利检索、序列检索结果、序列比对等多项功能,支持融合检索及图形展示,在帮助用户分析行业发展趋势、辅助生物医学技术创新、领域研究新方向研判等场景均具备广阔应用前景。表8:公司基因专利检索云服务平台产品可实现多种功能服务 产品功能产品功能 功能描述功能描述 基因序列检索 支持五种检索策略,可通过调整检索条件、序列条件、专利条件和算法条件,实现精准检索。基因专利检索 支持通过专利申请号、公开号、分类号和关键词实现一键检索基因专利数据;支持二次检索和检索结果收藏。序列搜索结果 检索结

61、果展示序列相关专利的申请号、序列号、发明专利、序列描述、相似度信息,支持序列查看、收藏、图形展示和下载。序列详览 支持查看基因专利著录项目、权利要求、说明书、专利全文 PDF以及序列文件。序列比对 在序列检索界面即可实现序列比对的功能。常用工具 提供多种生物序列转换工具,包括中文氨基酸转换、DNA序列清理、EMBL格式转换为 FASTA格式等。检索历史 可进行检索追溯和分析,并支持分别查看序列检索和专利检索。资料来源:公司宣传材料,浙商证券研究所整理 公司基于公司基于 NLP 核心技术积累,未来有望向专利检索领域更多细分场景延伸。核心技术积累,未来有望向专利检索领域更多细分场景延伸。除基因之外

62、,高端制造、新能源、新材料等领域专利信息检索均存在信息非结构化、专业程度高,数据挖掘和分析难度大的特征,公司在自然语言处理领域具备技术优势,未来有望基于在基因领域的产品研发经验积累,向更多细分场景延伸。拓尔思(300229)深度报告 http:/ 17/41 请务必阅读正文之后的免责条款部分 2 知识图谱引导认知智能发展,对标知识图谱引导认知智能发展,对标 Palantir 公司成长空间广阔公司成长空间广阔 2.1 坚持坚持“语义智能语义智能+”为核心战略为核心战略,公司公司 AI 产品应用空间广阔产品应用空间广阔 AI 正处于弱人工智能向强人工智能发展阶段,核心为认知和理解能力的提正处于弱人

63、工智能向强人工智能发展阶段,核心为认知和理解能力的提升,升,NLP和和 CV 为两大发展方向。为两大发展方向。目前 AI 发展处于弱人工智能阶段,在设计的程序范围内决策并采取行动,不具备独立意志且应用场景延伸性较差,代表性的有 AlphaGo(围棋领域)、Siri(语音对话)等;强人工智能则是指具有独立意志,能在设计的程序范围外自主决策并采取行动的人工智能,能帮助人们综合多方信息进行判断决策,真正提升人类的工作效率,代表性的有通用机器人、高级别自动驾驶等。语言和感知是人类思维认知的基础,也是语言和感知是人类思维认知的基础,也是 AI 发展的两大核心内容。发展的两大核心内容。目前 AI发展有五大

64、核心内容,即计算机视觉、机器学习、自然语言处理、机器人和语音识别,分别对标人类的感知、思维、语言理解、运动控制和交互这五大维度。目前国内外厂商在 AI 各方向上均取得持续进展,未来有望打开商业化空间。图16:弱人工智能和强人工智能的对比 资料来源:CSDN,浙商证券研究所整理 公司专攻语义智能赛道,是国内最早从事自然语言处理(公司专攻语义智能赛道,是国内最早从事自然语言处理(NLP)研发的企业之)研发的企业之一一,核核心竞争力显著。心竞争力显著。公司所专注的语义智能位于人工智能中的认知智能领域,即让计算机来理解人类语言或其他符号表面数据内含的确切意义,提取出信息或知识,进而进行推理、分析、决策

65、,达到、接近或者超过人类的智慧水平。2.2 对对标美国标美国 Palantir,从市场规模和产品边际贡献率出发看公司成长空间,从市场规模和产品边际贡献率出发看公司成长空间 2.2.1 业务从业务从 G端向端向 B 端延伸,稳步发展成为知识图谱领域独角兽端延伸,稳步发展成为知识图谱领域独角兽 美国美国 Palantir(帕兰提尔)(帕兰提尔)公司,专注于大数据分析,客户从公司,专注于大数据分析,客户从 G端政府部门延伸到端政府部门延伸到 B端企业,逐步成长为细分赛道巨头。端企业,逐步成长为细分赛道巨头。Palantir 成立于 2003 年,专注于大数据分析并以此为核心,通过深入分析用户业务结构

66、,将海量数据有机结合并挖掘数据中的价值,为决策者提供决策依据。公司分别于 2008 年和 2016 年,发布数据平台 Palantir Gotham和 Palantir Foundry,分别面向公司的政府端客户和商业客户提供图分析服务。拓尔思(300229)深度报告 http:/ 18/41 请务必阅读正文之后的免责条款部分 图17:Palantir公司发展历程 资料来源:Palantir公司官网,浙商证券研究所整理 公司发展路线清晰,“公司发展路线清晰,“G端端-大大 B-小小 B”战略成效显著。”战略成效显著。Palantir 最初为美国情报部门开发软件,以协助反恐调查和行动,客户主要为国

67、土安全部、国家安全局、联邦调查局等政府部门,而后公司逐步从 TO G 向 TO B 拓展,客户涵盖金融、医疗、传媒等众多行业,其中不乏空中客车、可口可乐、摩根大通等全球行业巨头。表9:Palantir行业拓展时间表 年份年份 政府端政府端 商业领域商业领域 2008年 法律、国防、政务决策 2009年 能源 银行 2010年 公共卫生 2011年 社会公平 石油、天然气 2012年 行政管理 2013年 金融监管 投资、食品生产、保险、媒体、制药 2014年 IT服务 2015年 零售 2016年 汽车、航空航天 2017年 航运、通信 2018年 海关 化学制品、道路/铁路建设、家居产品 2

68、019年 交通运输、财政事务 软件服务、工业集团、专业服务、电力、矿业 资料来源:Palantir公司招股说明书,浙商证券研究所整理 公司以公司以 Gotham和和 Foundry 两大平台为核心,持续完善行业解决方案,构建完整业务两大平台为核心,持续完善行业解决方案,构建完整业务生态版图。生态版图。公司基于 Gotham和 Foundry两大产品线拥有十余种解决方案,且两大平台分工明确,Gotham面向政府客户,而 Foundry以商业客户为主。Gotham大数据分析平台建立真实世界事物特征及彼此联系,深度应用到国防、安大数据分析平台建立真实世界事物特征及彼此联系,深度应用到国防、安保、反恐

69、等政府端事物领域。保、反恐等政府端事物领域。Gotham的运行以多源数据为起点,包括结构化的数据(日志、财务数据报表、电子表格等)和非结构化数据(视频、邮件、文件、图片等)。Gotham可以对这些源数据进行建模,将多个数据源整合成简洁、一致的数据。传统数据建模通常围绕表单中静态的行和列展开,这种做法其实对于操作人员对数据在实际场景中的理解和应用并不友好。Gotham的厉害之处在于它在建模时已经运用了真实拓尔思(300229)深度报告 http:/ 19/41 请务必阅读正文之后的免责条款部分 世界的现实事物的特征和彼此间的联系,如“人群”、“组织”等,这便大大提高了建模的灵活性,使模型有了实际

70、意义。Gotham可以将用户数据更新实时同步,将用户行为自动记录、归因分析并存储,形成“动态本体”。表10:Palantir Gotham平台应用工具 应用工具应用工具 主要功能主要功能 Graph 将数据可视化,用户可以创建、编辑数据,解析重复的对象,支持时间分析 Gaia 共享实时地图,跟踪实时数据,以便团队协同和情报收集 Dossier 实时写作文件编辑器,可以实时协作以共享文件和发现情报 Stencil 结构化的表单输入工具,支持协作数据输入和报告创作 Video 支持用户查看视频素材,并使用地理空间信息等叠加来增强原始素材 Table 交互式的自上而下的分析应用程序,可针对大型、弱信

71、号、基于时间的数据集提供灵活的搜索功能 Ava AI 系统,可扫描数十亿个数据点,帮助研究人员发现数据的模式和联系 Forward 一种特殊配置,可以在不稳定的网络环境中支持操作的连续性 Mobile 可以通过移动设备将 Gotham带到现场,以提供对实时分布式操作的支持,包括通过 IOS或安卓系统归档现场报告、上传视频等 资料来源:Palantir公司官网,浙商证券研究所整理 Palantir Foundry 起步于金融欺诈识别服务,功能模块不断扩展,应用场景日渐丰起步于金融欺诈识别服务,功能模块不断扩展,应用场景日渐丰富。富。Palantir Foundry前身为 Palantir Met

72、ropolis,最初面向企业客户尤其是金融行业的欺诈行为识别需求,后续业务逐渐拓展至 36 个行业,可以连接到企业数据、专业数据和公共数据集,实现数据集成、信息管理和定量分析,并发现趋势、关系和异常情况并进行预测。在后端平台,Foundry将多个来源的结构化数据整合到连贯的模型中,并对模型执行复杂计算,同时共享和迭代分析产品;在前端应用程序,它提供了一套集成的应用程序,让用户可以建立交互。表11:Palantir Foundry平台应用工具 应用工具应用工具 主要功能主要功能 Monocle 用户可以通过图形界面理解和管理 Foundry中的数据沿袭、跟踪数据运行状况等 Contour 用户通

73、过 Contour的点击界面回答分析性问题,并发布结果报告 Object Explorer 允许用户与用工厂、其它客户等表示的数据进行交互,搜索索引数据并浏览这些对象之间的连接 Fusion 电子表格环境,用户可以创建新的数据集并生成融合工作表等 Workshop 应用程序构建器,用户可以在低代码、无代码的环境中构建可读可写数据的交互式工作流 Vertex 机构供应链的虚拟化引擎,用户可以模拟并更改执行“假设分析”Code Authoring 用户可以使用自己选择的编程语言编写数据转化代码,并使用分布式版本控制进行协作 Quiver 多维制图应用程序,用于分析超大时间序列数据集 AI/ML 显

74、示模型关键信息,包含绘图、参数、验证统计阶段等,提供历史数据 Code Workbooks 高级分析和数据科学组件,可以编写代码并可视化其分析结果图 Reports 允许用户发布其工作,该文档随基础数据的变化而动态更新 资料来源:Palantir公司官网,浙商证券研究所整理 拓尔思(300229)深度报告 http:/ 20/41 请务必阅读正文之后的免责条款部分 从 Palantir的产品可以归纳出,公司的核心优势在于对实际业务场景和数据(包含结构化和非结构化数据)逻辑的理解更深入,公司用过底层的数据关联推理和知识图谱构建,突破了人工智能在垂直领域间的壁垒,真正意义上打通了数据“上下游”之间

75、的关系。表12:Palantir 产品核心竞争力梳理 核心竞争力核心竞争力 优势描述优势描述 大数据架构 构建敏捷的大数据架构,数据规模可扩展,具有实时性和灵活性 数据整合与存储 多领域、多维度的数据整合及关联存储,可抽象出各类数据资源间关联关系 数据分析 模型动态且可针对不同场景快速定制 可视化 面向人机共生,通过构建全局分析链,将人的决策和大数据技术进行深度融合 资料来源:Palantir公司官网,浙商证券研究所整理 2.2.2 营收规模持续成长,边际贡献率升高彰显产品化能力营收规模持续成长,边际贡献率升高彰显产品化能力 Palantir 年营收能力持续成长,毛利率稳中有升,支撑百亿美元市

76、值。年营收能力持续成长,毛利率稳中有升,支撑百亿美元市值。Palantir 在 2022年 H1 实现营业收入 9.19亿美元,20182021 年营业收入实现约 37.23%的复合增长率,公司在业务成长的过程中毛利率稳中有升,2022 年上半年毛利率达到 78.61%,截至 2022年11月 18 日,公司总市值达 185亿美元。图18:Palantir 2018-2022H1营业收入及毛利率 图19:Palantir2018-2022H1毛利率 资料来源:Wind,浙商证券研究所整理 资料来源:Wind,浙商证券研究所整理 边际贡献率持续提升,边际贡献率持续提升,Palantir 公司产品

77、化能力不断提升。公司产品化能力不断提升。Palantir 在历次公司财报中将“边际贡献率”(Contribution Margin)作为公司的重要经营指标。边际贡献率定义为“收入减去收入成本(Cost of Revenue)、营销费用(剔除股权激励后)之后与收入的比值”。边际贡献率的提升反映出公司软件产品的前期部署流程的优化,客户的使用门槛也边际贡献率的提升反映出公司软件产品的前期部署流程的优化,客户的使用门槛也将降低,这将极大地有利于公司软件产品规模化扩张的能力。将降低,这将极大地有利于公司软件产品规模化扩张的能力。Palantir 业务边际贡献率接近业务边际贡献率接近 60%,公司产品化能

78、力优势显著。,公司产品化能力优势显著。Palantir 产品边际贡献率在 2019Q3至 2020Q4 实现快速增长,从 15%提升至 61%。公司产品化能力不断提升,有助于降低产品部署的可变成本,利于新客户拓展及公司业务向新垂直行业场景渗透。拓尔思(300229)深度报告 http:/ 21/41 请务必阅读正文之后的免责条款部分 图20:2019Q1-2022Q3 Palantir产品边际贡献率 图21:拓尔思营业收入剔除营业成本及销售费用后余值占比 资料来源:Palantir公司财报,浙商证券研究所整理 资料来源:拓尔思公司财报,浙商证券研究所整理 对比对比 Palantir,拓尔思产品

79、化仍有成长空间。,拓尔思产品化仍有成长空间。由于 Palantir 与拓尔思财务准则上存在不一致,我们选择营业收入减去营业成本及销售费用后的余值再除以营业收入作为参考指标。经计算,公司 2018-2021 年这一指标从 41.00%上升至 50.62%,考虑往年第四季度属于公司业绩集中确认期,预计 2022 该指标较去年仍有提升。我们认为随着公司产品我们认为随着公司产品 SaaS 化化的持续推进,公司产品的规模化盈利能力将不断增强的持续推进,公司产品的规模化盈利能力将不断增强。2.2.3 业务潜在规模广阔,政府业务潜在规模广阔,政府+商业端客户双轮驱动打开成长空间商业端客户双轮驱动打开成长空间

80、 产品潜在市场规模超千亿,政府与商业客户发展并驾齐驱。产品潜在市场规模超千亿,政府与商业客户发展并驾齐驱。据 Palantir 估计,2020年公司软件在全球商业领域和政府部门的总潜在市场规模(TAM)约为 1190 亿美元,其中商业领域的 TAM 约为 560 亿美元,政府部门领域的 TAM 约为 630 亿美元,而在政府部门领域,公司预计美国政府部门和国际政府部门的 TAM 分别约为 260 亿美元和 370 亿美元。在商业领域 Palantir 产品涵盖数据管理、集成和编制、应用程序开发、安 全、系统和服务管理、分析和人工智能、供应链管理、企业资源管理以及内容和工作流管理 领域。政府部门

81、方面,公司客户包括美国陆军、海军和空军、美国特种作战司令部疾病控制中心等众多政府部门。图22:Palamtir 产品潜在市场规模(TAM)结构(2020年)图23:Palantir政府及商业业务收入结构 资料来源:Palantir公司财报,浙商证券研究所整理 资料来源:Wind,浙商证券研究所整理 拓尔思(300229)深度报告 http:/ 22/41 请务必阅读正文之后的免责条款部分 标准化产品标准化产品+定制化服务有望成为行业未来理想解决方案定制化服务有望成为行业未来理想解决方案,多源数据将成为赛道玩家,多源数据将成为赛道玩家核心竞争力核心竞争力。在发展早期,Palantir 也采用项目

82、制针对每个客户提供定制化产品,后续逐渐转向构建通用软件平台,并将可复用的功能构建成为应用程序,Gotham和 Foundry 两大产品便是这一思想的体现。在数据处理层面,Palantir 产品融合了各种不同类型的数据源,其中 Gotham Video 产品融合了视频数据、时间序列数据与其他标记数据,Gotham Graph 产品则融合调查报告、统计信息、视频、操作数据等,并最终构建成为知识图谱。表13:Palantir公司典型客户与业务关系 客户客户 客户简介与业务关系客户简介与业务关系 Airbus 空中客车公司是全球航空航天及相关服务的领导者,2016 年引入 Foundry 作为核心数据

83、平台。空客使用 Palantir 的软件来支持商用飞机项目,以帮助提高运营效率和生产率并且改进飞机设计。BP(英国石油)BP 是世界上最大的能源公司之一,与 Palantir 公司合作,为其油气生产团队建立了一个数据分析平台并成为 BP 石油和天然气生产数据结构的关键组成部分,能够辅助决策,支持整个生产的安全和效率。Credit Suisse AG 瑞士信贷公司是全球领先金融服务提供商,2013 年开始使用 Foundry 分析合规和金融市场出现的风险,集成和分析来自 100 多个系统的数据,Palantir 的软件也是在其业务中管理贸易、合规和市场风险的努力的重要组成部分。Danish Na

84、tional Police 2016 年,Palantir 开始与丹麦国家警察合作,满足丹麦议会对隐私和公民自由保护的需求。截至 2020年,丹麦的 8000 多名官员、调查人员和分析人员使用 Palantir 的软件分析来自十多个警察系统的情报并用于复杂的刑事调查,包括涉及纵火、毒品走私和洗钱的案件。FCA US FCA是一家北美汽车制造商,业务涉及设计、制造、销售或分销克莱斯勒、道奇、菲亚特和阿尔法罗密欧等品牌汽车和部分配件。2017 年以来,FCA使用 Foundry支持关键的汽车制造、质量和安全举措。Fiserv Fiserv长期以来是全球支付和金融技术的领导者,自 2013 年开始使

85、用 Palantir 软件,作为其技术转型的一个关键要素,包括实现风险管理、智能定价以及为客户开发数据驱动产品。Merck KGaA 默克公司是一家领先的科技公司,业务涵盖医疗保健、生命科学和性能材料领域。Palantir 的软件为默克公司提供数据集成和高级分析平台,用户利用 Palantir 的软件开发商业和供应链应用程序,并开发新的软件应用程序用于整个业务。Scuderia Ferrari Scuderia Ferrari 即法拉利车队。自 2017 年以来,Scuderia Ferrari 的工程师通过将不同的数据源整合成一个统一的数字双元,来提高数据驱动性能分析。United Stat

86、es Department of Defense 2008 年,部署在中东各地的美国陆军特种作战指挥官开始使用 Palantir 软件来协助任务规划和作战行动。今天,美国陆军的每个营都使用 Palantir 软件进行情报分析。美国海军、空军和海军陆战队以及其他国防机构也都使用 Palantir 的软件。资料来源:Palantir招股说明书,浙商证券研究所整理 2.3 知识图谱应用领域广泛,有助于公司提高核心竞争力知识图谱应用领域广泛,有助于公司提高核心竞争力 2.3.1 知识图谱应用前景广阔,市场有望迎来加速发展知识图谱应用前景广阔,市场有望迎来加速发展 知识图谱是新一代的知识工程技术,知识图

87、谱是新一代的知识工程技术,以以 NLP 为底层技术,捕捉为底层技术,捕捉数据、信息等内容并数据、信息等内容并梳理,组合成图谱形式梳理,组合成图谱形式,为,为 AI 提供知识储备提供知识储备。除了前文提到的专业搜索引擎外,知识图谱的主流产品形态可按通用型与垂直行业型划分,通用知识图谱强调知识广度,逐渐演变为通用互联网知识图谱,包含搜索引擎、智能推荐、智能问答等。垂直行业知识图谱强调知识深度,用于问答、辅助决策与业务分析,是支持 Al 大脑深度思考的知识库基础。拓尔思(300229)深度报告 http:/ 23/41 请务必阅读正文之后的免责条款部分 表14:知识图谱主流产品形态梳理 产品形态产品

88、形态 知识范围知识范围 目标目标 特征特征 举例举例 网络搜索引擎 广域网中的通用知识 形成通用知识图谱,使检索更准确并进行相关推荐 通用性强,适合综合领域,对数据获取能力要求高 百科词条搜索、关键词相关推荐与问答 知识图谱可视化 广域网或局域网中 的通用知识 知识关联网络的直观展示 属于知识图谱行业解决方案/大数据产品中的子模块,产生人机交互的节点 可视化大屏 行业知识图谱 某一领域内的数据、专业知识组合形成知识资源 将数据与知识转换为行业知识库,服务于辅助问答、推理、决策和判断 侧重于行业知识应用,行业属性强,依赖于专家数据标注,且数据标准特殊,需单独构建行业知识库 行业知识图谱 解决方案

89、 内部搜索引擎 局域网中的专业知识 形成某一领域或企业内部的知识搜索库,以搜索为核心 通用性收缩,专业性变强 企业内部的业务 知识检索与问答 大数据知识图谱 某一领域内的大数据成为知识资源 数据治理,进行知识与关系抽取,服务后续应用与业务分析 数仓与 BI数据分析形式的引申,变为以大数据组织形式的纯知识搜索引擎 数据中台/平台等大数据产品的知识图谱模块 资料来源:艾瑞咨询,浙商证券研究所整理 知识图谱技术应用受行业信息化成熟度及需求影响较大,整体规模处于起步阶段,未知识图谱技术应用受行业信息化成熟度及需求影响较大,整体规模处于起步阶段,未来产品专业化和场景化趋势明确。来产品专业化和场景化趋势明

90、确。目前知识图谱的应用逐渐从搜索引擎向各细分行业渗透,但应用受行业信息化与数字化基础、数据质量、场景明确程度、客户方需求等多因素影响,在各细分行业的渗透进程不一。互联网与金融为主要应用场景,在信创浪潮下政务、公安等有望提供市场推力,国内互联网与金融为主要应用场景,在信创浪潮下政务、公安等有望提供市场推力,国内知识图谱市场规模有望加速成长。知识图谱市场规模有望加速成长。据艾瑞咨询数据统计,在 2021 年知识图谱核心市场中,金融和互联网行业占总市场的 35.6%。我们认为我们认为,随着政务数字化建设的完善,随着政务数字化建设的完善叠加信创浪叠加信创浪潮潮,政务,政务、公安等行业对、公安等行业对知

91、识图谱的业务需求会知识图谱的业务需求会进一步扩大进一步扩大。根据艾瑞咨询数据,2021 年中国知识图谱核心市场规模为 107亿元,预计到 2026 年达到 296 亿元,2021-2026 年CAGR 约为 22.5%。图24:2021年中国知识图谱市场行业结构 图25:20192026年中国知识图谱核心市场规模及预测 资料来源:艾瑞咨询,浙商证券研究所整理 资料来源:艾瑞咨询,浙商证券研究所整理 公安、金融成为知识图谱商业化应用先头阵地,公司长期布局具备先发优势。公安、金融成为知识图谱商业化应用先头阵地,公司长期布局具备先发优势。艾瑞咨询数据统计显示,公安、金融、互联网等细分行业未来几年均有

92、望迎来知识图谱商业化应用的加速发展期,其中,由于公安、金融领域数字化和信息化程度较高,且数据挖掘需求较大,短期内有望成为知识图谱应用的先头阵地。拓尔思(300229)深度报告 http:/ 24/41 请务必阅读正文之后的免责条款部分 图26:2019-2026年中国按行业分知识图谱核心市场规模增长趋势(单位:亿元)资料来源:艾瑞咨询,浙商证券研究所整理 2.3.2 公司人工智能产品持续迭代提升,成为政府、金融等多行业决策大脑公司人工智能产品持续迭代提升,成为政府、金融等多行业决策大脑 AI 进入大数据时代,行业数据作为知识图谱的核心壁垒,公司竞争优势明显。进入大数据时代,行业数据作为知识图谱

93、的核心壁垒,公司竞争优势明显。公司从2010 年开始便自主投资建设大数据中心,目前已具备数千亿数据量的数据索引、标记、查询、挖掘分析能力,万亿级数据总量的秒级检索能力,日均亿级数据获取能力。业内领先的数据分析能力支撑公司多个专业化的数据智能服务,支撑政府、媒体、金融、公安、商业等多行业用户的智能分析需求。公司安拓知识图谱平台融合大数据等核心技术,构建大规模领域知识图谱。公司安拓知识图谱平台融合大数据等核心技术,构建大规模领域知识图谱。安拓知识图谱平台融合了大数据、可视化和知识图谱相关技术,能够构建形成大规模领域知识图谱,实现知识构建管理、知识语义检索、智能文本提取、智能问答与推荐、图谱关系分析

94、、地理空间分析等,在知识构建、知识图谱应用、领域知识图谱覆盖等方面均具有优势。目前产品已应用于政府、国家安全、公安、军事和企业等多个领域。图27:公司安拓知识图谱平台 资料来源:公司官网,浙商证券研究所整理 拓尔思(300229)深度报告 http:/ 25/41 请务必阅读正文之后的免责条款部分 水晶球分析师平台面向各业务领域专业分析师,支撑专项水晶球分析师平台面向各业务领域专业分析师,支撑专项研究工作。研究工作。通过 TRS水晶球分析师平台,分析师可以通过平台釆集多源异构数据,形成业务领域对象结构化知识。平台提供知识浏览和编辑、对象检索、关系图分析、地图分析、统计分析等功能,可以结合时间轴

95、、对象浏览、直方图、数据流等方式多角度探查数据。表15:公司水晶球分析师平台产品优势 优势 具体描述 基于动态本体的数据模型 TRS 水晶球数据模型构建“动态本体”的基础模型,将多数据源集成统一,发掘数据背后的知识。可追溯的数据版本 所有的数据被存储在平台的版本数据库中。数据的改变无论是来自数据源还是来自用户,版本数据库记录着每一个数据的改变。智能挖掘扩展 支持外部系统数据、本地资源库数据、个人零散数据的整合,并进行深度分析和挖掘。强大的可视化分析 将不同的数据模型分解成两两相连的关联关系,通过图形的方式对信息元之间的关系进行描述和展现。开放可扩展性平台 水晶球分析师平台是一个层级可扩展平台,

96、从初级的数据集成,持续客户化来构建用户定制接口,已基本实现了平台开放。资料来源:公司官网,浙商证券研究所整理 拓尔思(300229)深度报告 http:/ 26/41 请务必阅读正文之后的免责条款部分 3 公司业务场景持续延伸,产品公司业务场景持续延伸,产品 SaaS 化进程推动业务成长化进程推动业务成长 3.1 虚拟人作为元宇宙核心角色,公司深度布局虚拟人“灵魂”虚拟人作为元宇宙核心角色,公司深度布局虚拟人“灵魂”2022 年全国出台年全国出台各项各项元宇宙政策,虚拟现实产业发展进入快车道。元宇宙政策,虚拟现实产业发展进入快车道。战新元宇宙统计数据显示,今年全国各地相继出台市级、区级元宇宙发

97、展专项政策,对元宇宙产业发展提出针对性的指导和鼓励政策,旨在未来 35 年内构建完善的元宇宙产业生态,推动数字经济发展,加快虚拟现实技术在各行业和场景下的商业化应用。表16:近期全国部委及各省市元宇宙专项政策 出台时间出台时间 出台地区出台地区/部委部委 政策名称政策名称 相关要点相关要点 2021.11 北京市 关于加快北京城市副中心元宇宙创新引领发展的八条措施 北京通州区提出对在元宇宙应用创新中心新注册并租赁自用办公场地的重点企业进行 50%、70%、100%三挡补贴;在产业空间上,规划“1 个创新中心+N 个特色主题园区”的元宇宙产业空间布局。2022.01 工信部 工信部召开的中小企业

98、发展 情况发布会上 工信部表示,要特别注重培养一批深耕专业领域工业互联网、工业软件、网络与数据安全、智能传感器等方面的“小巨人”企业,培育一 批进军元宇宙、区块链、人工智能等新兴领域的创新型中小企业。2022.03 厦门 厦门市元宇宙产业发展三年行动计划(2022-2024年)围绕元宇宙关键技术对 NFT、VR/AR、智能芯片、智能算法等进行协同攻关;强化创新链与产业链协同,打造高端协作研究平台;积极推动科研院所和企业联合打造元宇宙应用平台,推动三维数字空间、虚拟数字人和 NFT 数字资产在城市管理、民生服务等领域的开发应用。2022.07 上海 上海市培育“元宇宙”新赛道行动方案(2022-

99、2025年)提出发挥上海在 5G、应用场景、在线新经济等方面优势,力争打造 10 家具有国际竞争力的头部企业、100 家“专精特新”企业,推出 50+示范场景、100+标杆性产品和服务,到 2025年产业规模达到 3500亿。2022.08 武汉 武汉市元宇宙产业创新发展实施方案(2022-2024年)(征求意见稿)力争到 2024 年,元宇宙关键技术显著突破、场景应用广泛铺开、创新企业高度集聚、重点平台加快布署,对实体经济、产业转型升级起带动和促进作用;组建成立 1个元宇宙研究院,建成 2个以上元宇宙产业孵化基地,聚焦 10个行业领域打造 30 个以上元宇宙场景应用示范项目,培育集聚 100

100、 家以上元宇宙核心企业。2022.09 河南 河南省元宇宙产业发展行动计划 未来三年计划建成 10 个左右国内一流的元宇宙技术研究和创新平台,初步建立开放协同的元宇宙技术创新体系;在工业制造、文化旅游、公共服务、社会治理、社交娱乐、教育、医疗等领域打造 100个元宇宙示范应用场景;打造一批软硬件研发、测试验证等公共服务平台,行业治理及安全保障体系初步建立。2022.09 工信部、教育部、文化和旅游部等五部门 虚拟现实与行业应用融合发展行动计划(20222026年)到 2026 年,我国虚拟现实产业总体规模超过 3500 亿元,虚拟现实终端销量超过 2500万台,培育 100 家具有强创新能力和

101、行业影响力的骨干企业,打造 10 个具有区域影响力、引领虚拟现实生态发展的集聚区,建成 10个产业公共服务平台。资料来源:工信部,浙商证券研究所整理 数字虚拟人的广义定义为数字化外形的虚拟人物,数字虚拟人的广义定义为数字化外形的虚拟人物,其核心价值在于其核心价值在于打破物理界限提供打破物理界限提供拟人服务与体验。拟人服务与体验。随着人工智能技术不断迭代,数字虚拟人将成为虚拟世界中人机互动、人际互动的重要桥梁,解决用户虚拟环境下工作、娱乐等需求。虚拟人应用场景不断拓展,可赋能多行业领域。虚拟人应用场景不断拓展,可赋能多行业领域。随着虚拟人技术结合实际应用场并形成行业应用解决方案,目前已经出现了娱

102、乐型虚拟人、教育型虚拟人、助手型虚拟人、影视虚拟人等,虚拟人已覆盖影视、传媒、游戏、金融、文旅等领域,且可以根据用户实际需求提供定制化服务。拓尔思(300229)深度报告 http:/ 27/41 请务必阅读正文之后的免责条款部分 表17:虚拟人应用领域、场景及角色 领域 场景 角色 影视 数字替身特效帮助导演实现现实拍摄中无法表现的内容和效果 数字替身、虚拟演员 传媒 定制化虚拟主持人/主播/偶像,支持从音频/文本内容一键生成视频,实现节目内容快速自动化生产,打造品牌特有 IP形象,实现互动 虚拟主持人 虚拟直播、虚拟偶像 游戏 数字人游戏角色提供更强代入感,提高可玩性 数字角色 金融 智能

103、理财顾问、智能客户等角色,实现以客户为中心的、智能高效的人性化服务 智能客服、智能理财顾问 文旅 博物馆、科技馆等虚拟小剧场、虚拟导游、虚拟讲解员 虚拟导游/讲解员 教育 基于 VR/AR场景式教育,虚拟倒是帮助构建自适应/个性化学习环境 虚拟教师 医疗 以数字人实现家庭陪护/家庭医生/心理咨询,关注家庭成员身心健康 心理医生、家庭医生 零售 电商直播场景,虚拟人与真人主播互动 顾客服务/商家管理虚拟人 资料来源:中国人工智能产业发展联盟,浙商证券研究所整理 数字虚拟人应用向多元化发展,潜在市场规模超千亿。数字虚拟人应用向多元化发展,潜在市场规模超千亿。目前虚拟人应用逐渐从娱乐化,向工具化、基

104、建化的形式渗透,应用场景的丰富度和深度均不断提升。根据速途元宇宙研究院预测,2022年我国虚拟人整体市场规模将达到约 242.3 亿元,到 2030年这一市场规模有望超 3000亿元。我们预计未来几年内,随着我们预计未来几年内,随着 NLP 等人工智能技术的不断迭代,数等人工智能技术的不断迭代,数字虚拟人经济将从目前的字虚拟人经济将从目前的 IP 经济向人机交互发展,行业有望迎来经济向人机交互发展,行业有望迎来爆发。爆发。图28:虚拟人整体市场规模趋势及预测 资料来源:速途元宇宙研究院,浙商证券研究所整理 公司依托自然语言处理与行业知识图谱技术积累,积极布局虚拟人赛道,为数字虚拟公司依托自然语

105、言处理与行业知识图谱技术积累,积极布局虚拟人赛道,为数字虚拟人提供人提供“大脑大脑”。公司与腾讯等国内顶级数字人形象团队签订战略合作协议,实现虚拟人形象与大脑的有机结合。公司虚拟数字人 SaaS 平台已成为客户订购虚拟数字人的全链服务平台。公司已成功注册“拓宇宙”商标,未来持续深入元宇宙领域的实践与探索。拓尔思(300229)深度报告 http:/ 28/41 请务必阅读正文之后的免责条款部分 图29:语义智能构成数字虚拟人“大脑”图30:公司所处虚拟人产业链环节 资料来源:公司年报,浙商证券研究所 资料来源:公司年报,浙商证券研究所 公司服务型虚拟人产品已在部分行业成功实践,未来有望渗透更多

106、垂直应用场景。公司服务型虚拟人产品已在部分行业成功实践,未来有望渗透更多垂直应用场景。目前公司已落地了一批服务型虚拟人项目,覆盖了直播带货、智能播报、智能问答等领域,其中与广东省共建“南方乡村振兴新农人 AI 数智赋能平台”,定位在农产品 直播内容智能创作的 AIGC 在线服务平台,面向农产品电商主播提供直播脚本智能创作、带货虚拟人全链租用等知识赋能服务。2022 年北京冬奥会期间,公司发布虚拟人“小思”,实现自动采编、智能写稿、虚拟播报等全自动功能,通过自然语言处理、知识图谱、机器学习和音视频分析等技术,在“虚拟人代替人”进程中迈出了重要一步。表18:公司虚拟人技术应用场景及客户 功能类型

107、客户 涉及 NLP 技术代替人的主要功能 智能问答 中国中医科学院 中医中药问答 中国标准化研究院 国家标准问答 人民卫生出版社 小艾机器人 时代经济出版社 审计问答 中国日报 外国来华办事问答 吉林政务问答 小吉智能机器人 智能比对 国家知识产权局 实用新型机检报告 南方电网 南方电网科技查新 人民出版社 金典语义对比 文汇新民报业 文字作品互联网传播监测与版权保护平台 事件智能分析 新华社 2019两会分析 浙江日报集团 热点分析、事件分析 鲁能俱乐部 足球情感分析 智能内容写作 浙报 机器人自动写稿 专利开发公司 专利说明书自动概述、标题重构 经济日报 财经快讯、CPI数据解读 知识图谱

108、 社会出版社 政区大典 民航科学院 民航不安全飞行事件本体 某部 英文人物画像 中国外文局 外交人物机构关系图谱 图像识别 国家知识产权局 外观检索 某部 深度舰船分类检索 专利出版社 商标近似检索 长江日报 图片三鉴、政治人物识别 资料来源:公司年报,浙商证券研究所整理 拓尔思(300229)深度报告 http:/ 29/41 请务必阅读正文之后的免责条款部分 签约蓝色光标,服务虚拟人率先落地。签约蓝色光标,服务虚拟人率先落地。2022 年 2 月,公司与蓝色光标达成战略合作,依托在虚拟主播、智能问答机器人、智能创作、专业领域虚拟人等方面的成功经验,结合蓝色光标在虚拟及混合现实空间营销、智能

109、虚拟人领域的业务基础,双方将大力推动元宇宙相关业务开拓。公司将以“虚拟人+”场景为突破口,首先落地服务虚拟人,应用布局将优先面向金融、传媒、政府、营销等行业的专业服务场景。3.2 人形机器人风起,公司联手赛道头部玩家入局有望受益行业发展人形机器人风起,公司联手赛道头部玩家入局有望受益行业发展 全球全球“机器换人“机器换人”进程加速,服务”进程加速,服务机器人市场规模稳定增长,机器人市场规模稳定增长,未来人形机器人有望深未来人形机器人有望深入各细分消费端场景入各细分消费端场景。人口老龄化趋势下全球医疗和公共卫生需求持续旺盛,叠加疫情期间大量面对面场景被无接触服务替代,接待机器人、递送机器人、测温

110、机器人和新零售机器人等需求增加,服务机器人市场潜力巨大。全球服务型机器人潜在市场规模超全球服务型机器人潜在市场规模超 200 亿美元,国内市场有望迎来加速发展阶段。亿美元,国内市场有望迎来加速发展阶段。根据中国电子学会统计数据,预计到 2023 年全球服务型机器人市场规模将达到 201.8 亿美元,20162023 年 CAGR 约为 24.72%;预计到 2023年我国服务型机器人市场规模将突破600亿,达 613.5 亿元人民币,20162023 年 CAGR 约为 37.87%。图31:全球服务型机器人市场规模增长趋势及预测 图32:我国服务型机器人市场规模增长趋势及预测 资料来源:中国

111、电子学会,浙商证券研究所整理 资料来源:中国电子学会,浙商证券研究所整理 语音语义分析作为人机交互核心途径,帮助机器人具备听、说、理解和思考的能力。语音语义分析作为人机交互核心途径,帮助机器人具备听、说、理解和思考的能力。语音语义模块包含了语音识别和语义分析两部分,涉及声学信号(声源定位、语音增强等)、模式识别(声纹识别、语音识别等)、自然语言处理(自然语言理解、自然语言生成等)和 语音合成等技术。图33:人形机器人人机交互模块 资料来源:搜狐科技,浙商证券研究所整理 拓尔思(300229)深度报告 http:/ 30/41 请务必阅读正文之后的免责条款部分 小米、特斯拉相继发布商用人形机器人

112、产品,小米、特斯拉相继发布商用人形机器人产品,国内外科技国内外科技大厂加速布局,行业有望加大厂加速布局,行业有望加速发展速发展。2022年 8月小米发布人形机器人 CyberOne,搭载自研 MiAI 环境语义识别引擎和MiAI 语音情绪识别引擎,能够实现 85 种环境音识别和 6大类 45 种人类情绪识别。特斯拉发布的人形机器人擎天柱 Optimus,承接自动驾驶技术,AI 智能的核心 Transformer 架构同样是 NLP 领域的标志性研究成果。图34:小米人形机器人 CyberOne情绪感知模块 图35:特斯拉机器人 AI 智能交互架构 资料来源:小米官网,浙商证券研究所 资料来源:

113、Tesla AI Day,浙商证券研究所 公司深耕公司深耕 NLP 赛道,语义智能技术优势显著。赛道,语义智能技术优势显著。公司在 NLP、知识图谱、OCR、图像视频结构化领域均具备自主可控的底层技术并处于行业领先地位,公司未来有望依托语音语义智能交互,尤其是中文交互领域的技术优势,赋能人形机器人在知识储备、智能交互、自主决策等方面的能力提升。公司自研面向中文的智能问答云服务系统“公司自研面向中文的智能问答云服务系统“TRS 小思智能问答机器人”。小思智能问答机器人”。公司该产品综合运用 NLP、知识表示与推理等技术,通过语法语义分析、问题分类与解析等一系列处理流程,实现问题解答与人机交互,目

114、前广泛应用于政务智能问答、企业智能客服以及金融、医疗、教育等领域的知识百科问答。表19:公司 TRS小思智能问答机器人功能及优势亮点 功能 优势与亮点 语义理解不同问法 基于 NLU 的问答引擎,识别问句意图与关键术语,从而将各种问法归集为相同的意思 上下文记忆 关键术语的上下文记忆,可在连续会话中省略相同实体 实体限定 利用实体限定功能轻松实现“鱼丸粗面”的对话场景 知识构建 可针对 Excel、Word等文件进行信息抽取,快速形成问答知识库 多租户 提供租户机制,每个租户有独立的知识库,语义库以及词典,每个租户有专属的问答入口 远程服务 提供基于 JSONP 的对外服务接口,可跨域调用,降

115、低与业务系统的集成成本,并提供 Web、微信等多种访问方式 FAQ与 KGAQ双引擎 FAQ与 KGAQ双引擎融合计算综合评分,通过投票机制给出标准答案与相关推荐问题 资料来源:公司官网,浙商证券研究所整理 公司加强与公司加强与 AI 及机器人厂商深度合作,未来有望成为人形机器人语义智能赛道领军及机器人厂商深度合作,未来有望成为人形机器人语义智能赛道领军者。者。在与 AI 厂商合作方面,公司和北京一流科技等 AI 厂商共同合作研究人形机器人软件技术以及推广应用。一流科技立足于通用性深度学习标准框架的研发和推广使用,独创了拓尔思(300229)深度报告 http:/ 31/41 请务必阅读正文之

116、后的免责条款部分 自动数据模型混合并行、静态调度、去中心化和全链路异步流式执行四大核心技术,力争打造人工智能深度学习框架产品的引领者和事实工业标准。公司通过与 AI 厂商的深度合作,可将在自身在自然语言处理、知识图谱领域深厚的积淀与 AI 厂商在深度学习引擎领域的技术优势结合起来,构建机器人软件大脑,研发云端协同的 AI 算法框架以及面向特定领域的知识图谱技术,培育 AI算法集市,设计算法模块共享、交易、分成机制,为机器人厂商提供中立、开放的软件生态并延伸应用场景。公司持续加强与国内头部机器人厂商合作。公司持续加强与国内头部机器人厂商合作。公司数字经济研究院成立机器人研究中心,和优必选、小鹏等

117、企业进行研究和探索。优必选作为国内外领先的机器人厂商,产品在儿童陪伴、教育等领域均具备显著优势,拓尔思基于多年 NLP 的深厚积淀,能够进一步机器人的思考和交互能力,为用户提供更拟人化的陪伴和交互体验。3.3 云和数据服务转型加速,云和数据服务转型加速,SaaS 化进程加速有望助力公司提升盈利能力化进程加速有望助力公司提升盈利能力 公司多款产品实现全面公司多款产品实现全面 SaaS 化,云和数据业务加速发展为公司提供充足动力。化,云和数据业务加速发展为公司提供充足动力。2022年上半年,公司的“数家-资讯大数据平台”、“数星-智能风控平台”、“金融风险监测平台”、“网察-舆情大数据分析平台”以

118、及“开源情报分析平台”等均已经实现了产品的全面 SaaS 化,未来随着公司大数据、人工智能业务在应用场景上的延伸,预计将推出更多SaaS 产品,进一步提升 SaaS 产品收入比例。表20:公司拥有多款 SaaS产品 产品 主要业务 数家媒体资讯大数据 云服务平台 基于内容资讯领域的大数据智能服务平台,平台汇聚了全网新闻资讯类的内容数据,以“多维知识库+智能语义”的方式对文章进行结构化标引,为媒体提供高信源、精加工的资讯内容服务。数星智能风控 大数据平台 围绕海量异构数据,全面监控海量金融实体多维风险。平台提供智能多维标签、预警信号推送、风险事件跟踪、风险传导关联、综合异构图谱等贯穿多场景全流程

119、风险管理功能,提升金融机构风控能力,在风控、合规、投研、监管等核心金融场景得到广泛应用。网脉云服务平台 新一代全端友好性分析工具,主要面向企业、媒体、政府行业企业级客户提供专业的网站、APP、小程序分析服务,通过精准分析提高网站、APP、小程序友好性,帮助企业运营进而提升网络营销的有效性和便利性。网察大数据分析平台 从网络舆情线索发现、实时预警、分析研判、综合报告等环节为用户提供全面、及时、准确的服务。聚合网络新闻、微博、微信、境外媒体等多渠道海量数据,以信息监测、态势感知、关系挖掘、事件追踪、传播分析、智库共享等为目标,解决跨舆论场的网络信息洞察、分析、研判,实现从数据到智能决策的一体化大数

120、据舆情服务。资料来源:公司官网,浙商证券研究所整理 公司坚持优先发展云和数据智能服务战略,云和数据服务收入持续增长。公司坚持优先发展云和数据智能服务战略,云和数据服务收入持续增长。公司20182021 年云和数据业务收入高速增长,2021年相关收入达 3.78 亿元,占营业收入比例达到 36.84%。在 2022 年经营计划中,公司明确提出支持优先发展云和数据智能服务战略,预计未来将持续保持较快增长态势。拓尔思(300229)深度报告 http:/ 32/41 请务必阅读正文之后的免责条款部分 图36:2018-2022H1公司云和数据业务收入规模及占比 资料来源:公司年报,浙商证券研究所整理

121、 SaaS 商业模式优势突出,国内市场空间广阔,公司业务转型有望打开成长空间。商业模式优势突出,国内市场空间广阔,公司业务转型有望打开成长空间。根据艾媒咨询统计数据,2021 年中国 SaaS行业市场规模达 322.6 亿元,预计到 2023年将达到约 555 亿元,近几年保持约 30%的复合增长率。与美国对比,头豹研究院数据显示,2020年中国 SaaS 行业占 IT 整体支出比例为 1.3%,相比于 2011年的 0.1%大幅增长,但相对于美国 2020年的 5.4%仍有很大提升空间。考虑美国 SaaS 产业起步较早,企业数字化程度更高,未来中国企业 SaaS有望加速渗透,市场规模前景可期

122、。图37:2015-2023年中国 SaaS行业市场规模及预测 图38:2011-2020年中美两国 SaaS占 IT投入比例 资料来源:艾媒咨询,浙商证券研究所整理 资料来源:头豹研究院,浙商证券研究所整理 SaaS 商业模式具备多重优势,公司加速转型有望进一步提升核心竞争力。商业模式具备多重优势,公司加速转型有望进一步提升核心竞争力。公司加速业务云转型,整个商业模式正由销售解决方案、软件产品全面转向 SaaS 服务模式。传统的数字政府、融媒体等行业解决方案的生产由重建设转向重运营、重增值服务,通过叠加专业领域的数据服务,进一步深化服务能力。我们预计未来公司在专利、虚拟人、机器人等新领域业务

123、开拓中也将采用 SaaS 服务模式,提升公司 SaaS 营收占比的同时,进一步完善业务生态,提升行业竞争力。拓尔思(300229)深度报告 http:/ 33/41 请务必阅读正文之后的免责条款部分 4 拓尔思,三十年耕耘成就语义智能领军者拓尔思,三十年耕耘成就语义智能领军者 4.1 深耕语义智能赛道,打造完整业务版图深耕语义智能赛道,打造完整业务版图 深耕深耕 NLP 领域领域 30 年年,公司发展成为国内政务领域公司发展成为国内政务领域 NLP 龙头厂商龙头厂商。公司以“语义智能+”为发展战略深耕多年,主要业务覆盖内容安全和互联网空间治理、数字政府和数据智能三大板块,向以党政机关及企事业单

124、位为主的下游客户提供大数据检索、智能风控营销、舆情监控等服务。在数据安全领域,子公司天行网安提供数据安全传输和交换产品及服务。公司以深耕多年的大数据积累与行业领先的 NLP 技术成为国内政府政务领域 NLP 龙头,多年以来一直保持行业领先的市场地位。公司人工智能和大数据核心技术具有跨行业/领域的通用普适性,因此公司技术产品和服务所支持的业务应用落 地场景众多,涵盖多个行业/领域,大型或头部企业级客户超过 8000 家。在具体客户应用中,公司技术产品的交付部署 模式包括私有云、混合云和公有云等模式或多模式的融合,满足客户从通用到个性的完整需求。图39:公司产品矩阵 资料来源:公司 2022年半年

125、度报告,浙商证券研究所整理 公司深耕公司深耕 NLP 赛道三十余年,持续迭代构建牢固护城河。赛道三十余年,持续迭代构建牢固护城河。公司于 1993 年成立,坚持围绕自然语言处理技术,积极自主研发大数据和人工智能技术,具备自然语言处理领域自主可控的全产业链能力。目前公司及全资/控股子公司拥有 600 余项软件著作权。图40:公司发展历程 资料来源:公司官网,浙商证券研究所整理 拓尔思(300229)深度报告 http:/ 34/41 请务必阅读正文之后的免责条款部分 4.2 公司股权结构稳定,核心团队经验优势丰富,研发实力雄厚公司股权结构稳定,核心团队经验优势丰富,研发实力雄厚 公司股权结构稳定

126、,通过收购方式进一步完善业务矩阵。公司股权结构稳定,通过收购方式进一步完善业务矩阵。公司实控人为董事长李渝勤,公司前五大股东持股比例达 47.79%,其中第一大股东为信科互动科技发展有限公司,持股比例为 33%,整体股权结构保持稳定。表21:公司前五大股东明细(截至 2022H1)排名 股东名称 持股比例(%)1 信科互动科技发展有限公司 33%2 北京北信科大资产管理有限公司 6.17%3 博泰精选 1号私募证券投资基金 4.98%4 珠池新机遇私募投资基金七期 2.01%5 香港中央结算有限公司 1.63%资料来源:Wind,浙商证券研究所整理 公司通过并购业务完善公司业务版图。公司通过并

127、购业务完善公司业务版图。公司于 2014年收购天行网安 100%股权,后者是国内最早从事网络信息安全的企业,产品应用场景覆盖公安、政府和教育等行业,此举使公司拥有行业级产品应用,为公司产品近公安领域打下了坚实基础;公司自 2013 年持续参股并至 2018 年持有广州科韵 86.4%股权,后者的大数据一体化平台聚焦于公共安全和政府领域的应用。公司目前有天行网安、广拓公司、金新网银等子公司,各子公司业务布局各有侧重,支撑公司构建了完善的业务生态,未来有望持续赋能公司主营业务向更多垂直行业的细分场景延伸。表22:公司主要子公司主营业务布局 子公司 主要业务 天行网安 提供数据安全传输和交换产品及服

128、务 广拓公司 研发和销售知识图谱技术和大数据分析软件 金新网银 开发和提供以金融科技为业务主营方向的大数据智能服务产品 成都子公司 从事国内西部市场的营销拓展和技术研发工作,并承建公司西部区域总部及大数据研发和运营服务基地 项目 资料来源:公司财报,浙商证券研究所整理 公司技术人员储备丰富,研发能力突出。公司技术人员储备丰富,研发能力突出。截至 2021年末,公司在职员工合计 1631人,其中技术人员达 1458人,占比达 89.39%。学历为大学本科及以上的员工数量达到1348 人,占比达 82.65%,预计公司未来通过储备高学历技术人才,进一步提升产品研发实力,推动业务向更多应用场景延伸。

129、拓尔思(300229)深度报告 http:/ 35/41 请务必阅读正文之后的免责条款部分 图41:公司员工教育程度结构 资料来源:公司年报,浙商证券研究所整理 4.3 公司营收稳健成长,费用结构合理,发展步伐坚定公司营收稳健成长,费用结构合理,发展步伐坚定 公司主营业务收入持续增长,未来业务扩张有望持续提升盈利能力。公司主营业务收入持续增长,未来业务扩张有望持续提升盈利能力。公司 2021年实现营业收入 10.29 亿元,同比均有所下降,系 2021年公司营业收入不再包含程度子公司2020 年配套商业房产项目收入和原控股子公司奈特康赛的互联网营销收入所致,剔除上述影响后 2021 年主营业务

130、收入实现同比增长 31.83%,保持稳健成长。公司 2022H1实现营业总收入 4.25亿元,归母净利润 0.74亿元,同比分别增长 8.53%和 36.19%。公司产品 SaaS化转型有望驱动业务盈利能力进一步增强,基于公司在专利、虚拟人、机器人等领域的持续探索和布局,看好公司未来打开成长空间。图42:公司 2017-2022H1营业收入情况 图43:公司 2017-2022H1归母净利润情况 资料来源:Wind,浙商证券研究所整理 资料来源:Wind,浙商证券研究所整理 公司各项费用结构稳定,毛利率与净利率有望进一步提升。公司各项费用结构稳定,毛利率与净利率有望进一步提升。2021年公司销

131、售、研发和管理费用率分别为 11.50%、9.53%和 14.83%,2018至 2021年各项费率保持稳定。公司2021 年毛利率和净利率分别为 62.13%和 24.12%,近年来稳中有升,公司未来通过云及SaaS 产品收入比重的持续加大,毛利率及净利率有望继续提升。拓尔思(300229)深度报告 http:/ 36/41 请务必阅读正文之后的免责条款部分 图44:公司 2018-2021各项费率结构 图45:公司 2017-2022H1毛利率、净利率情况 资料来源:Wind,浙商证券研究所整理 资料来源:Wind,浙商证券研究所整理 4.4 公司覆盖多行业优质客户,现金流保持健康公司覆盖

132、多行业优质客户,现金流保持健康 公司客户优质且粘性高,行业覆盖度持续提升。公司客户优质且粘性高,行业覆盖度持续提升。公司目技术产品和服务所支持的业务应用落 地场景众多,涵盖多个行业/领域,目前服务大型或头部企业级客户超过 8000 家。在具体客户应用中,公司技术产品的交付部署模式包括私有云、混合云和公有云等模式或多模式的融合,满足客户从通用到个性的完整需求,并且企业复购率高,客户粘性好。表23:公司主要行业客户及覆盖情况 行业行业 覆盖情况覆盖情况 制造、能源 服务包括南方电网、国家电网、海尔集团、海信集团等众多企业客户 互联网、传媒 融媒体行业服务已覆盖 72%的中央媒体,61%的省级媒体,

133、40%的行业媒体机构用户 金融 产品和服务应用于 5大国有银行、3大政策性银行、50%的股份制商业银行、主要交易所及国家监管机构和约 300家地方金融监管部门等客户 政府 数字政府和公共服务领域的产品+云服务+解决方案业务体系已覆盖 80%的中央和国务院机构,60%的省级政府,50%的地市级政府 公共安全 目前已服务国内千余家机构用户,包括互联网空间治理和监管机构、党政机关、媒体机构、教育机构、大中型企业等。资料来源:公司 2022半年报,浙商证券研究所整理 货币资金货币资金储备充足,公司已为新业务布局做好准备。储备充足,公司已为新业务布局做好准备。2022Q3,公司现金储备达 3.85 亿元

134、,现金储备维持健康状态。考虑公司收入集中在第四季度,且未来将持续投入开拓新业务场景,看好公司基于现金储备优势,加速新业务方面的拓展并保持良好运营状态。图46:公司货币资金储备(单位:百万元)资料来源:Wind,浙商证券研究所整理 拓尔思(300229)深度报告 http:/ 37/41 请务必阅读正文之后的免责条款部分 5 盈利预测与估值盈利预测与估值 5.1 盈利预测盈利预测 营业收入:营业收入:公司是国内最早从事自然语言处理(NLP)技术研发的企业之一,主营业务包括人工智能产品及服务、大数据产品及服务和数据安全产品及服务等。公司近年来稳步发展,产品服务在政府、公安、金融、传媒等领域均具备竞

135、争优势,2021 年营业收入达 10.29 亿元。公司持续开辟新业务场景,未来有望将产品服务应用到知识产权、虚拟人、机器人等新赛道,我们预测公司 2022-2024 年营收持续提升,增长率分别为 27.41%、25.48%和 24.02%,对应营收为 13.11亿元、16.45 亿元和 20.40 亿元。大数据服务:大数据服务:根据中国信息通信研究院数据显示,2021 年中国数字经济规模达到 7.1 万亿美元,同比增加约 15.42%,且在未来几年将保持增长态势。数字化转型正由效率变革向 价值变革、由企业内向产业链价值链拓展,面向实体经济的工业/产业互联网平台快速发展。公司基于自主建设的大数据

136、中心及语义智能技术,积累了海量数据资产,同时公司是最早从事中文全文检索技术研发的企业,具有全球领先的智能检索技术,对标国外龙头厂商 Elasticsearch,其搜索引擎业务在 2019-2021 财年实现营业收入4.28/6.08/8.62 亿美元,同比增长 57.41%/42.30%/41.72%,公司作为国内少数的搜索引擎数据库供应商,在国产搜索引擎数据库 0到 1的过程中有望驱动相关业务在未来实现高增长,同时知识产权等领域有望提供业务新动能,公司预计 2022-2024 年大数据服务业务收入增速为 30.18%、26.84%和 24.69%。人工智能产品:人工智能产品:公司在自然语言处

137、理(NLP)领域有多年的技术及业务积累,在NLP、知识图谱、OCR、图像视频结构化领域均实现核心技术的自主可控,处于行业领先地位。根据赛迪研究院预测,我国 NLP 市场规模将在未来几年内保持约 36.5%的复合增长率,并处于快速产业化应用阶段,公司 2021年人工智能软件产品及服务业务实现营收 1.81亿元,同比增长 51.95%,公司基于 NLP、知识图谱核心技术开发的人工智能产品及服务,在金融反欺诈、情报分析、人机交互等领域有望打开市场应用空间,对标海外龙头公司 Palantir,其在 2019-2021年实现营业收入 7.43/10.93/15.41 亿美元,同比增长 24.71%/47

138、.15%/41.11%。我们认为随着垂直行业人工智能商业化进程的加速,以及公司相关产品服务不断延伸应用场景,未来有望保持持续增长态势。我们预计 2022-2024 年公司相关业务营收增速分别为 41.27%、38.72%和 36.38%。网络安全产品:网络安全产品:公司全资子公司天行网安是国内最早从事网络安全和数据交换的企业,在数据视频交换、单向导入等方面具有雄厚技术实力,目前形成了边界安全、物联网安全、大数据安全三大阵营完整产品线和解决方案,并在政府、公安、军队和金融等行业领域得到广泛应用与认证。公司 2021 年网络安全产品业务实现收入 1.43亿元,同比增长 7.63%,根据 IDC 预

139、测,2026年中国网络安全 IT 支出规模将达到 318.6亿美元,2022-2026 五年 CAGR 约 21.6%,市场空间广阔。我们认为公司有望受益信创浪潮,以及网络安全领域需求持续提升,实现相关业务稳定增长态势。我们预计2022-2024 年公司相关业务营收增速分别为 21.66%、19.53%和 16.96%。系统集成及其它:系统集成及其它:该项业务主要为配合公司前述几项业务,2021年实现营业收入 1.90亿元,同比增长 210.72%。未来营收有望随着公司前述三大业务规模的成长而增加,但随着公司加速产品 SaaS化转型进程,系统集成业务增速可能逐步放缓。预计 2022-2024

140、年相关业务营收增速分别为 11%、10%和 9%。拓尔思(300229)深度报告 http:/ 38/41 请务必阅读正文之后的免责条款部分 毛利率:毛利率:2019-2021 年公司的毛利率分别为 61.75%、58.07%和 62.13%,2021 年公司大数据、人工智能、安全产品和系统集成及其它各项业务毛利率分别为 70.81%、73.75%、73.72%和 18.76%,其中大数据软件产品及服务的毛利率同比提升了 7.8%,未来随着公司产品 SaaS化转型的持续推进,产品服务趋向标准化,毛利率有望持续持续提升。我们预计公司 2022-2024 年毛利率分别为 63.65%、64.92%

141、和 65.97%。费用率:费用率:销售费用率方面,2019-2021 年公司销售费用率分别为 17.05%、11.05%和11.50%,考虑公司业务规模成长叠加产品服务标准化程度的提升,公司有望保持销售费用率在稳定水平,预计 2022-2024 年公司销售费用率分别为 11.27%、11.39%和11.33%;管理费用率方面,2019-2021 年公司管理费用率分别为 15.58%、8.10%和14.83%,其中 2020 年由于包含地产业,费用率有出现一定波动,务考虑公司未来整体管理结构稳定,预计 2022-2024 年管理费用率分别为 15.00%、14.10%和 14.00%;研发费用率

142、方面,公司 2019-2021 年研发费用率分别为 9.45%、6.26%和 9.53%,考虑公司未来计划持续投入新产品服务的技术研发,预计将持续储备核心技术人才,预计2022-2024 年研发费用率为 12.13%、12.01%、11.88%。5.2 投资建议与估值投资建议与估值 估值方面,我们以行业相关性为标准,分别从国外和国内选取可比公司进行分析。国外公司方面,我们选取了海外搜索引擎数据库龙头公司 Elasticsearch,以及知识图谱龙头厂商 Palantir,由于上述两家可比公司均未实现盈利,因此我们采用 PS估值法进行分析。考虑公司相比于 Palantir 和 Elasticse

143、arch 能够实现稳定盈利,且国内大数据及人工智能市场快速发展,搜索引擎国产化替代进程加速,公司较两家国外可比公司应当获得更高的 PS 倍数估值。表24:可比公司估值分析(Palantir、Elasticsearch)股票代码 公司名称 市值 营业收入(亿)PS 2022E 2023E 2024E 2022E 2023E 2024E PLTR.US Palantir 153.31亿美元 19.01 USD 23.31 USD 28.67 USD 8.06 6.58 5.35 ESTC.N Elasticsearch 56.61亿美元 10.85 USD 14.24 USD 18.60 USD

144、5.22 3.98 3.04 平均值 6.64 5.28 4.20 300229.SZ 拓尔思 87.49 亿人民币 13.11 RMB 16.45 RMB 20.40 RMB 6.67 5.32 4.29 资料来源:Wind,Bloomberg,浙商证券研究所整理(注:截至 2022年 11月 29日)国内方面,我们选取人工智能及大数据领域的科大讯飞、美亚柏科作为可比公司进行分析。参考可比公司,考虑公司在语义智能领域的技术壁垒深厚,并且在政府、公安等领域有多年服务经验和高粘客户积累,未来有望在信创浪潮驱动下将业务快速拓展到其他领域,我们基于公司 2022 年行业平均 36.54 倍 PE。首

145、次覆盖给予“买入”评级。拓尔思(300229)深度报告 http:/ 39/41 请务必阅读正文之后的免责条款部分 表25:可比公司估值分析(科大讯飞、美亚柏科)股票代码 公司名称 市值(亿人民币)营业收入(亿人民币)PE 2022E 2023E 2024E 2022E 2023E 2024E 002230.SZ 科大讯飞 749.89 235.70 306.88 395.62 40.32 29.16 22.00 300188.SZ 美亚柏科 106.34 28.12 33.48 39.82 32.76 25.13 19.44 平均 36.54 27.15 20.72 300229.SZ 拓尔

146、思 87.49 13.11 16.45 20.40 27.76 21.80 17.03 资料来源:Wind,浙商证券研究所整理(注:截至 2022年 11月 29日)6 风险提示风险提示 1、行业竞争加剧带来的风险:、行业竞争加剧带来的风险:政务、金融等信息化分为多个细分领域,细分领域竞争有加剧的可能;另外公司向其他行业渗透将面对细分领域已有竞争者的竞争。2、新业务开拓进展不及预期、新业务开拓进展不及预期带来的风险带来的风险:公司在专利检索、虚拟人、机器人等创新业务均有开展,而且在行业内也属于率先开拓相关业务的探索者。未来业务拓展中可能遇到困难,导致业务拓展进度存在不确定性。3、宏观经济下行导

147、致宏观经济下行导致业务波动带来的风险:业务波动带来的风险:公司业务产品与下游政府及商业客户的战略转型规划关系较为紧密,宏观经济下行可能导致企业自身财力受影响或政府在大数据、人工智能方面预算缩紧,导致下游景气度提升缓慢,未来仍存在波动的可能。拓尔思(300229)深度报告 http:/ 40/41 请务必阅读正文之后的免责条款部分 Table_ThreeForcast 表附录:三大报表预测值表附录:三大报表预测值 资产负债表 利润表 (百万元)2021 2022E 2023E 2024E (百万元)2021 2022E 2023E 2024E 流动资产流动资产 1583 1686 2020 25

148、52 营业收入营业收入 1029 1311 1645 2040 现金 491 544 711 1094 营业成本 390 476 577 694 交易性金融资产 414 398 406 402 营业税金及附加 11 29 43 40 应收账项 326 378 499 602 营业费用 118 148 187 231 其它应收款 33 53 61 74 管理费用 153 197 232 286 预付账款 3 8 5 8 研发费用 98 159 198 242 存货 94 132 125 170 财务费用 20 24 22 18 其他 222 172 214 203 资产减值损失 27 (10)(

149、1)12 非流动资产非流动资产 2143 2334 2501 2583 公允价值变动损益 4 4 4 4 金额资产类 0 0 0 0 投资净收益 19 17 14 11 长期投资 77 79 78 79 其他经营收益 39 32 32 34 固定资产 298 321 381 367 营业利润营业利润 274 341 437 566 无形资产 302 417 536 648 营业外收支 4 4 4 4 在建工程 0 0 0 0 利润总额利润总额 279 345 442 570 其他 1466 1516 1505 1488 所得税 31 27 37 52 资产总计资产总计 3726 4020 45

150、21 5135 净利润净利润 248 318 405 519 流动负债流动负债 484 467 557 654 少数股东损益 2 3 4 5 短期借款 10 4 5 6 归属母公司净利润归属母公司净利润 246 315 401 514 应付款项 214 251 310 370 EBITDA 353 438 533 667 预收账款 1 0 1 1 EPS(最新摊薄)0.34 0.44 0.56 0.72 其他 259 212 241 278 非流动负债非流动负债 664 657 663 661 主要财务比率 长期借款 0 0 0 0 2021 2022E 2023E 2024E 其他 664

151、657 663 661 成长能力成长能力 负债合计负债合计 1148 1124 1220 1315 营业收入-21.44%27.41%25.48%24.02%少数股东权益 14 17 21 26 营业利润-32.11%24.26%28.27%29.40%归属母公司股东权益 2563 2878 3280 3793 归属母公司净利润-34.57%28.24%27.32%28.04%负债和股东权益负债和股东权益 3726 4020 4521 5135 获利能力获利能力 毛利率 62.13%63.65%64.92%65.97%现金流量表 净利率 24.12%24.28%24.63%25.43%(百万元

152、)2021 2022E 2023E 2024E ROE 10.33%11.52%12.95%14.43%经营活动现金流经营活动现金流 189 325 416 542 ROIC 9.36%11.78%12.93%14.05%净利润 248 318 405 519 偿债能力偿债能力 折旧摊销 81 69 69 79 资产负债率 30.82%27.96%26.99%25.62%财务费用 20 24 22 18 净负债比率 1.43%0.55%0.67%0.78%投资损失(19)(17)(14)(11)流动比率 3.27 3.61 3.62 3.90 营运资金变动(103)(24)(68)(24)速动

153、比率 3.08 3.33 3.40 3.64 其它(39)(44)2(38)营运能力营运能力 投资活动现金流投资活动现金流(754)(238)(229)(143)总资产周转率 0.31 0.34 0.39 0.42 资本支出 89(43)(84)(13)应收账款周转率 3.38 4.10 4.13 4.08 长期投资(157)(1)1 0 应付账款周转率 1.59 2.05 2.06 2.04 其他(686)(193)(146)(130)每股指标每股指标(元元)筹资活动现金流筹资活动现金流 756(34)(20)(16)每股收益 0.34 0.44 0.56 0.72 短期借款 8(6)1(1

154、)每股经营现金 0.26 0.46 0.58 0.76 长期借款 0 0 0 0 每股净资产 3.59 4.03 4.59 5.31 其他 756(28)(22)(17)估值比率估值比率 现金净增加额现金净增加额 190 53 167 383 P/E 35.60 27.76 21.80 17.03 P/B 3.41 3.04 2.67 2.31 EV/EBITDA 18.51 17.88 14.38 10.94 资料来源:浙商证券研究所 拓尔思(300229)深度报告 http:/ 41/41 请务必阅读正文之后的免责条款部分 股票投资评级说股票投资评级说明明 以报告日后的 6 个月内,证券相

155、对于沪深 300指数的涨跌幅为标准,定义如下:1.买 入:相对于沪深 300 指数表现20以上;2.增 持:相对于沪深 300 指数表现1020;3.中 性:相对于沪深 300 指数表现1010之间波动;4.减 持:相对于沪深 300 指数表现10以下。行业的投资评级:行业的投资评级:以报告日后的 6 个月内,行业指数相对于沪深 300 指数的涨跌幅为标准,定义如下:1.看 好:行业指数相对于沪深 300指数表现10%以上;2.中 性:行业指数相对于沪深 300指数表现10%10%以上;3.看 淡:行业指数相对于沪深 300指数表现10%以下。我们在此提醒您,不同证券研究机构采用不同的评级术语

156、及评级标准。我们采用的是相对评级体系,表示投资的相对比重。建议:投资者买入或者卖出证券的决定取决于个人的实际情况,比如当前的持仓结构以及其他需要考虑的因素。投资者不应仅仅依靠投资评级来推断结论。法律声明及风险提示法律声明及风险提示 本报告由浙商证券股份有限公司(已具备中国证监会批复的证券投资咨询业务资格,经营许可证编号为:Z39833000)制作。本报告中的信息均来源于我们认为可靠的已公开资料,但浙商证券股份有限公司及其关联机构(以下统称“本公司”)对这些信息的真实性、准确性及完整性不作任何保证,也不保证所包含的信息和建议不发生任何变更。本公司没有将变更的信息和建议向报告所有接收者进行更新的义

157、务。本报告仅供本公司的客户作参考之用。本公司不会因接收人收到本报告而视其为本公司的当然客户。本报告仅反映报告作者的出具日的观点和判断,在任何情况下,本报告中的信息或所表述的意见均不构成对任何人的投资建议,投资者应当对本报告中的信息和意见进行独立评估,并应同时考量各自的投资目的、财务状况和特定需求。对依据或者使用本报告所造成的一切后果,本公司及/或其关联人员均不承担任何法律责任。本公司的交易人员以及其他专业人士可能会依据不同假设和标准、采用不同的分析方法而口头或书面发表与本报告意见及建议不一致的市场评论和/或交易观点。本公司没有将此意见及建议向报告所有接收者进行更新的义务。本公司的资产管理公司、

158、自营部门以及其他投资业务部门可能独立做出与本报告中的意见或建议不一致的投资决策。本报告版权均归本公司所有,未经本公司事先书面授权,任何机构或个人不得以任何形式复制、发布、传播本报告的全部或部分内容。经授权刊载、转发本报告或者摘要的,应当注明本报告发布人和发布日期,并提示使用本报告的风险。未经授权或未按要求刊载、转发本报告的,应当承担相应的法律责任。本公司将保留向其追究法律责任的权利。浙商证券研究所浙商证券研究所 上海总部地址:杨高南路 729 号陆家嘴世纪金融广场 1号楼 25层 北京地址:北京市东城区朝阳门北大街 8号富华大厦 E座 4层 深圳地址:广东省深圳市福田区广电金融中心 33层 上海总部邮政编码:200127 上海总部电话:(8621)80108518 上海总部传真:(8621)80106010 浙商证券研究所:https:/

友情提示

1、下载报告失败解决办法
2、PDF文件下载后,可能会被浏览器默认打开,此种情况可以点击浏览器菜单,保存网页到桌面,就可以正常下载了。
3、本站不支持迅雷下载,请使用电脑自带的IE浏览器,或者360浏览器、谷歌浏览器下载即可。
4、本站报告下载后的文档和图纸-无水印,预览文档经过压缩,下载后原文更清晰。

本文(拓尔思-深度报告:语义智能领军者大数据+AI双轮驱动打开公司广阔空间-221129(41页).pdf)为本站 (originality) 主动上传,三个皮匠报告文库仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。 若此文所含内容侵犯了您的版权或隐私,请立即通知三个皮匠报告文库(点击联系客服),我们立即给予删除!

温馨提示:如果因为网速或其他原因下载失败请重新下载,重复下载不扣分。
相关报告
会员购买
客服

专属顾问

商务合作

机构入驻、侵权投诉、商务合作

服务号

三个皮匠报告官方公众号

回到顶部