《艾瑞咨询:2022年中国数据库研究报告(42页).pdf》由会员分享,可在线阅读,更多相关《艾瑞咨询:2022年中国数据库研究报告(42页).pdf(42页珍藏版)》请在三个皮匠报告上搜索。
1、中国数据库研究报告2022.12 iResearch Inc.22022.12 iResearch I摘要来源:艾瑞咨询研究院自主研究绘制。数据库行业趋势洞察:数据库出海成为国产厂商的全新增量逻辑,欧美线路和东南亚线路是国产厂商出海的优选项;云原生进入2.0时代,实现了云资源对数据库的细粒度资源拆解和优化编排,云托管数据库进一步向原生式数据库推演;数据库与大数据技术的边界不断模糊,呈现融合趋势。中国数据库市场规模:据艾瑞统计,2021年中国数据库市场总规模达286.8亿元,同比增长16.1%。中国数据库市场虽受疫情影响,但整体稳步增长,由多方面因素促成:1)信创利好;2)需求驱动;3)国产厂商
2、厚积薄发;4)国内用户对基础软件的IT支出,尤其是国产数据库的付费意愿逐年提升。在数据库市场供给侧:分布式架构的技术特性趋于融合,云化部署大势所趋,使用门槛不断降低;数字化业务场景不断丰富,业务需求驱动HTAP技术成为重要的技术底座;在开源数据库领域,国产开源时间不长,整体表现尚有提升空间;国产数据库借信创东风,迎来了前所未有的发展机会。在数据库市场需求侧:在数字化转型浪潮下,企业用户的数据已初具规模,业务场景和数据结构越来越复杂,对于数据分析的需求日趋强烈。数据库部署方式呈现多元化,其中分布式架构和云部署的渗透率显著提升。随着国产数据库的技术创新以及产品性能提升,国产产品的头部效应明显,用户
3、体验仍有待进一步完善。3数据库供给侧分析2数据库需求侧分析3典型企业案例4数据库概述1行业趋势洞察542022.12 iResearch I定义数据库是由DBMS统一管理的,有组织、共享的数据集合数据是描述事物的符号记录,具有多种表现形式,包括文字、图形、图像、声音和语言等。数据库是相互有关联关系的若干数据的集合,特点是数据间联系密切、冗余度小、独立性较高、易扩展,并且可为各类用户共享。数据库管理系统(DBMS)是负责数据库搭建、使用和维护的系统软件,通过组织、索引、查询、修改数据库文件,实现数据定义、组织、存储、管理以及数据库操作、运行、维护等主要功能。围绕DBMS构建包含硬件操作系统、数据
4、库管理系统、数据库管理员以及相关机制配套在内的数据库系统(DBS),才能有组织、动态地存储大量相关数据,方便多用户访问。来源:公开资料,艾瑞咨询研究院整理及绘制。数据库系统架构统一管理、长期储存在计算机内、有组织的相关数据集合数据库(DB)数据库管理系统(DBMS)负责数据库搭建、使用和维护的系统软件存储节点存储节点存储网络节点网络节点网络计算节点计算节点计算数据库管理员(DBA)数据库应用程序(DBAP)DBAP 1DBAP 2DBAP 3终端用户52022.12 iResearch I发展历程硬件技术、应用场景等快速变化,行业格局百花齐放来源:公开资料,艾瑞咨询研究院整理及绘制。数据库行业
5、发展历程MySQL诞生1960IDS:基于网状模型的数据库系统IMS:基于层级结构模型的数据库系统1970Codd提出关系型模型0NoSQL 数据库诞生NewSQL 数据库诞生,鼻祖为Google Spanner2021System R诞生Oracle Release 1诞生1980DB2:IBM 发布,至今广泛应用Oracle 和 Ingres 均完成了商业化Ingres问世,为PostgreSQL 的前身Postgres 系统支持了标准SQLOLAP 数据库出现,要用于构建数据分析类型的数仓,多以分布式部署,列存为主HTAP 数据库诞生云数据库诞生62022.12 i
6、Research I分类数据库按照不同维度,分类方法多种多样来源:艾瑞咨询研究院根据公开资料整理及绘制。按数据结构分类按架构分类按部署模式分类按功能分类按存储介质分类按商业模式分类NoSQL数据库键值数据库宽列数据库文档数据库图数据库NewSQL数据库可扩展性高性能ACID特性多模数据库多模型存储和查询数据为异构数据提供解决方案传统关系型数据库分布式数据库单机数据库简单性可靠性扩展性差成本高昂云原生数据库存算分离高可用高性能多云管理支持本地部署规范标准扩展性差成本高昂混合部署云托管数据库公有云上的MySQLPostgreSQL公有云私有云物理机部署环境变化OLTP强一致性多并发支持实时增删查改
7、OLAP多维分析列式存储发现趋势支持决策HTAP内存数据库磁盘数据库开源数据库费用低配套能力、服务能力、版本更新方面较差商业数据库安全可靠高稳定性数据强一致性高响应速度属性属性属性属性属性全局数据库管理系统局部系统局部系统数据库数据库OLTPOLTPOLTPOLTPHTAPOLTPOLAPSQL引擎应用内存磁盘磁盘SQL引擎内存应用(可选)7数据库供给侧分析2数据库需求侧分析3典型企业案例4数据库概述1行业趋势洞察582022.12 iResearch I2022.12 iResearch I分布式现状分布式数据库是通过计算机网络将物理分散的多个数据库单元连接组成的逻辑上统一的数据库。目前分布
8、式数据库的技术路线分为三类:分库分表+中间件方案、共享存储分布式数据库、去中心化的分布式数据库。当下分布式数据库市场产品繁多,但其技术特性逐渐趋同,从两个角度分析:其一,系统架构。存储采用开源或者自研内核,用一主多从的数据副本保证数据完整性,计算通过 SQL 语句解析分发和结果汇聚,管控用于保证各模块的高可用和故障切换等管理功能。其二,开源和自研两条研发线路。开源主要基于 MySQL 和 PostGreSQL,难点在于源代码改造的技术难度大;自研周期长且技术要求高,国内完全自研产品屈指可数,如 TiDB 和 OceanBase 等。未来分布式数据库的核心竞争要素为分布式事务的稳定性、产品全面性
9、以及生态工具的完备性。来源:艾瑞咨询研究院根据公开资料整理及绘制。来源:艾瑞咨询研究院根据公开资料整理及绘制。分布式数据库技术线路分类数据库中间件技术特性趋于融合,云化部署大势所趋,使用门槛不断降低SQLAPI内存层SQLAPI并发控制层方案:分库分表+中间件,下层单机数据库提供存储,其上封装中间层补足分布式能力优势:兼容性好,学习成本低,用户门槛低劣势:代码修改成本高,计算节点扩展性、全局事务能力及高可用不佳,机器冗余度高方案:共享存储分布式,共享存储集群,提供动态扩容的分布式高性能存储,计算节点独立优势:兼容性好,应用无需改造;事务性能好,读写响应快;共享存储一致性高劣势:依赖共享存储系统
10、,扩展性有限,难以做到跨地域高可用,架构可改造性较低方案:去中心化的分布式,各节点独立计算和存储功能,且不共享数据(shared-nothing),架构存算分离,通过共识算法保证副本高可用优势:架构高度解耦,按需扩展,无数量和规模限制,数据一致性的安全机制更好,高可用高兼容劣势:对硬件要求较高,上下游生态适配度仍需进一步完善分布式数据库发展方向技术特性融合,能力补齐分布式数据库的不同技术路线逐渐融合,取长补短,丰富产品能力,集中体现于两方面:第一,分布式事务的一致性提升,全局一致性协议保护加强;第二,分布式场景下数据分片智能化,多副本细粒度控制能力得到加强。云化与云原生设计分布式数据库与云环境
11、加速融合。一方面,分布式的架构优势可将传统部署与公有云资源结合,解决私有部署灵活度低、成本高等问题;另一方面,云环境可低成本加强分布式架构的高容灾和算力扩展,融合云基础资源实现云原生。软硬件结合,异构芯片混合部署以多核 CPU、异构计算(如DSP、GPU、ASIC、FPGA)持久化内存等为代表新硬件,为分布式数据库提供丰富的想象空间。通过异构芯片的混合部署,让分布式数据库在不同层级上提供锁定模式的安全机制,提供分离模式的性能。单体分布式一体化数据库架构在单机部署下实现分布式数据库的完整功能,从技术上突破分布式数据库的单机性能瓶颈,极大降低分布式数据库的部署门槛。无论用户自身规模大小,采用单机部
12、署抑或水平扩展部署,一套数据库系统便可满足核心系统要求。92022.12 iResearch I2022.12 iResearch I分布式前瞻来源:墨天轮,艾瑞咨询研究院整理及绘制。来源:艾瑞咨询研究院根据公开资料整理及绘制。墨天轮数据显示,国产分布式数据库自2019年以来保持高速增长,热度持续高涨。而通过用户调研了解到,面对分布式数据库的故障时,运维人员往往束手无策。主要原因是相较集中式数据库,分布式数据库对 IT 基础设施可靠性要求更高了,其核心代码主要覆盖了 SQL 实现和数据存储,而未能自动感知各种对数据库稳定性、性能、并发能力有重大影响的故障隐患,也难以在代码层面对此类问题进行处理
13、,从而实现故障自动规避。未来分布式数据库应提升基础数据探测和分析能力,随时针对出现的异常隐患提前处置,实现无需运维人员过多干预的高效自治运行,让分布式数据库从 IT 工程化产品变为真正开箱即用的通用型产品。加强底层故障隐患感知,提升异常处置能力,实现开箱即用2019-2022年国产分布式数据库规模及增速用户对分布式数据库的需求3%62%45%2019.112020.112021.112022.11国产分布式数据库(个)增长率(%)简单灵活稳定可靠超大简单稳定安全无需备份,自动容灾动态扩展永远在线永不出错大型服务集群102022.12 iResearch I2022.12
14、iResearch IHTAP现状业务驱动HTAP技术成为重要底座,与分布式技术天然适配随着业务系统接入数据源复杂性提升,混合负载需求愈发强烈,数据库技术正向多源异构、高实时并发、多 SQL 标准接口的方向演进。过去,HTAP 数据库的技术架构以扩展主行存技术,在行存基础上加列存的方式为主,典型代表有 SQLServer,Oracle 和 L-store 等。随着分布式技术不断成熟,天然适配 HTAP 数据库,于是开启了分布式的架构实现,满足了高并发需求,典型代表有 SingleStore、MySQL Heatwave 和 Greenplum。我们认为未来 HTAP 仍应是在 OLTP数据库的
15、基础上,引入原生分布式架构和低成本存储引擎以扩展大数据量 OLAP 能力。最后,为更好支持 OLAP 的数据开发和建模能力,提升实时分析,HTAP 支持物化视图和外部表,并与各类数据开发工具和 BI 工具适配对接。来源:公开资料,艾瑞咨询研究院整理及绘制。来源:公开资料,艾瑞咨询研究院整理及绘制。现阶段 HTAP 数据库主要架构HTAP 面临的主要挑战特征:主行存为TP负载,内存列存为AP负载,行存经内存优化后高效将增量存储并至列存优势:TP和AP高吞吐,数据新鲜度高劣势:AP扩展性差,负载隔离性差主行存储+内存中列存储特征:依赖分布式架构,主存储为行存,部分从节点作为列存服务器为AP查询加速
16、优势:高扩展性,负载隔离性高劣势:数据新鲜度低分布式行存储+列存储副本特征:RDBMS为TP负载,列数据从行存提取,热数据留在 IMCS,冷数据移至磁盘优势:TP和AP高吞吐,高扩展,负载隔离性好劣势:数据新鲜度低磁盘行存储+分布式列存储特征:主列存为AP负载,增量行存处理TP负载优势:AP高吞吐,数据新鲜度高劣势:TP扩展性差,负载隔离性差主列存储+增量行存储行存列存硬盘TPAP列存TPAP节点分区分区节点分区分区主节点分区分区节点TPAP硬盘行存列存节点列存节点TPAP列存行存不同系统同一系统工程难度低,无法保证对事务的支持能力、数据的时效性、复杂的系统架构等架构技术和工程难度偏高,存在A
17、P和TP负载干扰问题,但事务的支持能力和数据的时效性方面更佳负载隔离数据新鲜度HTAP 数据库中 OLTP 和 OLAP 之间的负载隔离程度与 OLAP 读取事务性数据的时效性是目前需要重点权衡的性能指标。未来有待通过物理隔离与逻辑隔离的协同配合和技术创新,打破或减低二者的权衡与妥协。Trade-off数据时效性数据导入及查询优化当前 HTAP 数据库还未能实现将 TP 生成的实时数据快速同步至 AP 系统进行统计分析,很多 HTAP 数据库是在 TP 数据提交后,通过日志同步将 TP变更同步至 AP 部分,数据载入时间过长,数据时效性没法保证一方面是数据加载问题,包括全量数据快速准确导入和增
18、量数据的实时导入都是 HTAP 数据库亟需快速提升的能力;另一方面是查询性能的有待优化,在 AP 和 TP负载识别、索引等的准确性和响应效率方面存在比较明显的问题112022.12 iResearch I2022.12 iResearch IHTAP前瞻来源:墨天轮,艾瑞咨询研究院整理及绘制。来源:艾瑞咨询研究院根据公开资料整理及绘制。运用内置流处理能力进一步加强AP和TP间的融合墨天轮数据显示,自2020年以来国产 HTAP 数据库发展迅猛,几乎成为新兴数据库的必选项。Gartner 也指出 HTAP 已经成为全球范围内新一代数据库的入场筹码,HTAP 能力成为数据库重要选项。随着数据技术的
19、不断创新,未来 HTAP 数据库会进一步加强 AP 和 TP 之间的连接和融合,在数据库内部实现 AP 和 TP 之间的内置流(Streaming)处理能力。通过将 ETL 工作内置于数据库当中,让 HTAP 数据库同时具备 AP、TP 和流(Streaming)能力。用户可以按需创建各类表,运用流处理能力将表连接,从而获得简单、便捷的数据处理能力。数据库技术的进一步融合会打破当下数据栈的割裂状态,HTAP、流批一体、湖仓一体等技术趋势最终会让数据集中在简单易用、安全可靠、高性价比的数据平台。2019-2022年国产 HTAP 数据库规模及增速7142128100%50%33%2019.112
20、020.112021.112022.11国产HTAP数据库(个)增长率(%)基于内置流处理能力的 HTAP 架构日志层流存储列存HDFS硬盘S3行存分析型功能集群管理层资源管理预调度事务性功能数据源存储层临时存储Serverless 层统一计算管道流处理能力122022.12 iResearch I智能运维融合智能技术实现复杂数据库环境的管理自治DT 时代数据库技术架构和运行环境日趋复杂,种类从单一产品转变为混合型商业数据库和开源数据库组合,依靠人工运维显得捉襟见肘。作为智能化的数据库周边工具,数据库管理平台将机器学习与数据管理在功能上融合统一,利用机器学习增强系统设计开发,以标准化、自动化、
21、智能化的方式提供实时监控、健康巡检、智能诊断、多维分析等数据库管理服务。数据库管理平台的本质是数据库管理经验的代码化,核心方法论是云资源池化、分层解耦以及服务化,实现手段是基于微服务、分布式等云技术实现多元混合数据库环境的统一管理,目标是实现海量数据高安全、高可用、高性能的运维要求,助力数字化转型。来源:艾瑞咨询研究院自主研究及绘制。智能化的数据库管理生态数据库专家经验行业客户最佳实践机器学习融合统一转化为管理平台实施模块数据收据监控诊断1.收集系统指标:包括CPU、内存和磁盘等信息2.收集数据库性能指标:通过指针接入数据库系统采集性能指标1.监控:实时数据及调度相关任务更新配置2.诊断:基于
22、规则策略和专家经验,结合学习引擎处理提供智能诊断主要功能实时监控健康巡检智能诊断多维分析细粒度指标监控异常分析算法集群概览,告警趋势知识库巡检算法专家经验,最佳实践潜在风险告警系统性能实时多维度指标数据实时状态锁定异常快速处理指标和性能可视化多维动态钻取和查看计划分析和优化建议应用场景100%障碍0%障碍事中监控事前预防事后恢复提前规避主动巡检统一监控智能定位快速主备切换保障业务连续132022.12 iResearch I全球开源热度持续,成为国产数据库走向国际化的重要途径开源即开放源代码,用户可在源代码的基础上完成学习和修改。DB-Engines数据显示,截至2021年1月,开源数据库的全
23、球部署首次超过商业数据库。此后,开源数据库凭借在成本、产品丰富度、社区活跃性等方面的突出优势,持续获得了全球的高关注度。开源成为驱动数据库技术和市场变革的重要力量。在此趋势下,开源成为数据库项目冷启动的最佳方式,也是构建国产自研数据库生态、加速技术迭代、让国产数据库走向国际化的重要途径。注释:1、DB-Engines排名是按照当前流行程度的排名,较实际使用情况具有一定的超前性,具体指标包括网站上系统提及的频次、Google trends、IT论坛上系统讨论的频率、提及系统的工作机会数量、专业网络中提及系统的配置文件数和系统在社交网络中的提及次数;2、开源、商业-排名分数(%)为相对值。来源:D
24、B-Engines,艾瑞咨询研究院自主研究及绘制。2013-2022年全球数据库流行趋势2022.1052%48%30354045505560657013-Jan13-Apr13-Jul13-Oct14-Jan14-Apr14-Jul14-Oct15-Jan15-Apr15-Jul15-Oct16-Jan16-Apr16-Jul16-Oct17-Jan17-Apr17-Jul17-Oct18-Jan18-Apr18-Jul18-Oct19-Jan19-Apr19-Jul19-Oct20-Jan20-Apr20-Jul20-Oct21-Jan21-Apr21-Jul21-Oct22-Jan22-
25、Apr22-Jul22-Oct开源-排名分数(%)商业-排名分数(%)142022.12 iResearch I2022.12 iResearch I国产开源国产数据库开源时间不长,整体表现有待提升来源:Github,艾瑞咨询研究院根据公开资料自主研究及绘制。来源:艾瑞咨询研究院根据公开资料自主研究及绘制。国产数据库开源的必要性和发展趋势必要性获取市场信任基于国产数据库行业现状,只有选择开源,彻底打开“黑盒”,才能真正获取用户信任,打开市场局面构建成熟的数据库生态单纯依靠个别技术或软件很难构建成熟、完善的产品,只有选择开源,依赖社区生态推进,才能打磨出出色的数据库产品满足业务场景敏捷性闭源数据
26、库厂商的视角相对滞后,产品反馈链条较长,只有选择开源,才能及时捕获业务场景的敏捷变化开发方式被重塑开发者的用户体验得到高度关注,开发者的门槛不断降低,只需具备前端能力,其他都由全链路的可伸缩服务替代Serverless基于云原生的 Serverless 生态和技术。各链路 Serverless 解决方案串联成全栈 Serverless 体验从 SQL 到 API将数据库用户定位至应用开发者。简化 API 封装和使用,拉进 SQL 到实际应用的距离,让应用开发友好性最大化项目开发活跃度使用者维度代码维度贡献者维度activemergeopenactiveclosenew新增删除数量TiDB604
27、39221146OceanBase54732877774openGauss44-19811-121TDengine28324637653629259439269140PolarDB5504国产开源数据库在 Github 的活跃度细分情况发展趋势近年来国内数据库厂商逐步推进开源策略。但因国内数据库开源时间不长,运营有待加强,整体表现有较大提升空间。以 TiDB 为例,从开发者、使用者及代码角度分析,其开发者活跃、用户众多、代码变化较大,平均2-3年完成一次软件重构,侧面印证了上述特征。国产开源数据库在 Git
28、hub 的整体活跃度32900TiDBTDengineMilvusTiKVNebula GraphDorisOceanBasePikaAliSQLopenGaussStarRocksKylinIoTDBPolarDBTendisLinDBHugeGraphKvrocksTerarkDBRadonDBCovenantSQLMatrixOneTensorBaseFlashDBCnosDBGreptime DB云树Shard DBLEStoneDBgStoreSequoiaDBStar数(个)Fork数(个)152022.12 iResearch I中国数据库产业图谱中国数据库产业图谱来源:公开资料
29、,专家访谈,艾瑞咨询研究院自主研究及绘制。注:图谱仅展示部分典型厂商,图谱展示顺序不代表市场份额排名。国外厂商商业数据库开源数据库数据库管理国内厂商传统厂商云厂商和互联网厂商新兴厂商跨界厂商162022.12 iResearch I市场规模受政策驱动和需求催化,2021年数据库市场规模达286.8亿据艾瑞统计,2021年中国数据库市场总规模达286.8亿,较2020年增长16.1%,CAGR(2021-2026e)达13.4%。中国数据库市场虽受疫情影响,但整体稳步增长,由多方面因素促成:1)信创利好,国家对国产数据库的支持力度大;2)需求催化,数字化业务场景带动数据库多元化发展;3)供给侧厂
30、商厚积薄发,技术创新涌现,产品性能显著提升;4)国内用户对基础软件的IT支出和国产数据库的付费意愿逐年提升。注释:市场规模统计口径为国内外厂商在中国数据库销售的营收。其中包括DBMS基础软件的收入,必要配套工具的收入(数据迁移、数据备份等工具),项目定制化开发、实施、运维等服务的收入,数据库软硬一体机的收入;不包括单独售卖的硬件的收入,单独售卖的大数据平台的收入、单独售卖中间件及应用软件的收入。注释:此处市场规模中包含云厂商托管开源数据库(MySQL、PostgreSQL、MongoDB、Redis等)所得的收入。来源:根据公开资料、企业访谈,结合艾瑞统计模型核算。2020-2026中国数据库
31、市场规模及增速247.1 286.8 336.1 390.0 452.7 520.4 608.6 16.2%16.1%16.7%16.8%16.8%17.5%17.4%202020212022e2023e2024e2025e2026e营收(亿)增长率(%)172022.12 iResearch I发展特点(一)现阶段集中式数据库仍占据主流,分布式有待场景需求拉动据艾瑞调研,若剔除数仓(绝大多数数仓采用分布式部署),集中式数据库的市场份额接近80%,而分布式部署不足20%。从技术角度看,虽然集中式数据库的水平扩展有限,但优点是足够简单和易用,在小规模数据量的场景下性能表现优异,而绝大多数业务场景
32、的数据量并未大到必须使用分布式架构承载。分布式数据库的特征则恰好相反。从应用角度看,分布式部署更受行业头部用户青睐,其中信创环境下的国产化替代风潮起到了很大的推动作用。但运行场景多以非核心业务为主,用户的核心业务仍通过集中式数据库运行。因此,我们认为未来分布式数据库的发展一定是由业务场景的需求拉动。2021年中国数据库市场份额:集中式vs分布式集中式数据库l从传统行业的整体应用情况看(互联网行业自身基本采用分布式部署),数据库部署类型以集中式为主,产品类型以 Oracle 为主。l从传统行业的细分情况看,金融行业对数据安全可靠的要求极高,容错率极低,对集中式数据库高度依赖,部署占比80%左右;
33、政务行业受信创驱动,国产化替代率高,集中式占比60%左右;零售行业头部企业的集中式占比与政务行业接近,在60%左右。80%分布式数据库l从传统行业的整体应用情况看,现阶段分布式部署的占比较低,主要集中于互联网行业本身,占比20%左右。产品以 MySQL 和 PostgreSQL 为代表的各类开源数据库为主。l当前分布式数据库在传统行业的渗透率有待进一步提升,但随着数字化业务场景的深入,未来市场空间较为广阔。从使用热度上看,TiDB、OceanBase、GaussDB、PolarDB 等国产数据库产品在全球和中国的热度都经年不少。20%来源:专家访谈、公开资料,艾瑞咨询研究院自主研究及绘制。18
34、2022.12 iResearch I发展特点(二)事务型数据库增速放缓,分析型和HTAP数据库不断涌现从收入规模来看,事务型数据库的市场份额占主导地位,分析型数据库占比不足20%。但预计未来3-5年内,分析型数据库的市场份额会有较为显著的提升,原因如下:各行业的数字化进程已取得了初步成果,企业核心业务的信息化过程主要是运用关系型数据库承载的事务类业务,因此当下事务型数据库增速已有所放缓。相反随着业务场景的丰富和数据复杂度的提升,诸如市场推广和营销分析类的分析型场景剧增,各类分析模式和分析方法不断涌现,最终都需要具体的分析型数据库执行。此外,HTAP 理念也受到了热捧,但根据调研了解,HTAP
35、 技术线路和产品实现尚未达成行业共识。来源:专家访谈、公开资料,艾瑞咨询研究院自主研究及绘制。2021年中国数据库市场份额:事务型vs分析性“分析型”“事务型”80%20%TPAP执行大量数据事务,适合执行大量“写”操作,可作为AP聚合数据的来源,AP以“读”操作为主对海量数据进行高速多维分析,是数据挖掘、商业智能、复杂分析计算等业务功能的理想选型面向一线工作人员,如收银员、银行出纳员、酒店前台人员,或客户自助服务应用程序面向数据科学家、业务分析师和知识工作者,支持各类决策支持应用程序HTAPHTAP的能力往往有所侧重,现阶段HTAP难以做到在所有场景中具备优势企业级混合负载、实时数据中台、在
36、线和历史数据统一处理等场景优势显著192022.12 iResearch I发展特点(三)信创为国产数据库厂商提供发展沃土,未来市场空间可期在国内数据库市场,传统的商业数据库有两类玩家:其一,以 Oracle 为代表的国外厂商;其二,以达梦、人大金仓、南大通用、神舟通用为代表的国产厂商。二者的此消彼长一方面源于国产厂商技术实力的不断增强,另一方面也反映了信创东风下,国家政策对以数据库为核心的基础软件领域的大力扶持。在此,我们希望通过分析国外厂商在国内数据库市场的商业模式,以反映未来国产化替代过程中,国产数据库厂商的市场空间之巨:据艾瑞调研了解,一直以来国外厂商对国内用户的限制较低,导致在国内数
37、据库市场的隐性规模尚未浮出水面。随着国产替代进程的不断深入,国外厂商的隐性市场份额被逐步释放,国产厂商潜在的市场空间可期。来源:专家访谈、公开资料,艾瑞咨询研究院自主研究及绘制。2021年中国数据库市场份额:国产vs国外国外数据库厂商传统国产数据库厂商其他国产数据库厂商国外厂商:35.9%传统国产厂商:17.2%逐年上升逐年下降显性规模显性规模隐性规模显性规模显性规模隐性规模20数据库供给侧分析2数据库需求侧分析3典型企业案例4数据库概述1行业趋势洞察5212022.12 iResearch I中国数据库用户使用情况调研说明来源:艾瑞咨询研究院自主研究及绘制。为全面了解我国各行业数据库应用情况
38、,深入分析当前我国数据库用户的真实需求和使用痛点,从需求侧洞察产业发展现状及未来趋势,以推动我国数据库产业健康有序发展。本次研究采用综合定性和定量问卷调研的研究方法,面向国内不同行业数据库使用单位中的CTO、CIO、架构师、工程师、数据库管理员(DBA)、产品经理等角色,围绕企业业务特征、数据结构特征、数据使用场景、数据库产品选型要素及使用情况等内容展开分析,以期加深对行业及用户的了解。01 研究目的及内容01 研究目的及内容调研概况描述样本来源艾瑞 iClick 在线调研社区调研时间2022.11覆盖地区全国有效样本数量问卷调研国内数据库用户172家222022.12 iResearch I
39、用户画像数据初具规模,数据结构向非关系型倾斜,分析需求增加来源:艾瑞咨询2022年数据库使用情况调研问卷数据。样本:N=172;于2022年11月通过艾瑞 iClick 在线调研社区获得。随着国内数字化转型节奏加快以及国产替代浪潮涌动,基础软件领域迎来了高速发展。数据库作为信息系统核心软件以及信创的关键环节,迎来产业黄金期,数据库产品的国内渗透率达到前所未有的高度。随着国内数据库用户不断增加,用户画像逐渐清晰,描绘出符合中国特色的数据库用户特征。数据库用户的数据资产积累已初具规模,尤其是互联网、制造、政务、电信等领域多半已达到TB级别。用户的数据结构仍以关系型数据为主,但非关系型数据的比例有明
40、显提升。用户的数据分析需求存在较大的行业偏差,互联网、金融、电信、零售、政务等领域需求较强烈,而能源、制造、物联网等领域相对较弱。2022年中国数据库用户画像数据库用户的数据规模22%13%12%20%9%5%13%6%20%10%10%4%44%12%18%15%18%13%15%33%63%65%65%70%73%73%81%物联网能源金融零售电信政务互联网制造50GB以下50-200GB200GB-1TB1TB以上数据库用户的数据结构数据库用户的数据分析需求33%14%11%18%18%29%50%55%22%43%52%50%64%53%40%35%44%43%37%33%18%18%
41、10%10%物联网能源制造互联网政务金融电信零售非常强烈强一般随着数字化进程加快,各行业的数据规模显著提升,为数据库产品和技术的创新升级提供了沃土用户的数据分析需求受到行业自身特征的影响,并与数据资产规模呈现一定的正相关关系以关系型数据为主63.0%二者参半35.0%以非关系型数据为主2.0%用户的数据结构仍以关系型为主,随着数字化业务场景的不断丰富,非关系型数据积累增加80%75%71%64%64%63%53%48%20%25%29%36%36%37%47%52%电信金融零售互联网政务制造能源物联网关系型为主二者参半232022.12 iResearch I角色定位数据库使用单位中不同角色对
42、产品的考虑要素有所差异数据库使用单位中各职能角色的考虑要素CTOCIO架构师DBA前端工程师后端工程师全栈工程师产品经理CIO的主要考虑要素安全25%稳定19%性能18%成本12%兼容8%运维8%易用6%扩展4%CTO的主要考虑要素成本26%安全15%性能15%稳定11%生态11%运维7%易用7%兼容4%扩展4%架构师的主要考虑要素稳定23%性能21%运维14%生态13%成本10%易用8%兼容7%其他4%DBA的主要考虑要素全栈工程师的主要考虑要素产品经理的主要考虑要素稳定20%性能20%安全17%运维14%兼容10%生态6%风险5%其他8%性能19%稳定18%安全14%成本10%运维10%扩
43、展9%兼容8%其他12%稳定18%安全18%运维18%易用13%风险10%兼容8%扩展8%其他7%后端工程师的主要考虑要素性能18%兼容14%安全14%运维14%稳定12%易用9%扩展7%其他12%前端工程师的主要考虑要素性能14%扩展14%安全14%运维14%兼容10%易用10%稳定10%其他14%来源:艾瑞咨询2022年数据库使用情况调研问卷数据。样本:N=172;于2022年11月通过艾瑞 iClick 在线调研社区获得。242022.12 iResearch I产品部署数据库趋于多元化部署,分布式架构和云部署渗透率提升近年来,数据复杂度以及对数据的海量、多模、异构、弹性等要求不断提高,
44、单一数据库难以满足当下的用数需求,数据库的多元化趋势显著。从调研数据可见,架构师和开发人员基于前端的数据使用需求呈现多样化,在研发规划之初便选择不同的数据库以满足开发需求。随着数据库技术的更新迭代,用户的选择灵活度更大,除功能、安全等传统因素之外,可从架构、研发、运维等多个维度考虑。在架构选型上,分布式架构的整体渗透率已超80%,其中仍以中间件+分库分表的实现方式为主。从部署模式看,云数据库的使用率接近80%,其中公有云占比60-70%。数据库用户的产品部署特征数据库用户的多元化部署多元化数据库78%单一数据库22%互联网,24%制造,19%交通,19%零售,11%单一数据库用户行业结构不同规
45、模数据库用户的产品部署500人以下500-3000人3000人以下架构线路部署模式来源:艾瑞咨询2022年数据库使用情况调研问卷数据。N=172注释:问题:请问企业当前使用的数据库有哪些?请问企业使用分布式数据库的情况?请问企业使用云数据库的情况?57%51%60%31%33%25%12%16%15%中间件+分库分表原生式分布式集中式10%18%35%22%18%27%20%20%15%14%18%13%22%18%8%12%8%私有云本地部署容器Kubernetes公有云厂商数据库公有云虚拟机公有云托管252022.12 iResearch I2022.12 iResearch I产品体验国
46、产产品渗透率的头部效应明显,用户体验有待进一步完善在调查数据库用户的使用体验时,我们收获的反馈相对集中:第一,数据库迁移难度大,占比19.2%,难点聚焦于迁移过程中的兼容性、数据安全、停机时间、数据校验和性能保证等。第二,缺乏数据库的一站式管理,占比14.8%,当前市场上的一站式管理平台以管控类为主,主要面向DBA等专业技术人员,而对开发、业务、运维等其他角色的门槛偏高。第三,运维与备份的复杂度高,占比14.3%,随着技术路线的灵活度和复杂度提升,运维与备份和难度势必增加。具体到国产数据库的市场渗透情况,PolarDB 排名第一,MogDB 排名第二,达梦排名第三,TiDB排名第四。在云厂商中
47、,阿里云的市场份额排名第一,华为云和腾讯云并列第二,亚马逊排名第三。数据库用户的使用体验国产数据库的市场渗透情况阿里云48%华为云16%腾讯云16%亚马逊8%oracle7%其他5%1%5%7%9%9%10%10%14%15%19%其他产品迭代失真、误导平台化产品的功能阉割全流程开发工具不足稳定性不足安全性不足平台化产品的功能衔接不完整运维与备份复杂度缺乏数据库一站式管理数据库迁移难度大25%17%11%10%7%6%5%4%4%3%3%7%PolarDBMogDB达梦TiDBTDSQLAlibaba TSDBGaussDBGaussDB(DWS)OceanBaseStarRocksopenG
48、auss其他来源:艾瑞咨询2022年数据库使用情况调研问卷数据。N=172注释:问题:请问企业使用数据库的体验如何,有哪些痛点?来源:艾瑞咨询2022年数据库使用情况调研问卷数据。N=172注释:问题:请问企业使用的国产数据库有哪些?云数据库使用者选择了哪些云厂商?262022.12 iResearch I2022.12 iResearch I未来规划深化多元化部署,技术选型更加注重安全稳定与服务能力在调研数据库用户的未来部署规划时,我们发现超过60%的用户计划未来使用更多类型的数据库产品,以满足日趋复杂的数字化业务场景。在产品架构选择上,以单机或集中式架构为主的数据库用户中,超过50%计划未
49、来选用分布式数据库,其中计划采用原生式和中间件+分库分表的比例接近1:1。而在产品部署形态上的调研结果较为有趣,当前采用本地化部署形态的数据库用户中,超过60%的用户表示未来上云的意愿不强。究其原因,主要是市场环境与体制因素导致的国内外云计算市场的显著差异,具体体现为传统企业上云以项目制、定制化解决方案为主,以混合云带动公有云发展,理论发展前景大,但实际增速明显低于海外。用户未来规划中的国产数据库热度汇总分布式数据库选型要素4%8%10%12%15%15%16%19%其他行业积累与标杆案例产品价格产品技术与周边生态运维复杂度服务能力容灾能力安全性云数据库选型要素5%5%7%12%13%18%2
50、0%20%其他本地化服务能力行业积累与标杆案例产品价格产品技术与周边生态服务能力高可用性安全性来源:艾瑞咨询2022年数据库使用情况调研问卷数据。N=172注释:问题:在企业计划使用更多数据库的前提下,请问企业未来计划使用或感兴趣的数据库有哪些?来源:艾瑞咨询2022年数据库使用情况调研问卷数据。N=172注释:问题:企业在分布式数据库/云数据库选型时的主要考虑因素?16%11%9%9%9%5%4%4%4%3%3%3%3%3%2%2%9%TiDBOceanBasePolarDBMogDB达梦人大金仓GaussDBGaussDB(DWS)openGaussTDSQLAlibaba GDBAlib
51、aba TSDBAlibaba ADBGbaseDolphinDBPandaDB其他27数据库供给侧分析2数据库需求侧分析3典型企业案例4数据库概述1行业趋势洞察5282022.12 iResearch I阿里云阿里云瑶池数据库涵括关系型数据库、分析型数据库、NoSQL数据库、数据库生态工具等版块,包含PolarDB、AnalyticDB、Lindorm、RDS、MongoDB、DMS等产品家族,为企业提供覆盖实时处理与存储、分析和发现、数据开发与治理的云原生一站式数据管理与服务。来源:阿里云,艾瑞咨询研究院整理及绘制。云原生数据库2.0云原生一站式数据管理与服务阿里云瑶池数据库架构体系主要用
52、户及技术领先性全栈自研、全球领先的技术能力CIPU一体化数据管理与服务DMS一站式在线数据管理平台:保障数据资产安全,激活数据价值数据共享阿里云瑶池数据库拥有完全自主知识产权关键技术与软件栈累计提交技术发明专利400+兼容 MySQL/PG,高度兼容 Oracle460+项核心代码自主研发率超过85%国际顶级学术会议发表论文超过30篇国家权威奖项和机构认可中国信息安全测评中心官方认证中国电子学会科学技术奖一等奖浙江省科学技术进步奖一等奖金融行业标准认证数据实时处理与存储数据分析和发现云原生内存数据库Tair云原生关系型数据库 PolarDB云数据库 RDS云原生多模数据库 Lindorm云数据
53、库 MongoDB云原生数据仓库 AnalyticDB云数据仓库 ClickHouse数据库安全可信引擎全空间数据引擎 Ganos数据库自治服务 DAS数据库备份 DBS云原生 DBaaS 管控平台(公共云、混合云:飞天企业版/DBStack)飞天内核平台神龙计算盘古存储洛神网络安全防护倚天芯片磐久基础设施主要企业用户自然人税收管理系统交通部路网中心上海市新能源汽车数据平台292022.12 iResearch I阿里云云原生数据库PolarDB:业内首次实现“三层解耦”架构来源:阿里云,艾瑞咨询研究院整理及绘制。“三层解耦”架构演进AbcChunkServerParallel Raft应用自
54、定义读写分离自动负载均衡HA切换安全保护智能代理PolarProxy数据库计算节点两层解耦:存储计算分离CPU内存CPU内存CPU内存CPU内存分布式共享存储READ/WRITEREADREAD/WRITEREAD读写节点CPU读写节点CPU读写节点CPU只读分析节点CPUDistributed Memory Cluster分布式提交时间戳分布式缓存一致性分布式全局锁行存 内存池列存 内存池分布式共享内存池CPU节点RDMA network三层解耦:内存池化应用自定义读写分离自动负载均衡HA切换安全保护智能代理PolarProxyPolarFS on PolarStoreRDMA networ
55、k读写节点只读节点只读节点只读节点AbcAbcChunkServerChunkServerAbcChunkServerParallel Raft分布式共享存储PolarFS on PolarStoreRDMA networkAbcAbcChunkServerChunkServer302022.12 iResearch I2022.12 iResearch I偶数科技来源:偶数科技,艾瑞咨询研究院整理及绘制。来源:偶数科技,艾瑞咨询研究院整理及绘制。打造 Skylab 产品体系,致力于云原生数据技术的突破创新偶数科技专注于云数据平台产品和解决方案,由 Apache HAWQ 数据库项目创始人发起
56、成立,有多位核心 Apache Committer。偶数科技搭建起云数据平台 Skylab 产品体系,包含:云数据库 OushuDB、自动化机器学习平台LittleBoy、数据分析与应用平台 Kepler 以及数据管理平台 Lava。Skylab 实现了云原生实时湖仓一体六大创新能力,攻克了集群规模和并发受限、非结构化数据无法整合、建模路径冗长、数据一致性弱等难题,打破数据孤岛、优化数据供给能效、降低运维成本和技术门槛。偶数科技是国家级专精特新“小巨人”企业,入选福布斯中国企业科技 50 强,Gartner Cool Vendor 和 IDC Innovator。Skylab 产品体系及 AN
57、CHOR 特性平台及行业解决方案SkylabOushuDBKeplerLittleBoyLava云原生:适合云环境,自由增减计算和存储资源,按用量计费,节约成本。2数据一致性:通过完善的事务机制,保障不同用户同时查询和更新同一份数据时的一致性。3超高并发:支持数十万用户使用复杂分析查询并发访问同一份数据。4一份数据:所有用户(BI 用户、数据科学家等)可以共享同一份数据,避免数据孤岛。5实时 T+0:全量数据T+0流处理和实时按需查询,基于数据的事前预测、事中判断和事后分析。6支持多类型数据:支持关系表、文本、图像、视频等结构化数据和非结构化数据存储。1大数据与AI能力Skylab 云数据平台
58、平台解决方案融合计算、统一存储、敏捷高效数据开发平台指标标签平台BI分析与可视化数据共享平台数据资产管理专题数据集市机器学习平台实时数仓平台离线数仓平台实时湖仓一体平台大数据平台跨库融合平台行业场景解决方案数字化营销、数字化管理、数据科学管理驾驶舱指标与标签系统实时分析系统自主分析方案报表管理平台可视化大屏监管报送方案智慧营销方案智慧审计方案智能运维方案智慧运营方案数据填报系统312022.12 iResearch I2022.12 iResearch I偶数科技来源:偶数科技,艾瑞咨询研究院整理及绘制。来源:偶数科技,艾瑞咨询研究院整理及绘制。OushuDB 分布式云原生数据库,自主研发,信
59、创可用OushuDB 是由偶数科技自主研发打造的,新一代云原生分布式数据库,采用存算分离架构,按需弹性,支持公有云与私有云。OushuDB 遵循 ANSI-SQL 标准,支持完整事务特性,具备极速执行器,提供 PB 级数据交互式查询能力,以及对主要 BI 工具的描述性分析支持和高级机器学习功能。在实时数据处理方面,基于 OushuDB,偶数科技提出了满足实时流处理、实时按需分析和离线分析的 Omega 架构,率先实现了实时湖仓 ANCHOR 能力,在简化数据架构,提升数据处理效率,避免数据孤岛的同时,极大提升了企业实时数据分析能力。OushuDB 的产品架构与主要特点Omega 架构与实时数据
60、处理场景VC计算节点计算节点客户端VC实例虚拟计算集群主节点客户端客户端客户端客户端主节点主节点主节点主节点VC计算节点计算节点VC实例虚拟存储集群元数据Magma VSC数据Magma VSC数据HDFS VSC数据S3 VSC存算分离架构,优化数据基础设施的可扩展性,满足云端应用弹性和扩容需求。支持腾讯云、阿里云、华为云、金山云、微软 Azure、AWS 等主流云平台。云原生具备SQL标准和ACID特性,支持对接访问Hive、HDFS等 Hadoop原生组件,同时兼容基于Oracle,Greenplum,PostgreSQL开发的数字应用。强兼容PB级数据复杂查询,相比 SQL-on-Ha
61、doop和MPP快一个数量级。全新设计的执行器让性能提升510倍,显著降低批处理和即席查询所需的时间。高性能研发团队曾主导国际顶级数据库开源项目。产品满足自主代码率要求,兼容国产软硬件平台,符合国家信创标准,帮助用户顺利完成国产化升级。纯国产率先支持分析型负载超高并发,多主节点水平扩展的同时,保证完备的查询服务,实现多主节点集群的高可用,可同时使用复杂查询访问一份数据。高并发在金融、电信、政府、能源、制造和互联网等行业得到广泛的部署和应用。偶数科技聚焦客户业务痛点,以数字化转型推动管理创新和业务增长。应用广Lambda应用查询KappaWaspFlinkKafka数据实时处理三大场景事情发生同
62、时事情发生后短时间内事情发生后较长时间实时流处理实时按需分析离线分析偶数科技主要企业用户322022.12 iResearch I2022.12 iResearch I矩阵起源开源超融合能力打破数据边界,全面降低数智化转型门槛矩阵起源是一家专注于为企业用户提供简捷强大的数据操作系统的数据基础软件公司。公司创始团队来自腾讯云、Snowflake等国内外一流的互联网企业、软件公司、数字化企业和开源社区,核心团队为产品、研发、解决方案、生态和开源社区等领域的专家,在分布式架构、数据库、云计算、大数据及人工智能等领域积累了丰富经验。作为一家数据智能领域的创新企业,矩阵起源虽成立时间不久,但凭借领先的技
63、术创新和工程能力,自主研发超融合异构云原生数据库MatrixOne。产品提供超融合引擎、异构云原生、极致性能等核心能力,帮助用户充分释放数据潜力和创新力,在行业市场已拥有一定的品牌影响力,并获得“2022中国信科种子独角兽企业”、“大湾区高成长性企业TOP50”等行业荣誉。来源:矩阵起源,艾瑞咨询研究院整理及绘制。来源:矩阵起源,艾瑞咨询研究院整理及绘制。MatrixOne 的产品架构MatrixOne优化储存和计算资源异构基础设施部署支持混合工作负载服务多种数据应用ERPCRM供应链管理仪表盘交互式分析机器学习边缘设备数据中心私有云公有云OLAPStreamingOLTP时序动态调整性能优化
64、成本优化MatrixOne 的核心能力极简开发运维:统一的开发协议、数据治理和安全管理,开箱即用服务多种数据应用,大幅降低开发、运维及运营的成本。变ETL为ELT:实时数据更新即可见,摆脱冗余ETL和各种复杂依赖,解决数据不一致问题,有效提高数据应用开发效率。跨云高性价比:避免厂商绑定,实现数据集群跨云跨地域的统一管理与极致伸缩,优化混合基础设施部署性价比。极简开发运维变ETL为ELT极致分析性能:在资源隔离的基础上支持OLTP和OLAP负载的独立拓展,复杂查询性能提升35倍,增加业务敏捷度。极致分析性能跨云高性价比332022.12 iResearch I矩阵起源灵活支持事务、分析和流计算的
65、超融合异构云原生数据库MatrixOne借助自主研发的分布式存算框架,实现一套数据库系统同时灵活支持事务、分析和流计算的数据管理和应用,并支持公有云、私有云、数据中心和边缘节点的部署和使用。MatrixOne基于S3优化的存算分离架构,让用户的云原生/本地部署都有高可扩展、高可用、高弹性的性能体验。通过全新设计和开发的TAE存储引擎,实现一个引擎同时支持事务和分析功能,并保证数据分析的高性能和低延迟。此外,MatrixOne内置的流引擎允许直接、无缝地访问表,对数据源进行流化处理,避免冗余的数据复制、转换和移动,并通过基于因式计算查询引擎的增量物化视图技术,高效处理工作负载。基于矩阵起源的核心
66、技术与创新能力,MatrixOne让数据应用开发更加敏捷,运维更加简化,同时保证了性能极致。来源:矩阵起源,艾瑞咨询研究院整理及绘制。MatrixOne的应用场景与用户收益应用场景用户收益单一数据库系统支持业务管理和报表分析应用,充分利用多云和云边协同,降低信息化转型门槛中小企业1HTAP单一数据库系统支持数据湖/数据中台建设,确保数据完整性和一致性,降低系统复杂度、运维和开发成本大中型企业2HSTAP/湖仓一体实现从业务系统到决策系统的实时数据流动,提升数据实时分析性能互联网创新企业3HSAP/流批一体3241极简的开发和运维,开箱即用服务多种应用基于单一数据库即可实现对多个工作负载的共享、
67、权限、安全及审计管理,提供统一的数据治理、访问协议和开发接口可针对AP/TP工作负载配比自动调整资源,达到资源利用率和性能的最佳平衡需要学习的技术栈从6+减少到1个,降低20%50%开发运维及运营成本消减数据碎片,支持端到端的实时数据分析支持AP在各种数据(交易数据、日志数据、物联网数据等)的工作负载,始终保持数据新鲜度和一致性,数据更新延迟降低至毫秒级创新的增量物化视图,摆脱冗余ETL工作和各种复杂依赖,大幅提高数据应用开发效率极致的分析性能,不影响其他工作负载单表、星型和雪花查询都具备极速分析性能,同时支持数据更新、删除和实时点查询,让数据生产即可分析支持AP/TP工作负载的独立快速扩展,
68、大幅提升业务敏捷度避免厂商绑定,实现数据集群跨云最优性价比为异构基础设施提供统一数据技术架构和数据管理方案实现跨云跨地域的自动调度与无感知扩缩容,大幅提升混合基础设施的性价比342022.12 iResearch I2022.12 iResearch I沃趣科技中立的企业级数据库云,让数据库基础设施更简单沃趣科技创建于2012年,创始团队为原阿里巴巴去“IOE”时期数据库团队骨干。多年来结合数据库多元化、国产化及云化趋势,为企业用户提供最佳的数据库基础设施创新。目前,沃趣科技的产品版图覆盖数据库国产化替代、私有云PaaS和公有云RDS三大体系,支持国内外主流数据库,提供企业级全生命周期的数据库
69、管理能力。除基础平台外,沃趣还独立研发了DTS、DBS和DMS等数据库工具,降低用户数据迁移、备份和管理的成本。至2022年,沃趣已累计服务3000+企业客户与40+行业,是国家级高新技术企业、浙江省级企业研究院单位、浙江省信创联盟理事单位、杭州准独角兽企业。来源:沃趣科技,艾瑞咨询研究院整理及绘制。来源:沃趣科技,艾瑞咨询研究院整理及绘制。沃趣科技的核心产品体系沃趣科技的典型案例制造行业教育与医疗证券行业运营商 基于国产数据库、操作系统、芯片提供全信创数据库一体化服务。构建云原生数据库底层基座,为运营商提供安全、稳定、可靠的开放数据库云平台解决方案。完成多类型数据库云部署,覆盖14个数据中心
70、、12个省级中心,目前已稳定运行了 6w+实例,4000+部署节点。满足技术无感化需求,对上端业务屏蔽底层数据库复杂技术实现,提升资源池化能力,覆盖数据库服务多个应用场景。指数级提升业务效率,支撑制造业进行更多更广的信息化建设,助力其达到最佳营收增长。承载医院核心HIS系统,覆盖备份容灾等多业务数据库,医疗行业多数据库全生命周期管理,助力“云上”医院数字化进阶。基于统一数据库服务能力支撑,助力智慧校园IT架构整合,保障核心数据系统稳定运行。解决金融机构核心交易数据库集中化难题,为核心交易业务基础平台架构的开放和可控发展提供可靠保障,提升核心系统交易处理能力520倍,TCO降低70%,实现水平云
71、化扩展。订阅模式中立的企业级数据库云公有云RDS国产化替代数据库私有云PaaS多云部署成本降低40%SaaS订阅模式iRDS.cn多数据库支持 生态集成社区版免费快速搭建数据库集群覆盖全球15款不同类型主流数据库与20+主流私有云平台的原生集成QDataQFusion-C传统架构十倍性能为关键业务场景设计,一体化服务全栈式兼容适配国产芯片、服务器、操作系统、数据库等,打造一站式全信创数据库私有云QCP沃趣数据库云平台数据库私有云PaaS国产化替代一云多芯Intel飞腾海光鲲鹏高性能数据库私有云平台全信创数据库私有云平台广泛应用于核心交易系统、数据仓库和大数据云平台35数据库供给侧分析2数据库需
72、求侧分析3典型企业案例4数据库概述1行业趋势洞察5362022.12 iResearch I2022.12 iResearch I趋势一:出海国产数据库的全新增量逻辑,风险与机会并存随着基础软件领域成为资本热土,仅2021年新成立数据库公司超30家,新兴厂商核心团队普遍来自大厂,技术扎实,经验丰富,产品各具特色,性能较佳,并且资金充裕。但另一方面,国内数据库市场的用户侧呈现如下特点:第一,互联网用户多采用开源或自研数据库,极少使用新兴的产品;第二,政企类用户具备完善的产品和服务生态,新兴厂商难切入;第三,缺乏互联网+新“风口”带动市场增量空间;第四,大量中小企业存续不稳定,对数据库需求不强烈。
73、数据库厂商纷纷提出出海战略,创业公司自成立之初便定位国际化,但普遍面临信任度、监管、地理位置等障碍,而上云、开源、新技术敏感度成为除基础技术以外,国产数据库顺利出海的关键要素。来源:公开资料,艾瑞咨询研究院整理及绘制。来源:公开资料,艾瑞咨询研究院整理及绘制。国产数据库的出海线路数据库出海是必然趋势l数据库行业制高点国际数据库巨头齐聚,是商业化难度最大、技术趋势最为领先、最具挑战性的市场,但也是最有说服力的市场。l欧美打标杆,日韩做变现在世界顶级市场拿下标杆案例,是国产数据库出海的重要意义,之后进击日韩基础软件市场,已成为比较理想的发展路径。欧美线路 东南亚线路l潜力巨大,蓝海市场相对中国,现
74、阶段东南亚的互联网水平整体较为滞后,处于互联网业务激增、传统业务数字化转型的初级阶段。l商业化路径更快经国内数字化转型打磨多年的国产数据库产品与东南亚市场现阶段的用数需求契合。与生俱来的全球化基因数据库的底层语言为全球通用的 SQL 语句,性能优异的产品理应在全球化市场中占有一席之地。数据库上云降低出海门槛打破本地部署模式下,数据库海外交付的物理阻碍,借助云厂商的原生式 IaaS 能力,快速搭建海外渠道。数据库开源,内外兼修一方面开源社区加快产品研发,提升产品质量;另一方面,开源有利于降低海外用户对于中国数据库的顾虑,友好性提升。国产原生分布式技术具备先进性为国产数据库提升可靠性、满足日趋复杂
75、的用数场景提供了全新的“解题思路”,加快了赶超国际一流数据库的步伐。372022.12 iResearch I趋势二:云原生上层需求驱动,底层技术支撑,存算分离,优化资源编排数据库云托管解放了底层硬件的管理成本和计算资源约束,但底层存算一体的资源绑定导致无效成本和资源浪费。云原生数据库实现了云资源对数据库的细粒度资源拆解,符合业务的资源编排。尽管各家厂商的架构设计和创新思路不尽相同,但可总结为“软硬兼施”。在软件层面,计算层打包 SQL 语句解析、物理计划执行、事务处理等,共享存储层存放事务日志和数据存储,并通过分布式技术保障高可用和一致性,最后二者采用高速网络互联,通过数据传输协议或其他技术
76、提升 I/O 性能。此外,云原生数据库的分层架构还需结合新硬件技术的特性进行重构,如运用可扩展 CPU 和高主频内核进行算力优化,运用持久内存(PMEM)重构二级缓存以提升 I/O 密集型场景下的读写性能。未来数据库将进入从硬件平台到架构层再到应用层的全栈优化时代。来源:艾瑞咨询研究院自主研究及绘制。云原生数据库的整体架构和主要特点云原生数据库的主要架构特征。采用计算资源层与存储资源层解耦的技术架构,所有节点共享一份存储,增加计算节点无需调整存储资源或拷贝数据文件,充分发挥资源弹性。资源池化,存算分离云原生数据库的主要特点利用云基础设施能力,实现数据库的跨可用区部署访问、全球就近接入和异地灾备
77、能力、避免计算层和存储层不必要的数据交互、节省计算层和存储层的高速网络带宽等。与云深度融合提供统一入口,支持 HTAP 混合负载,内部转换逻辑无感知;支持系统切换与故障转移时的连续无感知;具备多主能力,自动均衡业务请求,高效处理读写冲突,让应用使用无感知。应用无感知利用云基础设施资源,提供兼容多种生态接口的统一架构,支持关系型、非关系型、多模型等多种接口访问。兼容开放云基础设施计算集群应用层基础设施共享存储计算层分布式存储系统推荐对象存储(OSS),无需预制存储空间,按需付费,低成本,高可用高持久高速网络互联计算节点计算引擎计算节点计算引擎应用(OLTP&OLAP)互联网金融电信零售制造382
78、022.12 iResearch I趋势三:湖仓一体数据库与大数据技术边界不断模糊,呈现融合趋势来源:公开资料,艾瑞咨询研究院整理及绘制。以 Hadoop 为代表的大数据技术以低成本的方式提供海量数据的开发和运行处理,但缺点是结构化能力较差,早期不支持 SQL 语句解析。随着大数据技术发展,基于 Hadoop 的数仓工具 Hive 开始提供 SQL 查询功能,但整体性能较差。随后支持 SQL 查询的工具(如Spark SQL)开始涌现,大数据技术的分析处理能力提升,结构化趋势明显。另一方面,数据库天然具备强结构化能力,尤其关系型数据库原生支持 SQL 查询,但早期存储成本高,对海量数据的支持能
79、力不足。但随着对象存储(OSS)被广泛应用,其低成本、高可用、数据持久及按需付费的特点,让数据库产品能够应对轻体量的大数据场景。由此,随着数据技术的发展创新,数据库与大数据技术的边界不断模糊,二者互相延伸。我们认为传统大数据技术有着更为丰富的生态,但是对技术要求较高,相比较而言,从仓向湖的延伸路线,更适合传统企业和中小企业。湖仓一体下数据库与大数据技术的相互延伸湖仓一体架构非结构化数据半结构化数据数据源结构化数据存储层(支持ACID事务一致性)计算引擎统一资源访问/调度PrestoFlinkSparkHive数据管理AI计算数据挖掘联机事务Hive数据治理数据接入质量管理元数据管理访问控制前端
80、应用数据调度实时报表实时查询数据交换能力强化增强SQL能力更多语法与特性支持更多数据源支持任务自动调优精细化资源管理自动扩容缩容细粒度资源调度数据库架构数据库系统(DBS)应用程序数据库系统(DBS)数据库修改读取维护 管理写入搭建能力强化一方面,对象存储(OSS)被广泛应用,极大降低存储成本;另一方面源于冷热温数据分离和弹性伸缩等技术网络计算应用存储39行业咨询投资研究市 场 进 入竞 争 策 略IPO行业顾问募投商业尽职调查投后战略咨询为企业提供市场进入机会扫描,可行性分析及路径规划为企业提供竞争策略制定,帮助企业构建长期竞争壁垒为企业提供上市招股书编撰及相关工作流程中的行业顾问服务为企业
81、提供融资、上市中的募投报告撰写及咨询服务为投资机构提供拟投标的所在行业的基本面研究、标的项目的机会收益风险等方面的深度调查为投资机构提供投后项目的跟踪评估,包括盈利能力、风险情况、行业竞对表现、未来战略等方向。协助投资机构为投后项目公司的长期经营增长提供咨询服务艾瑞新经济产业研究解决方案40艾瑞咨询是中国新经济与产业数字化洞察研究咨询服务领域的领导品牌,为客户提供专业的行业分析、数据洞察、市场研究、战略咨询及数字化解决方案,助力客户提升认知水平、盈利能力和综合竞争力。自2002年成立至今,累计发布超过3000份行业研究报告,在互联网、新经济领域的研究覆盖能力处于行业领先水平。如今,艾瑞咨询一直
82、致力于通过科技与数据手段,并结合外部数据、客户反馈数据、内部运营数据等全域数据的收集与分析,提升客户的商业决策效率。并通过系统的数字产业、产业数据化研究及全面的供应商选择,帮助客户制定数字化战略以及落地数字化解决方案,提升客户运营效率。未来,艾瑞咨询将持续深耕商业决策服务领域,致力于成为解决商业决策问题的顶级服务机构。400-026-联系我们 Contact Us企 业 微 信微 信 公 众 号关于艾瑞41法律声明版权声明本报告为艾瑞咨询制作,其版权归属艾瑞咨询,没有经过艾瑞咨询的书面许可,任何组织和个人不得以任何形式复制、传播或输出中华人民共和国境外。任何未经授权使用本报告的相关商业行为都将
83、违反中华人民共和国著作权法和其他法律法规以及有关国际公约的规定。免责条款本报告中行业数据及相关市场预测主要为公司研究员采用桌面研究、行业访谈、市场调查及其他研究方法,部分文字和数据采集于公开信息,并且结合艾瑞监测产品数据,通过艾瑞统计预测模型估算获得;企业数据主要为访谈获得,艾瑞咨询对该等信息的准确性、完整性或可靠性作尽最大努力的追求,但不作任何保证。在任何情况下,本报告中的信息或所表述的观点均不构成任何建议。本报告中发布的调研数据采用样本调研方法,其数据结果受到样本的影响。由于调研方法及样本的限制,调查资料收集范围的限制,该数据仅代表调研时间和人群的基本状况,仅服务于当前的调研目的,为市场和客户提供基本参考。受研究方法和数据获取资源的限制,本报告只提供给用户作为市场参考资料,本公司对该报告的数据和观点不承担法律责任。合作说明该报告案例章节包含部分企业的商业展示,旨在体现行业发展状况,供各界参考。