博客 数据库产业发展综述

数据库产业发展综述

   数栈君   发表于 2022-01-21 14:46  265  0

全球数据库产业生态成熟壮大,在发展过程中,逐渐细分出数据库产品、数据库服务和数据库支撑体系三个细分产业。


(一)数据库产业概述


http://dtstack-static.oss-cn-hangzhou.aliyuncs.com/2021bbs/files_user1/article/ced89d8650a74c655d01eddd24abc0c3..jpg

来源:中国信息通信研究院

图7 数据库产业链全景图


数据库产品主要由关系型数据库、非关系型数据库、混合型数据库及数据库周边工具构成。数据库服务是指围绕数据库的咨询规划、实施部署和运维运营等环节,为数据库系统的正常、高效、持续、安全使用提供信息技术服务工作。数据库支撑体系由从事数据库学术研究、人才培养、开源社区、评测认证等工作的相关主体共同构成。


http://dtstack-static.oss-cn-hangzhou.aliyuncs.com/2021bbs/files_user1/article/fe525c1db37f020e2a83ad28c8de39d9..jpg

来源:中国信息通信研究院,2021年6月

图8 中国数据库市场规模及增速


据中国信通院测算,2020年全球数据库市场规模为671亿美元,其中中国数据库市场规模为35亿美元(约合240.9亿元人民币),占全球5.2%。


预计到2025年,全球数据库市场规模将达到798亿美元。中国的IT总支出将占全球12.3%。我们预计,中国数据库市场在全球的占比将在2025年接近中国IT总支出在全球的占比,中国数据库市场总规模将达到688亿元,市场年复合增长率(CAGR)为23.4%。


(二)数据库产品


本节主要聚焦国内数据库产品提供商、产品分布及市场竞争三方面,并逐一展开分析。


1.企业主体大部分仍处于发展初期阶段


据中国信通院统计分析,截止2021年5月底,我国数据库产品提供商共计80家。


http://dtstack-static.oss-cn-hangzhou.aliyuncs.com/2021bbs/files_user1/article/ca5889fbc6a28b77d8ce11c984c7411a..jpg

来源:中国信息通信研究院,2021年6月

图9 我国数据库企业成立时间分布情况


成立时间呈现两个热周期。从企业成立时间看,我国数据库企业成立时间主要集中在1999-2000年和2013-2017年两个时间段,数量分别是12个和38个,依次占比15%和48%。上世纪90年代,以Oracle、DB2等为代表的国际商业数据库进入大陆市场,先后在电信、金融、政务等重要行业拿下大单,应用于各类核心系统和周边系统。国内也由于顶层设计加码,掀起一股国产数据库的浪潮。2012年,大数据成为国家级发展战略。在此背景下,我国涌现出一大批以大数据和数据库为主营业务的初创公司。2015年,平凯星辰、星瑞格、华胜信泰、上海丛云、恒辉信达等企业成立。2016至2018年,图数据库和时序数据库关注度不断提升,以费马科技、创邻科技、欧若数网、蜀天梦图等为代表的初创图数据库企业相继成立,以浙江智臾、涛思数据等为代表的时序数据库企业不断涌现,政策利好与资本关注为我国数据库产业不断注入新活力,国产数据库产业迎来第二轮浪潮。


http://dtstack-static.oss-cn-hangzhou.aliyuncs.com/2021bbs/files_user1/article/0a05c570fd199d4c454423948f4354fb..jpg

来源:中国信息通信研究院,2021年6月

图10 我国数据库企业总部分布情况


地域分布以一线城市为主。总部分布情况代表企业所在城市对数据库产业的重视与发展程度。从企业总部的数量看,由于人才规模聚集效应,企业总部通常设在超一线城市,数量最多的前五名是北京、杭州、上海、成都和深圳,分别是43、9、7、3、2个,占企业总数约为54%、11%、9%、4%和3%,除此之外,济南、南京、天津、武汉、广州、贵阳、福州、合肥和乌鲁木齐等直辖市和省会城市平均孵化出1-2个数据库企业。


http://dtstack-static.oss-cn-hangzhou.aliyuncs.com/2021bbs/files_user1/article/bbf64d1a9487ab4b83cd081aa8622f85..jpg

来源:中国信息通信研究院,2021年6月

图11 我国数据库企业员工数量分布情况


员工数量普遍在百人以下。我国数据库企业人员平均人数约为184人,最高为1200人左右规模,最低为10人左右规模。其中21-50人左右规模企业占比最高,数量34个,比例达到43%,人数在51-100人左右规模次之,数量为12个,占比15%,101-200人和201-300人规模并列第三,均为10个,分别占比13%,由此可见,我国数据库虽然数量众多,但平均从业人员数量较少,仍在快速发展阶段。


http://dtstack-static.oss-cn-hangzhou.aliyuncs.com/2021bbs/files_user1/article/5edc78d403f0ad8fca6800152365041b..jpg

来源:中国信息通信研究院,2021年6月

图12 我国数据库企业专利数量分布情况


平均专利数量不足五十个。我国数据库企业针对数据库领域的平均专利数量(含国内外专利)为38个,最高为500个左右规模,数量为0的企业个数是19个,占比24%。拥有专利数0-4个的企业占比最高为51%,专利数5-10个的企业次之,占比14%,专利数21-50个的企业数量排名第三,占比12%。从企业专利数量上看,Oracle以1.4万个全球领先,SAP居次席,国内数据库的全部企业技术专利累计千余,仍有较大发展空间。


2.产品类型仍以关系型为主,非关系型产品正在快速发展


我国数据库产品数量分布呈现以关系型为主,非关系型及混合型数据库为辅的局面。数据库产品根据研发方式不同,分为完全自研和基于开源二次研发两类。


http://dtstack-static.oss-cn-hangzhou.aliyuncs.com/2021bbs/files_user1/article/2bb88b01e1d92a10ad2841d7059bf50a..jpg

来源:中国信息通信研究院,2021年6月

图13 我国数据库产品分布情况


我国关系型数据库产品多数基于MySQL和PostgreSQL二次开发而来。据中国信通院统计分析,截止2021年6月,我国数据库产品共有135款。其中关系型数据库81个,非关系型数据库有54个,占比分别为60%和40%。按二级细分类别,以云服务为主要服务交付方式的关系型云数据库19个;非关系型数据库中,键值型数据库5个,列存数据库3个,文档数据库4个,图数据库13个,全文检索数据库1个,在非关系数据库中依次占比9.26%、5.56%、7.41%、24.07%和1.85%,由于一些不可控因素,其余非关系型数据库的数据模型暂不可知。


http://dtstack-static.oss-cn-hangzhou.aliyuncs.com/2021bbs/files_user1/article/c6a70eab3f9b3291433952390ce6c411..jpg

来源:中国信息通信研究院,2021年6月

图14 关系型数据库中基于主流开源数据库的分布情况


关系型数据库中基于开源数据库MySQL和PostgreSQL进行二次开发的个数分别为23和24个,依次占关系型数据库比例为28.40%和29.63%,总计占58.03%。


我国非关系型数据库产品发展势头良好,逐渐受到国际认可。非关系型数据库中以基于开源数据库如Redis、InfluxDB、CouchDB等产品进行二次开发为主。时序数据库因其存储处理海量时序数据的特性,常应用于工业控制、物联网、车联网等领域。据中国信通院统计分析,我国时序数据库从2000年后迅速发展,产品数量已达15款,1款为开源数据库,其余均为商业数据库。4个由云厂商提供,还有来自石化、电力、钢铁等传统工业实时数据库企业的产品9个。同时根据DB-Engines官网显示,2021年5月的时序数据库的流行度排名中,我国上榜的数据库产品已有两个,分别是浙江智臾和阿里云TSDB,依次位列第11和第21名。由于图数据库能够支撑社交网络、金融反欺诈等互联网与金融场景的关联分析业务,所以行业关注热度自2016年以来逐渐升温。我国图数据库产品数量为13款,自研程度较高,自研产品占总数比例为69.23%。从供应商类型看,初创公司、云厂商、高校纷纷入局,其比例分别为7:5:1。根据DB-Engines官网显示,2021年5月的图数据库的流行度排名中,我国上榜的数据库产品有3个,分别是欧若数网Nebula Graph、华为云GraphBase和百度智能云开源产品HugeGraph,依次位列第15、第28和第30名。


3.市场份额正逐渐倾向云上,线下市场迎来激烈竞争


http://dtstack-static.oss-cn-hangzhou.aliyuncs.com/2021bbs/files_user1/article/996c25aae65682258db12e1b1cedf338..jpg


线上市场呈现快速增长。随着云计算技术不断成熟,云上数据库市场快速增长。根据Gartner公司2019年发布的市场分析,2017年至2018年的全球数据库产业总营业额的18.4%增长中,云数据库管理产品的营业额占比68%,而Microsoft与亚马逊的AWS占到总增长的75.5%。同时根据2021年Gartner对数据库产品提供商的排名情况看,Microsoft凭借云数据库的后发优势,抢占了Oracle已经持续占据十年的榜首位置,前十名中已经有四家以云服务为主要供应方式的企业,分别为Microsoft、Amazon、Google和阿里云。据中国信通院统计分析,2020年,中国公有云数据库市场规模为107.68亿元,未来5年,公有云数据库市场年复合增长率将达到36.1%,预计到2025年,中国公有云数据库市场总规模将达到503.31亿元。Gartner预测到2023年,全球数据库市场中75%的数据库将完成到云平台的迁徙,仅有5%的数据保持在原本的本地模式当中。线上市场格局巨头涌现。中国信通院调研显示,阿里云、华为云和腾讯云作为我国头部云服务商,其在云计算基础设施、应用生态、用户渠道等方面处于领先地位,云上数据库作为云基础设施的延续与发展,具备天然先发优势。2020年,上述三家云服务商公有云数据库总营收约占中国公有云数据库市场份额75.5%。以电商、游戏、短视频等为主营业务的互联网公司是线上数据库的服务对象。出于对业务特性和生态兼容考虑,约83%的云上客户倾向选择MySQL、Redis、MongoDB、InfluxDB等开源数据库。


存量市场替换空间可观,线下市场迎来激烈竞争。2020年数据库传统部署模式市场为133.22亿元,随着市场倾向的变化,传统部署市场替换国外数据库空间巨大。以关系型数据库为例,2017年以前市场格局十分稳定,Oracle、IBM、Microsoft、Teradata等为代表的产品占据数据库传统部署模式市场份额90%以上,以达梦、人大金仓、南大通用、神舟通用为代表的国产数据库,通常聚焦于军工、政务等封闭领域,整体市场份额较小,如今电信、金融等重要行业数据库改造变更需求不断,相关存量市场前景诱人。随着技术层面的分布式改造需求不断以及市场层面自发选择国产产品倾向,国产数据库市场份额有望得到大幅提升,各企业纷纷抢抓战略机遇,不断迭代打磨产品能力,抢占市场份额。据中国信通院大数据产品能力评测十二批结果显示,国产数据库供给能力较几年前得到大幅提升,产品功能逐渐完善,集群规模与日俱增,性能表现不断攀升,市场竞争程度较为激烈。


http://dtstack-static.oss-cn-hangzhou.aliyuncs.com/2021bbs/files_user1/article/9bbc4cccb8764fd19acccb04e7742815..jpg

来源:DB-Engines官方网站,2021年6月

图15 2021年6月数据库开源与商业许可证流行度对比


初创企业和巨头陆续投身开源市场。开源已成为数据库产业的共识,2021年1月,DB-Engines官网显示,开源许可证流行度首次超过商业许可证,开源数据库迎来新纪元。截止2021年6月,开源与商业许可证数量分别为192和179个,流行度分别占比51.1%和48.9%。


http://dtstack-static.oss-cn-hangzhou.aliyuncs.com/2021bbs/files_user1/article/cc0fedb9953e87a999dd994b2cd72869..jpg


近些年以巨杉、平凯星辰、涛思数据、欧若数网为代表的初创企业和以百度、华为、阿里云、蚂蚁金服为代表的巨头意识到开源有助于扩大人才规模及上下游生态影响力,通过运营开源社区快速获得反馈并加快产品开发、提升产品质量,同时反哺社区开发者及独立软件开发商(ISV)等生态伙伴,能够达到多方共赢目的。针对开源,企业纷纷采取不同的商业模式。2014年12月,巨杉数据库宣布开源SequoiaDB,成为国内最早开源自研数据库项目;2017年10月,平凯星辰开源TiDB;2018年,百度开源数据库Doris和HugeGraph;2019年,涛思数据和欧若数网分别开源TDengine和NebulaGraph;2020年6月,华为建立openGauss开源社区,并于2021年3月发布第一个Release版本;2021年5月,阿里云宣布对外开放关系型数据库PolarDB for PostgreSQL源代码,同年6月,蚂蚁集团宣布开源OceanBase。


(三)数据库服务


很长一段时间内,我国数据库服务工作主要以附属技能的形式由应用开发商和硬件服务商提供保障。随着数据库对于企业的重要性越来越高,企业对于以数据库为核心的专业服务的需求也越加迫切,独立的数据库服务厂商开始崭露头角,并形成了一个专业化的数据库细分服务领域。


1.头部企业主体发展时间较长


http://dtstack-static.oss-cn-hangzhou.aliyuncs.com/2021bbs/files_user1/article/257804d0a040943f96db8ff7deeb714c..jpg


数据库服务产业主体主要由多年来在电信、金融、政务等重要行业提供外包IT运维服务的企业构成,成立时间普遍十年以上,核心成员多为早期提供Oracle、DB2原厂或第三方服务的专家,由于企业数据库技术体系庞杂,需要服务提供商能够提供横向主流数据库产品和纵向多版本技术服务覆盖能力,服务行业技术壁垒较高。此外,由于一般与客户签订一至三年合同,服务提供商对客户系统非常熟悉,容易形成相对稳定的长期合作伙伴关系,市场壁垒较高,新兴初创公司较少,巨头员工数量普遍在千人左右。头部典型企业有云和恩墨、新炬网络、海量数据、太阳塔、爱可生、中亦安图、万国数据、银信科技、天玑科技、新数科技、沃趣科技、迪思杰、九桥同步等。


2.服务工作范围广,缺乏行业规范和指引


数据驱动时代,企业开始利用海量实时数据分析业务发展、了解客户行为和优化配置资源,并据此制定企业发展战略。数据库系统作为数据存储的主要载体,数据库服务贯穿企业IT系统的整个生命周期。按照信息系统建设的不同阶段,数据库的服务范围主要覆盖规划设计、实施部署、运维运营三个方面,三个方面又细分多个服务工作内容,如下图所示。


http://dtstack-static.oss-cn-hangzhou.aliyuncs.com/2021bbs/files_user1/article/0ba51bb1b0f218cf01705182322d7380..jpg

来源:中国信息通信研究院

图16 数据库服务能力成熟度模型框架


由于数据库服务产业正处于快速变革期,玩家众多,能力水平参差不齐,服务过程缺乏行业规范和指引,导致众多数据库应用单位面临各类选型和实施问题。中国信息通信研究院联合国内数据库厂商和服务商,共同编制并发布了《数据库服务能力成熟度模型》团体标准,期望为国内的数据库服务生态体系提出更全面和专业的评估标准。


3.服务市场集中在重点行业,环境变革倒逼各主体转型升级


服务市场主要集中在金融、电信、政府、制造、交通五个行业。根据中国信通院统计分析,各行业的数据库服务市场份额比例分别为金融22.3%、电信18.9%、政府16.4%、制造13.3%、交通9.6%,这五个行业合计占比超过80%。


云计算改变传统服务市场格局。在云计算逐渐成熟之后,与云上数据库市场份额迅速扩大。而云上数据库的咨询、部署、运维等服务工作则直接由云计算公司负责,所以云计算公司将改变传统服务市场格局。由于服务工作定制化程度较高,相对标准化云产品,属于劳动力密集型工作,所以从综合成本角度出发,未来云上数据库服务市场部分将由云计算公司依靠自身资源储备负责,另一部分云计算公司将与线下服务公司进行合作,形成优势互补,共同完成相关工作。


服务企业向产品企业转型。如今随着分布式云数据库兴起,数据库运维要求不断提升,数据库服务商除了提供传统的驻场与远程运维类服务外,围绕数据库开发、测试、运维等环节也提供多种类型的数据库周边工具。与此同时,以云和恩墨、新数科技、爱可生、海量数据等为代表的数据库服务商为了拓展业务范围,提升企业利润总额,认识到可以利用自身服务能力积累与经验,对数据库产品供应商形成差异化优势,顺势推出自有数据库产品,进一步加剧了数据库产品市场竞争激烈程度。其中云和恩墨与海量数据分别基于开源数据库openGauss推出了企业级数据库MogDB和Vastbase,爱可生和新数科技基于MySQL也发布了相关产品。


(四)据库支撑体系


当前数据库支撑体系由于数据库技术路线不断演进,也正处于变革和创新的高发期。


1.学术研究仍以关系理论为重点,国内研究水平逐渐提升


http://dtstack-static.oss-cn-hangzhou.aliyuncs.com/2021bbs/files_user1/article/31c9bdb28e3365def56e1191efd2b2ef..jpg

来源:中国信息通信研究院,2021年6月

图17 全球各国数据库领域发文量及质量


2016至2020年,美国、中国、印度、德国和英国是全球数据库领域论文产出前五的国家,美国发文量最多,占全球总发文量22.4%,之后依次为中国19.4%,印度7.4%。从高水平论文数量分析,英国高被引论文数占3.1%,中国占0.3%。从国际合作论文的角度分析,英国、法国、加拿大、西班牙的国际合作论文较多,均超过50%。


http://dtstack-static.oss-cn-hangzhou.aliyuncs.com/2021bbs/files_user1/article/db306aa57ab642e120b0ceb79c6ce7be..jpg

来源:公开资料整理

图18 2018-2020年VLDB、ICDE和SIGMOD论文分布情况


学术界公认的数据库领域顶级会议主要有VLDB、SIGMOD和ICDE。从这些会议的研究方向看,当前以关系型数据库为主,非关系型数据库为辅。以VLDB为例,2018-2020年,各领域论文总数分别为146、151和95个,关系型和非关系型数据库论文分别占三年论文总数量的37%和21%。SIGMOD各领域论文总数分别为90、88和144个,关系型和非关系型数据库论文总数占三年论文总数的22%和13%。ICDE各领域论文总数分别为188、268和241个,关系型和非关系型数据库论文总数占三年论文总数均为13%。

http://dtstack-static.oss-cn-hangzhou.aliyuncs.com/2021bbs/files_user1/article/58a1a12880ef31fbfd982a1b25c4447b..jpg

来源:中国信息通信研究院,2021年6月

图19 全球数据库领域主要研究内容热点图


综合分析全球论文研究主题,除了关系型数据库,图论、图数据库、查询优化、机器学习、分布式处理、时序数据、流数据、时空数据、云数据库等代表当前火热的技术方向。此外,数据安全、隐私保护也是每年不可或缺的研究主题。


http://dtstack-static.oss-cn-hangzhou.aliyuncs.com/2021bbs/files_user1/article/f257421cacae26b3a922de3912ef98cf..jpg

来源:中国信息通信研究院根据公开资料整理

图20 2018-2020年中国高校及企业学术会议论文贡献情况


我国在全球数据库领域学术影响逐渐提升。高校及企业在ICDE论文贡献占比最高,三年依次为28.19%、37.31%和43.15%,三大会议每年贡献占比平均为22.14%、23.74%和23.81%,数量呈逐年上升趋势,研究方向以图论、图数据库、数据挖掘、机器学习、查询处理等方向为主。阿里巴巴、华为、腾讯、蚂蚁金服、百度、PingCAP等企业和清华大学、香港科技大学、北京大学、香港中文大学、香港大学、浙江大学、华中师范大学、华东师范大学、中国人民大学、复旦大学、北京航空航天大学、华中科技大学、中国科学院、北京理工大学等高校论文纷纷入选三大顶会,显示我国数据库学术水平国际影响力不断扩大。


2.领域内各类组织形成,产业热度不断提高


数据库支撑体系各类组织主要分为以下四类:


一类是由具备官方背景的研究组织,例如以中国计算机学会(CCF)数据库专业委员会为代表的学术组织和以中国通信标准化协会大数据技术标准推进委员会(CCSA TC601)为代表的行业组织,用于汇聚国内数据库理论研究头部力量;第二类是数据库从业人员牵头发起的面向数据库技术爱好者的用户组织,如面向DBA的ACDU、面向Oracle用户的ACOUG、面向MySQL用户的ACMUG、面向PostgreSQL用户的中国开源软件推进联盟PostgreSQL分会等,用于进行各类专题技术交流和讨论;第三类是由数据库企业组建,针对自身特定产品讨论的官方技术社区,如阿里云开发者社区、华为云openGauss社区、PingCAP AskTUG社区、PostgreSQL中文社区、爱可生开源社区、移动云开发者社区等;第四类是汇聚数据库整体行业信息的第三方技术社区,如ITPUB、墨天轮、DBAplus等,用于搭建领域内线上交流平台。


3.多层级数据库人才培训体系正在快速形成


http://dtstack-static.oss-cn-hangzhou.aliyuncs.com/2021bbs/files_user1/article/15a67a6d2bdbc88510053fa7303f7a1c..jpg


当前数据库人才培养渠道主要有三个:高校教育、培训机构和企业。各渠道分别具有不同的培训方式和培训目标。


高校教育注重普适教育,重视社会人才发展大趋势需求。通过原理性知识传授、数据库系统应用实践等教学方式,为数据库产业发展提供了大量储备人才。


培训机构是数据库人才认证获取的主要途径。培训机构累计为合作伙伴培训学员超5万人次,其中获得Oracle、MySQL、PostgreSQL认证学员数千人,为企业输送专业DBA万余人。培训方式为厂商授权培训中心或联合认证培训中心等,培训知识主要面向数据库工程实践和应用。除原厂培训,当前专业培训机构包括恩墨学院、新炬学院、盘古云课堂等。


企业培训基于人才培养时间成本、人才可用性等考量因素,多渠道聚集人才。一方面,数据库厂商开始建立自己的认证体系,并形成了不同级别的培训课程和认证考试;另一方面,一些企业开始加强与院校的产教融合尝试,通过与高校进行教材编撰、实训开发、专业共建、人才共建等合作项目,在高校提前培养数据库相关储备人才。


4.数据库领域受资本市场高度追捧


http://dtstack-static.oss-cn-hangzhou.aliyuncs.com/2021bbs/files_user1/article/f59311e5dcf469c44d3d0c6a25ce1e23..jpg

来源:公开资料整理

图21 我国数据库初创企业融资情况


中国信通院统计分析,自2013年至今,数据库企业累计完成约42次融资,根据披露金额显示,融资额度总计约为78.6亿元。自2014年成立的以数据库产品供应与服务提供为主营业务的企业为29个,其中24个企业先后获得单笔数百万元至最高2.7亿美元融资,仅2021年一、二季度期间,获得最新一轮融资的企业数就达12家,2020全年获得融资的企业数量为17家,占比59%,其中不乏高瓴创投、经纬中国、红点创投、红杉资本等知名投资方。由此看出,近些年随着国产数据库概念的火热与应用需求多样化带动的技术变革,国内外各路资本纷纷注入数据库产业,形成“百舸争流”的旺盛态势。


免责申明:

本文系转载,版权归原作者所有,如若侵权请联系我们进行删除!

0条评论
社区公告
  • 大数据领域最专业的产品&技术交流社区,专注于探讨与分享大数据领域有趣又火热的信息,专业又专注的数据人园地

最新活动更多
微信扫码获取数字化转型资料
钉钉扫码加入技术交流群