数据中台数据中台
申请试用
新闻动态
了解袋鼠云最新动态
新闻动态>数据中台和数据仓库的区别?>
数据中台和数据仓库的区别?
20211224|文章来源:-

1、数据仓库是什么?

数据仓库诞生于 1990 年,绝对算得上是“老前辈”了,它是一个相对具体的功能概念。目前对数据仓库的主流定义是位于多个数据库上的大容量存储库,它的作用在于存储大量的结构化数据,并能进行频繁和可重复的分析,帮助企业构建商业智能(BI)。

需要注意的是,数据仓库对数据格式是有要求的,只有符合标准的数据才能入库哦。

2、数据中台又是什么?

广义上理解,数据中台包含了顶层数据战略、数据治理体系以及数据管理及运营、数据文化培养和组织架构支撑,是一套持续管理和运营的体系。

狭义上看,数据中台是通过数据技术,对海量、多源、多样的数据进行采集、处理、存储、计算,统一标准和口径,并以标准形式存储,形成大数据资产层,以满足前台数据分析和应用的需求。

单从定义来看,可以发现数据湖、数据仓库、数据中台三者并不是非此即彼的关系,在数据来源、建设目标、数据应用几个方面它们存在一定差异。

  • 数据来源、建设目标、数据应用的差异

1、数据来源

数据仓库则以业务数据库的结构化数据为主,也就是由二维表结构来逻辑表达和实现的数据。

数据中台是一套体系,既不是工具又不是存储,它可以包含数据湖和数据仓库。

这里做个简单说明,具备行和列结构的就是结构化数据,比如表格;CSV、日志、XML、JSON属于半结构化数据;而咱们工作中最常用到的Email、文档、PDF等,属于非结构化数据;每天浏览的图像、视频,听的音频都属于二进制数据。

 

2、建设目标

数据湖能实现数据的集中式管理,为企业提供全局的、统一的企业级数据概览视图,让人人了解、分析数据,提供自助式探索数据的可能。

数据仓库则以输出某个业务主题的BI报表和决策为主,目的性单一。

数据中台主张打通全域数据孤岛,消除数据标准和口径不一致的问题,释放业务方数据应用价值。

3、数据应用

数据仓库主要针对管理决策等分析类场景,在其他方面则存在局限性,比如数据建模、数据追踪与探查、深度挖掘等。

数据中台通过将数据服务化之后提供给业务系统,在数据应用上不仅限于分析型场景,也适用于交易类场景,比如营销推荐、风险评估等。

 

总体来说,数据中台是加速企业从数据到业务价值的过程的中间层,可以建立在数据仓库之上。

至于企业处于什么阶段建数据仓库、什么阶段建数据中台,还得看企业现阶段的具体情况,比如数据量、数据分析维度及要求、数据应用场景、预算等等,总之只有把工具和需求匹配起来,才能真正解决企业业务诉求。

 

此刻起,和袋鼠云一起让数据产生更大价值
此刻起,和袋鼠云一起让数据产生更大价值