数据中台 数据中台

tel 400-002-1024
tel

袋鼠云数据中台专栏2.0 | 数据化驱动引擎之数据资源盘点

2019年5月28日 老虎 文章来源:袋鼠云.

袋鼠云数据中台专栏2.0 | 数据化驱动引擎之数据资源盘点

 

数据中台如何定义?

企业数据化与数据中台的关系是什么?

数据中台如何支撑企业战略转型?

袋鼠云近两年来,先后为国内数十家大型龙头企业提供数据中台咨询与实施落地服务,积累了大量的实战经验,同时也在为客户服务的过程中,不断完善和升华自身的数据中台理论体系和实践方法论。希望通过后续文章的分享,与诸位读者交流,共同加快企业全面数据化进程。

本专栏每周更新1-2篇,敬请期待~

当前的「数据驱动引擎,在未来也许会成为数据中台的标配。但这并不妨碍我们现在来深入地探讨它。在前面的文章中,笔者介绍过数据中台加上双引擎的架构,也是当前袋鼠云所认为的对企业数据化建设最为有效和合理的一种架构;第二章的几篇内容详细介绍了数据中台;第三章,就重点阐述双引擎。

袋鼠云数据中台专栏2.0 | 数据化驱动引擎之数据资源盘点

袋鼠云数据中台双引擎

笔者在近几年的工作中,除了业务创新以外,做的最多的一件事情,就是对齐,也就是处理GAP。因为,在一个体系中,GAP真的是太多了:每个人之间、每个岗位之间、每个部门之间、每个组织之间,知识、技能、职责都不尽相同,甚至大相径庭。当他们各自做事的时候,都问题不大,相互协作的时候,也依照流程进行。但是共同完成一个不确定事情的时候,则会遇到诸多阻力。企业数据化便是这样的问题,技术、数据、数据质量、数据应用、业务,都站在各自的一端,无法轻易绘制出整件事情的全貌。

企业数据化驱动引擎,简单来讲就是为了消除各个角色之间的信息差,将所有信息上墙(集中到一个地方展示),用信息的手段来解决信息差,加速整体数据化的进程。

数据资源盘点数据应用规划的基础和前提,也是数据开发同学每个项目之初所必须要做的事情。但是袋鼠云这里所谈的数据资源盘点,关键点在于「所有数据资源的盘点,是为数据应用规划和构建全域数据模型所进行的前置行为。我们把数据类型的最小颗粒度设定为表,一种文件类型或者一种类型的流文件。这些类型的约束下则是无穷无尽的数据。数据资源盘点的对象就是这些最小类型,以及大致的这种类型下的数据情况。

通常,我们会从数据库、文件、流、数据API等几个方面去整体梳理,然后在这个基础之上按照各个纬度对这些元数据进行分类,便于日后的统计和查找。

除此之外,我们还会对企业中应当有的、可以有的、外部有的各种数据进行绘制,当然这些描述带有一定的主观色彩。

  • 可以有的数据是基于现在的业务,哪些业务没有在线,那么在线以后这些数据就是可以有的。

  • 应当有的,则是从未来数据应用的角度来说的,我们想到了一个有趣的数据应用,那么必然会对数据资源提出要求,而这个数据资源如果是有可能获取到,那么我们就把他记录成应该有的数据资源,并且会给出一个概要的方案。

  • 最后就是外部数据资源和数据服务了,这个是一个很宽泛的话题,也很难以被穷举,但是使用最多的还是人员群体画像服务,这个服务可以非常有效的打通企业服务的数据闭环,从产品,渠道,营销,销售到顾客和服务,让所有的信息串联在一起并形成业务优化的可能。

袋鼠云数据中台专栏2.0 | 数据化驱动引擎之数据资源盘点

袋鼠云数据资源盘点工具

数据资源盘点工作还可以工具化操作,袋鼠云数据资源盘点工具也即将上线。数据资源盘点工具能有效提升数据资源盘点工作的效率,同时数据盘点的结果也可以在应用中得以沉淀和更便捷的维护,尤其是在数据资源盘点的统计和分析上,我们可以通过数据资源盘点工具非常方便得看到整体的数据资源情况。

数据资源盘点是数据应用规划和全域数据的前提和基础,也是整体数据中台架构中的关键一环,以往我们总是不经意的忽略了这个环节,然后几项内容就割裂开来,然后便自说自话,前后无法印证了。所以数据资源盘点是一项非常基础和重要的工作,需要企业予以重视。

 

袋鼠云数据中台专栏2.0 | 数据化驱动引擎之数据资源盘点

袋鼠云是企业数据化整体解决方案提供商,是数据中台架构倡导者、引领者、践行者,通过打通数据供应链,构建企业数据化驱动引擎,加速企业数据化进程,让数据成为企业核心竞争力。

袋鼠云数据中台专栏2.0 | 数据化驱动引擎之数据资源盘点

DTSTACK.COM

数据中台,让数据产生价值

400-002-1024