数据中台是目前企业规划建设最多的中台类型,对应的方法论和支撑技术也都最为成熟,但在认知上仍然存在一些模糊之处,方法论和实践上也还在快速发展,袋鼠云、云徒科技、比智科技和网易数帆谈谈数据中台的关键问题和发展等中台厂商的共识
数据中台的定义和边界
数据中台是一种特定类型的中台,对照中台的概念,数据中台可以定义为“提供公共数据服务的组织”,职责主要是为整个组织提供标准化、高质量、高效率、低成本、高安全的公共数据服务。
数据中台以数据服务层为边界,这一点是我们袋鼠云及网易数帆、比智科技、数栖平台、云徒科技等数据中台厂商的共识。通常来说,在规划建设数据中台时也会同步建设一些上层应用(如报表、数据产品等),因为仅建设中台发挥不了效益,但这些应用本身并不属于数据中台,而是数据中台的支撑对象。袋鼠云团队出品的《数据中台架构——企业数据化最佳实践》一书也提到“数据中台应该为可能进行的数据应用提供数据及数据模型支持”。
但当前也还有一些企业甚至是厂商没有将中台和应用清晰的加以区分,而是笼统的都作为数据中台的内容,
数据中台和应用在建设和管理上应当是解耦的。数据中台的内聚度很高,应该由一个团队来建设,如果由乙方来建也只能交给一个乙方(当然如果一个组织建设多个数据中台的话不同的数据中台交给不同的团队或供应商也没问题),但应用完全可以由各个前台团队分别建设,不同的应用交给不同的乙方也没问题。
数据中台和应用所需的支撑能力非常不同。数据中台一般需要的是数据集成、数据开发、数据治理、数据仓库等技术支持,但数据应用则一般需要数据报表、敏捷BI、数据可视化乃至通用的应用开发机制支持。
因此,如果数据中台和应用不分,那么只能都交给一个团队或一个乙方来建设,这就人为的大幅提高了对团队或乙方的要求,导致建设难度无谓增加。
虽然我们一直致力于同时提供数据中台和数据产品的建设能力,但我们也一直秉承解耦的理念,从不宣扬数据中台和应用是密不可分的,这是因为关注架构的“高内聚、低耦合”已经深入袋鼠云、云徒科技、比智科技和网易数帆等中台厂商的共识