博客 对于企业来说,数据治理的难点是什么?

对于企业来说,数据治理的难点是什么?

   小美   发表于 2023-03-10 11:16  504  0

140页深度干货,囊括15个典型成功案例,覆盖金融、集团、政务、制造、港口5大行业,全书从方法论到实践全面解码数据治理,开辟数据治理新范式,丰富内容可免费获取!


免费获取链接:https://fs80.cn/4w2atu

http://dtstack-static.oss-cn-hangzhou.aliyuncs.com/2021bbs/files_user6/article/19052f272bd39bfea9efa292efc39fab..png

都知道数字化转型以数据为生产要素,通过云计算、大数据、人工智能等技术对数据进行分析、挖掘、洞察,促进生产方式、生活方式等的变革和创新。但对数据进行分析、挖掘和洞察等,往往需要很高的数据质量才能取得比较好的效果。当前很多项目的大部分时间其实是花在对数据的处理上,这就造成了转型的效率低下,不同项目对相同数据的重复处理,也造成了很大的浪费。因此,企业在进行数字化转型之前,往往需要完成数据治理,提升数据质量,打好数据要素基础,才能更好的进行转型。

数据治理往往被认为是费力不讨好的事。如何更简单的实现数据治理?可能传统的数据治理思路和数仓、大数据平台、数据湖的建设思路需要调整。其实笔者一直是反对企业建设数据湖的。不建议用数据湖的原因就是数据湖中存储着各种各样未经过处理的数据,想要使用数据是你需要额外很多中间环节的数据处理工作。当然你也可以使用数据湖进行数据治理,但数据量达到一定的程度,可能会超过人的管理极限,只能靠工具去做治理,这就可能会带来很多意想不到的问题,所以最终会走向数据沼泽、数据深渊,难以再从这些数据获得价值,除非付出更大的代价。

信息化这么多年,其实很多公司已经积累了很多的经验,只是囿于厂商的思路和方案,往往无法走出思维误区。遇到阻碍可能是企业流程重构的契机。传统数据治理的思路也需要重构的。数据治理最省力的方式是使数据产生的时候就是标准化的,而不是在后期进行数据的转换和繁琐处理。传统围绕元数据管理的方式也使数据治理缺乏立体性,而基于企业主数据的数据架构能更好的体现数据的全局性、系统性和立体性,更便于对数据的处理和使用。

http://dtstack-static.oss-cn-hangzhou.aliyuncs.com/2021bbs/files_user6/article/d28ce2c5c7b41dfe96ab792e91f407ef..jpg

在对数据进行处理和使用时,数据的质量就很关键了。如果数据质量高,那么数据用起来就得心应手;如果数据质量差,不得不额外增加繁多的数据处理过程,会造成事倍功半的结果。这是体现数据治理价值所在的。

数据治理可以早做也可以晚做,甚至可以不做,关键在于数据应用场景和数据应用的深度。数字化和数字化转型往往需要对数据进行深度处理和分析,所以数据质量往往会影响到数字化的能力和转型的效率。数据治理往往是需要做的,不过是早做晚做、早花钱晚花钱的问题。否则可能无法分析数据之间的关系和联系,或者会得出错误的结果,比如说,同样的术语可能代表不一样的含义,不同的数据实体也可能是同一个东西。数据冗余、缺失、错误、格式不同、编码不同等等都会增加数据处理环节,从而降低数据处理的效率,降低数据的价值。

数据顺利应用的前提是良好的数据质量,良好的数据质量来自于良好的数据治理能力。新的数据治理方法面临着存量业务系统和增量业务系统数据治理问题,需要分开来考虑。对于增量的系统,需要考虑全部遵循规范化和标准化。提前规划设计数据架构体系、数据标准和治理体系。对于存量系统,暂维持原来的方式,根据实际需要以新的数据架构和标准逐步替换这些存量系统,直至全部替换。

数据规范化和标准化是第一步,数据被使用和应用之前,往往还需要很多的数据预处理工作,比如说,数据计算和统计、数据分类和归类、数据标记和存储等等。这样在使用数据的时候,就可以按图索骥,快速找到需要的数据。这样可以构建企业数据的一个“图书馆”,也就实现了企业数据资产的管理。因此总的来说,数据作为数字化转型的驱动要素,数据质量的高低决定了数字化转型的难易和成本,做好数据治理将有助于企业的数字化转型,促进企业的数字化转型。

免责申明:

本文系转载,版权归原作者所有,如若侵权请联系我们进行删除!

《数据治理行业实践白皮书》下载地址:https://fs80.cn/4w2atu

想了解或咨询更多有关袋鼠云大数据产品、行业解决方案、客户案例的朋友,浏览袋鼠云官网:https://www.dtstack.com/?src=bbs
同时,欢迎对大数据开源项目有兴趣的同学加入「袋鼠云开源框架钉钉技术群」,交流最新开源技术信息,群号码:30537511,项目地址:
https://github.com/DTStack

0条评论
社区公告
  • 大数据领域最专业的产品&技术交流社区,专注于探讨与分享大数据领域有趣又火热的信息,专业又专注的数据人园地

最新活动更多
微信扫码获取数字化转型资料
钉钉扫码加入技术交流群