博客 一文详解数据质量、数据开发、数据安全与ETL

一文详解数据质量、数据开发、数据安全与ETL

   小美   发表于 2023-02-03 14:46  306  0

一、数据质量

1.1、数据质量管理目标

  1. 根据数据消费者的需求,开发一种满足数据质量要求的管理方法
  2. 定义数据质量控制的标准和规范,并作文整个数据生命周期的一部分
  3. 定义和事实测量、监控和报告数据质量水平的过程
  4. 根据数据消费者要求,通过改变流程和系统,以及参与可显著改善数据质量的活动,识别和倡导提高数据质量的机会

1.2、生命周期

  • 计划阶段:数据质量团队评估已知的问题范围、影响和优先级,并评估解决这些问题的备选方案。
  • 执行计划:数据质量团队负责努力解决引起问题的根本原因,并做出对持续监控数据的计划(技术问题、流程问题)。
  • 检查阶段:这一阶段包括积极监控按要求评测的数据质量。
  • 处理阶段:处理和解决新出现的数据质量问题的活动。

1.3、数据质量维度

http://dtstack-static.oss-cn-hangzhou.aliyuncs.com/2021bbs/files_user6/article/d9686b8d0fe6aa2fc9caa062a72357f6..jpg

1.4、数据质量常用工具

http://dtstack-static.oss-cn-hangzhou.aliyuncs.com/2021bbs/files_user6/article/fe780ff7aa9f0f4a5aa3ed482868c64e..jpg

二、数据开发

围绕数据价值通道(数据资产 -> 数据服务 -> 业务应用)来设计数据开发的全流程管理,推动数据价值的释放。

http://dtstack-static.oss-cn-hangzhou.aliyuncs.com/2021bbs/files_user6/article/d092f9143af564b79391702daac7b13d..jpg

2.1、数据资产

数据资产的应用实现方式,打通基础数据链条,实现联通协同,提升数据价值

http://dtstack-static.oss-cn-hangzhou.aliyuncs.com/2021bbs/files_user6/article/32462c56c8f918ac65a8d6c061031dc0..jpg

数据资产生命周期:注册、变更、监控、下线

http://dtstack-static.oss-cn-hangzhou.aliyuncs.com/2021bbs/files_user6/article/8694be0d8e86fdd4cf813408e28759c1..jpg

2.2、数据服务

http://dtstack-static.oss-cn-hangzhou.aliyuncs.com/2021bbs/files_user6/article/edd8224a81aaa42689f3f19a1ddbbd28..jpg

数据服务技术架构:

http://dtstack-static.oss-cn-hangzhou.aliyuncs.com/2021bbs/files_user6/article/c50fbe15645ac5fbaa3b42a67ec6c1d9..jpg

三、数据安全

数据安全体系包含:数据安全技术体系+安全管理体系+安全运营体系

http://dtstack-static.oss-cn-hangzhou.aliyuncs.com/2021bbs/files_user6/article/82444886cf4e735cf5184d7979451488..jpg

四、ETL

4.1、含义

http://dtstack-static.oss-cn-hangzhou.aliyuncs.com/2021bbs/files_user6/article/f227149128747da9920f90c9fd94dfb4..jpg

http://dtstack-static.oss-cn-hangzhou.aliyuncs.com/2021bbs/files_user6/article/7bbb904fbe8c2cdc2d52fda468fdaf07..jpg

http://dtstack-static.oss-cn-hangzhou.aliyuncs.com/2021bbs/files_user6/article/1fc1d7053be1872062d08a5360ef19b9..jpg

4.2、ETL模式

http://dtstack-static.oss-cn-hangzhou.aliyuncs.com/2021bbs/files_user6/article/04c217644e1d06e1171cfc1528738b72..jpg

触发器模式:

http://dtstack-static.oss-cn-hangzhou.aliyuncs.com/2021bbs/files_user6/article/95df02b7a83c47ac547b0e2fff32044c..jpg

增量字段模式:

http://dtstack-static.oss-cn-hangzhou.aliyuncs.com/2021bbs/files_user6/article/067edb86ec9dcfdb4c8f84e2ba77b9a8..jpg

全量同步模式:

http://dtstack-static.oss-cn-hangzhou.aliyuncs.com/2021bbs/files_user6/article/f04ff8ac1ad7d83f1b3c8a26f800d97c..jpg

日志对比模式:

http://dtstack-static.oss-cn-hangzhou.aliyuncs.com/2021bbs/files_user6/article/01ede1f62283964bdb30302b6ae7ffd7..jpg

不同模式的对比:

http://dtstack-static.oss-cn-hangzhou.aliyuncs.com/2021bbs/files_user6/article/c1ee6ba87bd5f80ef3fc9a7e514faeca..jpg

4.3、离线和实时

实时数据:

http://dtstack-static.oss-cn-hangzhou.aliyuncs.com/2021bbs/files_user6/article/4196d65f197f8cbeb563767cfa73a43c..jpg

http://dtstack-static.oss-cn-hangzhou.aliyuncs.com/2021bbs/files_user6/article/1f3fc69f6a2de20385a1e69dbbdc4226..jpg

离线数据:

http://dtstack-static.oss-cn-hangzhou.aliyuncs.com/2021bbs/files_user6/article/bc6530661a404e153c0495b7744c5f38..jpg

http://dtstack-static.oss-cn-hangzhou.aliyuncs.com/2021bbs/files_user6/article/1bcc78189f3659cf58baafc984f4317c..jpg

使用场景:

http://dtstack-static.oss-cn-hangzhou.aliyuncs.com/2021bbs/files_user6/article/31da6521282340474cb2dc95a4bd29fd..jpg

免责申明:

本文系转载,版权归原作者所有,如若侵权请联系我们进行删除!

想了解或咨询更多有关袋鼠云大数据产品、行业解决方案、客户案例的朋友,浏览袋鼠云官网:https://www.dtstack.com/?src=bbs

同时,欢迎对大数据开源项目有兴趣的同学加入「袋鼠云开源框架钉钉技术群」,交流最新开源技术信息,群号码:30537511,项目地址:
https://github.com/DTStack

0条评论
社区公告
  • 大数据领域最专业的产品&技术交流社区,专注于探讨与分享大数据领域有趣又火热的信息,专业又专注的数据人园地

最新活动更多
微信扫码获取数字化转型资料
钉钉扫码加入技术交流群