一、数据质量
1.1、数据质量管理目标
根据数据消费者的需求,开发一种满足数据质量要求的管理方法
定义数据质量控制的标准和规范,并作文整个数据生命周期的一部分
定义和事实测量、监控和报告数据质量水平的过程
根据数据消费者要求,通过改变流程和系统,以及参与可显著改善数据质量的活动,识别和倡导提高数据质量的机会
1.2、生命周期
计划阶段:数据质量团队评估已知的问题范围、影响和优先级,并评估解决这些问题的备选方案。
执行计划:数据质量团队负责努力解决引起问题的根本原因,并做出对持续监控数据的计划(技术问题、流程问题)。
检查阶段:这一阶段包括积极监控按要求评测的数据质量。
处理阶段:处理和解决新出现的数据质量问题的活动。
1.3、数据质量维度
1.4、数据质量常用工具
二、数据开发
围绕数据价值通道(数据资产 -> 数据服务 -> 业务应用)来设计数据开发的全流程管理,推动数据价值的释放。
2.1、数据资产
数据资产的应用实现方式,打通基础数据链条,实现联通协同,提升数据价值
数据资产生命周期:注册、变更、监控、下线
2.2、数据服务
数据服务技术架构:
三、数据安全
数据安全体系包含:数据安全技术体系+安全管理体系+安全运营体系
四、ETL
4.1、含义
4.2、ETL模式
触发器模式:
增量字段模式:
全量同步模式:
日志对比模式:
不同模式的对比:
4.3、离线和实时
实时数据:
离线数据:
使用场景:
免责申明:
本文系转载,版权归原作者所有,如若侵权请联系我们进行删除!
想了解或咨询更多有关袋鼠云大数据产品、行业解决方案、客户案例的朋友,浏览袋鼠云官网:https://www.dtstack.com/?src=bbs
同时,欢迎对大数据开源项目有兴趣的同学加入「袋鼠云开源框架钉钉技术群」,交流最新开源技术信息,群号码:30537511,项目地址:https://github.com/DTStack