常见的数据标准包含基础数据标准和指标数据标准。主要构成:业务定义+管理信息+技术属性数据标准包含内容包括:主题&分类+标注属性+标准代码3.2.2、数据标准类型(举例)不同行业的标准不同,这里仅是举例说明。如:性别、身份证、金额、手机号码、行业、级别的...
Taier 介绍Taier 是袋鼠云开源项目之一,是一个分布式可视化的DAG任务调度系统。旨在降低ETL开发成本、提高大数据平台稳定性,大数据开发人员可以在 Taier 直接进行业务逻辑的开发,而不用关心任务错综复杂的依赖关系与底层的大数据平台的架构实现,将工...
一、客户背景客户使用 ES 来进行数据存储、快速查询业务订单记录,但是经常会出现业务高峰期 ES 集群的 cpu 负载、内存使用均较高,查询延迟大,导致前端业务访问出现大量超时的情况,极大影响其客户使用体验。部分监控如下图:1、 集群架构如下:集群节点配置:8...
随着数智化时代的到来,企业需要汇聚各业务板块数据,提供一个强大的中间层为高频多变的业务场景提供支撑。基于此类需求,“数据中台” 应运而生,将数据提炼为数据资产,转换成业务需要的数据「血液」。数据中台的建设与运营,通常包含如下活动:数据汇聚、数据加工与提炼、对外...
数据库产品越来越多,各家云厂商也都推出基于开源 MySQL、Postgre 等的关系型数据库产品,多副本、高可用、读写分离、分库分表等功能更是集成在各类产品中,降低了机房建设和运维成本,助力更多的客户上云。唯独鲜见 Oracle 的云产品输出,除非是 Orac...
一、数据治理体系数据治理体系内容从两个维度来看:1)数据治理难点痛点:数据脉络不清晰、数据汇聚能力不足、数据管控能力薄弱、数据治理体系不完善、开放形式不完善。2)数据治理5个核心:理、聚、管、治、用。数据治理体系主要包含内容有数据标准、元数据、数据建模、数据集...
2020 年春节期间,一场突如其来的疫情在全国蔓延开来,打破了大家原有的工作生活节奏。疫情期间,大家宅在家就能随时看到实时的大数据疫情地图,可以随时刷到自己当前感兴趣的抖音视频,这一切背后依赖的最重要的技术,就是实时大数据处理技术。现在疫情即将过去,国家提出要...
从马车到汽车是为了提升运输效率,而随着时代的发展,如今我们又希望用自动驾驶把驾驶员从开车这项体力劳动中解放出来,增加运行效率,同时也可减少交通事故发生率,这也是企业对于智能运维的诉求。从人工运维到自动化运维是为了减少人力成本,降低操作风险,提高运维效率,但自动...
一、前言随着技术不断的成熟及市场需求的日益旺盛,实时开发已经成为当前大数据开发不可或缺的一部分。在整个实时开发的链路中,数据采集需要写入到 Kafka,数据处理也需要使用到 Kafka。今天我们就针对 Kafka 这个时下主流的消息中间件进行简单的介绍。二、消...
如果把企业数字化转型比作一辆自行车,那么技术与数据便是这辆车的两个轮子,骑在车上的则是企业战略、文化以及各种资源,它们决定了转型将走向哪个方向。不管数字化转型之路多么正确、战术如何高明,其最终结果还是要通过这两个轮子落地。DT 时代,“大数据” 不是强调量大,...