数据仓库(4):名词解析及关系

一、数仓中常见概念解析1. 实体实体是指依附的主体,就是我们分析的一个对象,比如我们分析商品的销售情况,如华为手机近半年的销售量是多少,那华为手机就是一个实体;我们分析用户的活跃度,用户就是一个实体。当然实体也可以现实中不存在的,比如虚拟的业务对象,活动,会员...

   数栈君  发表于2023-03-15 18:07  42  0

数据仓库(3):详解维度建模之事实表

每个数据仓库都包含一个或者多个事实数据表。其中可能包含业务销售数据,如现金登记事务所产生的数据,通常包含大量的行。事实数据表的主要特点是包含数字数据(事实),并且这些数字信息可以汇总,以提供有关单位作为历史的数据,每个事实数据表包含一个由多个部分组成的索引,该...

   数栈君  发表于2023-03-15 18:05  55  0

数据仓库(2): 数据模型(维度建模)

本文导航前言:model对于数仓是最核心的东西,数据模型是数据组织和存储方法,模型的好坏,决定了数仓能支撑企业业务多久。为什么大多数企业,数仓都要重建,这不仅仅是业务拓展、发展迅速,很大一部分是因为模型建的很烂。01. 基本概念维度建模,是数据仓库大师Ralp...

   数栈君  发表于2023-03-15 18:01  51  0

深入理解 Taier:MR on Yarn 的实现原理

我们今天常说的大数据技术,它的理论基础来自于2003年  Google 发表的三篇论文,《The Google File System》、《MapReduce: Simplified Data Processing on Large Clusters》、《Bi...

   数栈君  发表于2023-03-15 17:56  78  0

数据仓库(一):基础架构

01. 架构演进离线数据仓库到实时数据仓库,从lambda架构到kappa架构、再到混合架构。02. 逻辑分层数仓分层,一般按ods->dw->dm整体架构。不同的企业,不同的业务场景,有衍生出不同的分层架构模式。例如经典四层架构:ods->...

   数栈君  发表于2023-03-15 17:54  55  0

承载万亿级数据的数据中台是如何建设的?

 Hadoop技术生态起源1.Google三篇论文揭开Hadoop序幕Google的三篇论文 GFS(2003)、MapReduce(2004)、Bigtable(2006)为大数据技术奠定了理论基础。随后,基于这三篇论文的开源实现Hadoop被各个互联网公司...

   数栈君  发表于2023-03-15 10:04  46  0

一个业务场景,具体剖析数据中台与业务中台的关系

01.前言数据中台和业务中台的区别,希望能够深入浅出,很容易理解的解释什么情况下需要业务中台,什么情况下需要数据中台以及双中台的关系。我前面做了很多行业研究和案例分享,但是都是企业级的讲解,感觉都不够简单,不够落地,这里我用一个最清晰的订单服务的演进过程,来深...

   数栈君  发表于2023-03-15 10:03  48  0

一文搞懂,阿里腾讯都看重的数据中台!

随着阿里、腾讯、百度等巨头的大规模组织架构调整,中台的热度陡增。一时间,各大互联网公司纷纷开始跟随建设中台。那么,什么是中台,我们来快速梳理一下中台的相关知识。什么是中台?按照数据咨询公司Thoughtworks首席咨询师王健给出的10个字定义,中台就是:“企...

   数栈君  发表于2023-03-15 10:00  54  0

十年 Hadoop 退居幕后,数据云横空出世

随着2022年3月——这个Cloudera宣布停止对CDH技术支持日子越来越近,那些已经部署CDH和其他版本Hadoop的企业面临一个迫切的问题:自己原来部署的Hadoop怎么办?是继续延用还是迁移到其他大数据平台?如果要迁移,迁移到哪个大数据平台?众所周知,...

   数栈君  发表于2023-03-14 17:31  76  0

数据编织助力银行新一代数据云构建

当今,发展数字经济成为国家战略,数据成为新的生产要素,数字化转型成为银行的必答题,以大数据、云计算、人工智能、区块链、5G等为代表的数字技术蓬勃发展,护航银行数字化转型。云计算应用模式深入普及,银行开始全面拥抱云计算,进一步加速了自身数据生态的演进。本文基于银...

   数栈君  发表于2023-03-14 17:30  86  0
835条数据,每页显示10条
社区公告
  • 大数据领域最专业的产品&技术交流社区,专注于探讨与分享大数据领域有趣又火热的信息,专业又专注的数据人园地

最新活动更多
微信扫码获取数字化转型资料
钉钉扫码加入技术交流群