博客 数据指标体系(1)如何理解数据颗粒度、维度以及指标

数据指标体系(1)如何理解数据颗粒度、维度以及指标

   包袋鼠   发表于 2021-12-27 19:27  5392  0

做数据分析最重要的是什么?当然是有数据可以分析了

数据的生产需要经过以下几个步骤:

  • 数据指标体系搭建
  • 数据采集
  • 数据存储
  • 数据清洗

才能最终达到可分析,可建模,可以用数据驱动业务增长的状态。

通过【数据指标体系】系列文章,跟大家分享如何根据业务需求,搭建一套正确、高效的数据指标体系。

本文对数据最基本的三个概念:颗粒度、指标、维度进行讲解

一、颗粒度

数据的颗粒度是指数据的 “粗细”,也就是我们看数据的视野的大小,或者说格局的大小。

例如一个电商公司,同样是看GMV,也就是总销售额,CEO关注的可能是今年总的GMV是多少,而业务老板关注的可能是每个月的GMV如何,具体到某个小团队,关注的点可能就是某些商品,每天的GMV如何了。

数据颗粒度最常见的划分是时间

二、维度

数据的维度是指看待事物不同的角度。

比如我们小学的时候就学过 “横看成岭侧成峰“,说的就是从不同角度来看一座山,会得到不同的结论。

在做数据分析时也是一样的。分析一个活动,或者一个策略对用户的吸引时,如果我们以新增用户数作为分析的指标(也就是展开方式,分析点,下面会具体讲),我们可以从以下几个维度进行拆分:

  • 时间维度:拆分为早晨、中午、晚上
  • 性别维度:男性、女性、未知
  • 受教育程度:小学、中学、大学、研究生、博士、其他
  • 等等

通过维度的分解,我们可以看到每个部分的变动,和整体的变化趋势是否相同,是否存在不同,而哪些不同点往往会成为我们接下来分析的重点。

是不是会有同学发现,颗粒度和维度有一些相似,例如“时间”这个要素,在两个部分都出现了

颗粒度和维度的本质不同在于拆分的方式不同

  • 颗粒度是一种纵向的聚合,类似于金字塔的形状,不同的颗粒度都代表着不同的聚合程度
  • 维度是一种横向拆分的模式。类似于把镜子打碎成不同的部分,每个部分都是独立的,把所有部分合在一起又能拼成完整的整体

三、指标

数据指标是衡量事物发展方式及程度的一种单位或者方法,一般通过对原始数据进行加减乘除等操作生成得到。

例如长度 ,是把所有部分加在一起得到的一种衡量外在大小的单位。

列举一些常见的互联网场景下的数据指标:

  • DAU(daily active user):每天,“活跃”过的用户数的加总,count(distinct user_id) group by day
  • MAU(monthly active user):每个月,“活跃”过的用户的加总,count(distinct user_id) group by month
  • 留存率(次日、7日、30日):今天“活跃”过的用户的总量,一段时间后的某个时间点,还活跃的比例
  • 转化率:两个有递进的环节之间,从上层到下层用户转化的比例,例如CTR=实际点击次数/展示量
http://dtstack-static.oss-cn-hangzhou.aliyuncs.com/2021bbs/files_user166259/article/30a275b43f8479300d2dc58e05738532..jpg

免责声明:本文来源分析师小帅比,仅供读者交流学习,版权归原作者所有,且仅代表作者个人观点,侵删。

0条评论
社区公告
  • 大数据领域最专业的产品&技术交流社区,专注于探讨与分享大数据领域有趣又火热的信息,专业又专注的数据人园地

最新活动更多
微信扫码获取数字化转型资料
钉钉扫码加入技术交流群