博客 从两个方面诠释对数据分析准备工作的理解

从两个方面诠释对数据分析准备工作的理解

   数栈君   发表于 2023-04-04 10:32  202  0

140页深度干货,囊括15个典型成功案例,覆盖金融、集团、政务、制造、港口5大行业,全书从方法论到实践全面解码数据治理,开辟数据治理新范式,丰富内容可免费获取!

免费获取链接:https://fs80.cn/4w2atu

http://dtstack-static.oss-cn-hangzhou.aliyuncs.com/2021bbs/files_user1/article/dd0629582ab0bcef240e5ee9bb6c073e..png

通过数据,可以发现许多深层的问题,从而优化产品决策。那么,怎么才能做好一次好的数据分析工作呢?本文详细阐述了数据分析的前置工作,将由两个方面诠释作者对数据分析准备工作的理解。


首先,“数据指标定义”和“数据收集”这两个东西本身有关系吗?——有的。


数据指标的定义决定了数据收集的范围和目的,而数据收集的维度要和数据指标息息相关。


这两个东西和数据分析有关系吗?——有的。


数据指标定义了你数据分析目的(数据分析往往是为了提升某个数据指标或降低某个数据指标,发现潜藏问题、寻找潜藏机会),而数据收集则给数据分析提供了基础。


http://dtstack-static.oss-cn-hangzhou.aliyuncs.com/2021bbs/files_user1/article/d5a350389e6d9bf79b06e3be6c5764c8..jpg


先介绍一下这两个名词的定义。


  • 数据指标:对当前业务有参考价值的可统计数据。


我们来理解一下这句话,数据指标对于产品而言就是说什么数据能衡量你们业务的好坏?什么数据对于你们产品是十分重要的?比如用户数、订单数、销售额、浏览数。数据指标可能有一个或多个没有固定约束,依据业务需求定义。


如果你们的产品业务较为简单,一个业务指标足以说明问题,定义一个足以。


  • 数据收集:用户行为所产生的结果都值得被收集,但是他的主要目的是以业务为导向收集体现业务情况的数据。


数据收集是一项很主观的行为,收集的粒度和收集频率都与产品特性有关,在本文中将介绍数据收集的方法(由业务出发和由功能使用情况出发)。


介绍了他们的定义,那么在具体项目中他们应该如何制定?



01
定义数据指标的两种方法


1. 确认模块或产品特性:确认与模块特性相关的关键指标


市面上的产品或功能基本能用以下几个模块进行划分,大家在使用时可进行相似归类,套用这个模版。


http://dtstack-static.oss-cn-hangzhou.aliyuncs.com/2021bbs/files_user1/article/a256c62738d06f8cbf5324a219e98be0..jpg


  • 内容:内容类型产品主要关注用户使用时长和频次。

  • 常用指标:浏览数、浏览时长、内容互动情况(弹幕、评论、点赞)


  • 社交:社交类型产品主要关注用户与用户之间的关系密度(紧密、多少)、和用户活跃程度。

  • 常用指标:发布量(社区使用)、互动量、关系密度(关注用户数、发送消息数)

  • 工具:工具类型产品主要关注用户使用频次和使用完成度。

  • 常用指标:使用量、频次、流程达成率(目标产品的用户流程较为简单,查看用户是否完成整个流程)

  • 交易:交易类型产品主要关注用户交易规模和整个交易流程的转化率。

  • 常用流程:详情页转化率(核心场景转化率)、金额(总交易规模)、客单价、复购率


Tips:做竞品分析的时候,可用同目的的功能放在一起对比指标数据。


如你们平台的内容模块每天大约新增100篇文章、有30人阅读、平均文章的评论量为30条。对手每天大约新增500篇文章、有30人阅读、平均文章的评论量为2条。说明在内容创造或内容更新频率上,对手远高于我们平台;但是在用户粘性或者用户对内容的认可度上,我们更高。因此,我们需要提高平台的内容创造能力和内容的打开率。


2. 确认核心业务:确认体现核心业务健康程度的指标


使用场景:业务简单、单一,或制定综合指标时可适用。


其实上面的指标定义方法可以涵盖大多部分使用场景,但是如果你是为你们平台制定一个总指标的时候,那就需要用核心业务确认总指标。


确认核心业务的方法:平台靠什么盈利。


举几个比较常见的例子:

  • 平台靠用户浏览广告进行盈利,核心业务卖广告,体现核心业务健康情况的关键指标为平台流量

  • 平台靠售卖商品进行盈利,体现核心业务健康情况的关键指标为GMV总销售额

  • 平台靠售卖会员进行盈利,体现核心业务健康情况的关键指标为会员用户量


这种方法确认的指标较为笼统,可作为公司公用指标进行使用,各个部门根据该指标进行拆分。


  • 如公司今年的关键指标为会员用户量

  • 运营对应指标-每月新增用户**人

  • 产品对应指标-每月留存用户保持在总用户的**%

  • 销售对应指标-每月用户购买会员订单为**单

  • 这种定义数据指标的适用场景较少,大家可以主要学习第一种确认数据指标的方法。


http://dtstack-static.oss-cn-hangzhou.aliyuncs.com/2021bbs/files_user1/article/00aa02cc68a364031e5f461a049a729c..jpg

02
数据收集的方法


数据收集主要是需要开发同学来进行埋点,我们需要定义埋在哪里。定义数据埋点我梳理了有以下两种方法:一种基于业务流程,一种基于功能被使用的情况,根据业务需求选择即可。


Tips:收集前要和开发说清楚是基于用户还是事件,看不懂这句话下面有解释。


1. 以业务流程进行埋点


说白了就是梳理业务流程,再统计各流程的数据。


这种埋点方式可以发现用户前后的两个环节是否有巨大断层,或者远低或远高于行业水平,从而优化各个环节的转化率(其实就是漏斗)。


  • 适用场景:页面层级清晰有明确的业务流程,每个页面有明确的业务目标(下单、支付)。

  • 使用方法:梳理业务流程后在各个页面或各个行为进行埋点即可。


Tips:做漏斗的时候,记住用户行为一定是有连贯性的、有顺序的、有时间限制的,基于用户还是事件要想清楚。


举个例子:

先说一下为什么有时间限制,用户在半年前浏览了平台的3篇文章,半年后他在平台通过一篇文章购买了商品。用户本次购买商品很大几率与半年前浏览内容无关,所以漏斗需将行为设置时间限制(设置时间限制可以让开发同学打一个小标签,在时间范围内进行了某种行为的用户才会被统计在漏斗内)。


http://dtstack-static.oss-cn-hangzhou.aliyuncs.com/2021bbs/files_user1/article/25c0dfc8e31e5f41c1b5f3778034c6e5..jpg


例子如上图,中间就是根据业务流程梳理的需要统计的页面。左边是根据事件进行埋点得到的数据,右边为真实用户数据(去重后),就是告诉一下大家基于用户/事件得到的数据是不同的。


当然事件和用户可以都进行统计,这样可以算出其他的一些数据,比如用户平均浏览多少个商品、平均浏览多少个分类、购买成功页面有多少用户进行分享。


2. 以功能模块拆解进行埋点


功能模块拆解,你们也可以理解为对对应数据指标的细化。


以社交模块为例,直接通过脑图的方式进行说明,这种埋点方式可以体现功能模块的健康程度。


http://dtstack-static.oss-cn-hangzhou.aliyuncs.com/2021bbs/files_user1/article/6038b8dca6872c96474759c06beb26d9..jpg


Tips:收集数据时如数据有明显的周期性则以该周期作为单位进行收集和比较。


http://dtstack-static.oss-cn-hangzhou.aliyuncs.com/2021bbs/files_user1/article/00aa02cc68a364031e5f461a049a729c..jpg

03
结束语


如某应用周末用户活跃度明显上升,则建议以周为单位进行收集。与往期数据对比时,建议同比上一周的数据或本周六的数据同比上周六的数据,这样可减少数据之间的干扰性。


本篇文章主要介绍两种定义数据指标的方法和两种进行数据埋点的方法,将最近工作中用到的方法总结给各位,希望能够和大家一起探讨。

免责申明:

本文系转载,版权归原作者所有,如若侵权请联系我们进行删除!

想了解或咨询更多有关袋鼠云大数据产品、行业解决方案、客户案例的朋友,浏览袋鼠云官网:https://www.dtstack.com/?src=bbs

同时,欢迎对大数据开源项目有兴趣的同学加入「袋鼠云开源框架钉钉技术群」,交流最新开源技术信息,群号码:30537511,项目地址:
https://github.com/DTStack

0条评论
社区公告
  • 大数据领域最专业的产品&技术交流社区,专注于探讨与分享大数据领域有趣又火热的信息,专业又专注的数据人园地

最新活动更多
微信扫码获取数字化转型资料
钉钉扫码加入技术交流群