博客 一文讲清楚数据分析方法论是什么

一文讲清楚数据分析方法论是什么

   数栈君   发表于 2023-07-28 15:56  649  0

当然互联网上有非常多数据分析的心法和教程,我大概总结了一下,大致有两类:

  • 一种是偏纯理论形式的;比如如何用spss做主成分分析,专业高大上,怎样应用勒?完全没有时间系统学习有木有!

  • 一种是偏形而上的,告诉你数据分析,首先要基于数据调研,然后数据验证巴拉巴拉的,给你一种道理都懂,依然过不好这一生的错觉。


因为自己从业数据产品多年,数据产品的一个基本工作就是把分析结论抽象成数据产品,帮助业务进行数据洞察;自己也大大小小做过非常多的数据分析,我就在想:是否可以基于自己的经验,总结出一套标准的数据分析方法论,帮助行业内的小伙伴更清晰的知道该如何做一个完整的数据分析?


当然,这次对自己的这套方法论也有一些自我要求:

  • 一定要从实际出发的那种,要有一个案例贯穿始终;

  • 一定要有可复用的结论,并且是不形而上,夸夸其谈的那种。


于是乎便有了此篇文章。


本文将以外卖流量分配分析作为案例,深入讲解如何完整的做一个数据分析。


http://dtstack-static.oss-cn-hangzhou.aliyuncs.com/2021bbs/files_user1/article/e62282d80067455a7d635ead6f057640..jpg


数据分析的本质是解决某一个业务问题。解决业务问题的前提,一定要想清楚两件事情:

  • 理解问题:想清楚这个问题到底是什么

  • 定义问题:用数据拆解出这个问题


我见过太多小伙伴做数据分析的时候,根本就没搞明白为什么要分析?要分析的这个问题到底是什么?


所以,在分析之前,一定要花时间了解这个数据分析到底解决了什么问题。


这个问题,在定义清楚后,需要和业务方、leader去反复沟通,直到对这个问题清楚的达成共识。


以外卖流量分配举例:


1、理解什么是流量分配?


从市场收回到外卖业务来看,流量分配其实和布局市场的本质是一样的:通过更有效的分发商品、更合理的摆放商家,让用户与商户进行更有效率的交易。


那么,如何更有效的分发商品?如何更合理的摆放商家呢?


需要通过一套分发机制去实现,而分发机制必须依赖于分发渠道去实施。


具体来说,分发渠道可以看作我们线上产品的流量渠道。该有哪些流量渠道,流量渠道里该摆放哪些商家,是我们考虑的重点。


流量渠道作为分发渠道,起到连接商家与用户的作用,同时也是对用户需求及商家供给进行配对。


如下:

  • 用户群体1:渠道1­­­商家1、商家2、商家3

  • 用户群体2­­­:渠道2­­­商家4、商家5、商家6

  • 用户群体3­­­:渠道3­­­商家7、商家8、商家9


流量渠道是为分发机制服务的通道,每一个流量渠道必定有不同分发机制的含义。比如:搜索入口,以搜索关键词为分发机制,建立用户需求与商家供给的匹配。


综上所述:站在平台看流量分配是一件什么样的事情?


以流量渠道作为媒介,通过资源配置实现用户与商户进行更有效率的交易,平台需要做两件事情:

  • 分对人(匹配需求):把合理的流量渠道分配给需要的用户群体,即为现在进行的精准化营销,千人千面。

  • 配对货(匹配供给):每一个流量渠道里分配满足这个用户需求的商家。


2、用数据定义流量分配


首先,思考如何去定义流量?


一般而言,流量是指在某一时间某一地点某一会话从来源到去向的全过程。


其次,思考我们用什么指标去有效的衡量流量:用DAU衡量?用页面去重UV衡量?还是用什么去衡量?


从业务的角度来看,我要统计一天内产生了多少的流量,代表我要统计有多少次用户使用过我的产品。


每日流量,本质上为每日会话数=每日用户数*日均用户使用频次。


最后,思考我们该从哪些角度去衡量流量?


拆解来看,如下表:


http://dtstack-static.oss-cn-hangzhou.aliyuncs.com/2021bbs/files_user1/article/b7396cb50e548af89416866e54e852a7..jpg


http://dtstack-static.oss-cn-hangzhou.aliyuncs.com/2021bbs/files_user1/article/4b36b51635a5a36483840b8f4d1049f8..jpg


知道了数据分析的问题是什么后,需要我们去基于这个问题,梳理一个数据分析框架。在这个分析框架里,我们需要明确分析内容的数据范围以及要分析哪些问题。


1、明确数据范围

数据范围一般分为空间范围与时间范围;具体如下:


http://dtstack-static.oss-cn-hangzhou.aliyuncs.com/2021bbs/files_user1/article/2d888dc18db9a79f60246cabb0a24371..jpg


2、规划分析框架

基于定义问题环节中对问题的理解,用详细的数据拆解问题,并把这些问题进行归类形成框架。


基于外卖流量分配为例,框架截取如下:


http://dtstack-static.oss-cn-hangzhou.aliyuncs.com/2021bbs/files_user1/article/d6bcee2928560c86f59d2254261a2a8d..jpg

http://dtstack-static.oss-cn-hangzhou.aliyuncs.com/2021bbs/files_user1/article/749a5dce9e07a921deedf6b2cad1907e..jpg


http://dtstack-static.oss-cn-hangzhou.aliyuncs.com/2021bbs/files_user1/article/c95491a42c8edc3ec8e75f210fafcfaa..jpg


有了数据分析框架后,需要对数据分析框架里的数据进行详细定义规范,确保每一项数据的统计口径是准确无误的。


数据内容主要分为:


1、指标维度定义

详细定义数据分析框架中的每一个指标含义,形成指标字典。


这个指标字典的作用,一方面作为需求文档,是与数据开发评审的依据;另一方面,是一份释义说明,作为分析报告中指标说明的出口。


基于外卖流量分配为例,截取部分指标说明如下:


http://dtstack-static.oss-cn-hangzhou.aliyuncs.com/2021bbs/files_user1/article/3f7510d93aecfda1a8a0c40a8bd588ce..jpg

http://dtstack-static.oss-cn-hangzhou.aliyuncs.com/2021bbs/files_user1/article/296763dee69cec2dafb2265b33ecd5e4..jpg


2、指标维度矩阵设计

需要把指标维度用一个矩阵的方式呈现出来,如果该指标在该维度上有关联,则打勾。


指标维度矩阵的作用是明确指标与维度的关系,也可以帮助我们复验所有指标与维度的关联是否可以满足我们的分析需求,避免后期造成如下badcase:我想从地域的角度观测交易金额指标,却发现取出的数据中,交易金额不支持地域维度的下钻。


基于外卖流量分配为例,截取部分指标维度矩阵如下:


http://dtstack-static.oss-cn-hangzhou.aliyuncs.com/2021bbs/files_user1/article/35f502783c0897f3327101ae415b6d89..jpg


http://dtstack-static.oss-cn-hangzhou.aliyuncs.com/2021bbs/files_user1/article/db590210b6c56fae9be74926dede2d6b..jpg


接下来基于分析框架,明确每一个分析问题,需要采用什么样的分析方法进行分析;详情写出分析的标题、度量内容、可视化方法、分析方法,并按数据分析报告(以PPT为例)展示的顺序组织。


基于外卖流量分配为例,截取部分如下:


http://dtstack-static.oss-cn-hangzhou.aliyuncs.com/2021bbs/files_user1/article/014de8b6bfb0f578df7a27bea69a5a69..jpg


那我们到底该选取什么样的可视化方法去呈现我们的报告呢?这里参照国外大神的经验,总结了一个万能图表,供大家参考:


http://dtstack-static.oss-cn-hangzhou.aliyuncs.com/2021bbs/files_user1/article/3d07710302569f4997ebedda6ae76d90..jpg


完成分析方法的规划后,我们就可以形成一个数据分析的提纲,这个数据分析提纲是非常重要的:

  • 清楚的阐明我们需要分析的问题。这些问题并不是凭空想象的,而是基于定义问题环节、搭建分析框架环节的逻辑推导得出。

  • 清楚的知道分析问题中需要的数据内容。

  • 有一个完整的画面感,明确数据分析最终呈现的样式。


以PPT展示形式为例,甚至可以知道这个报告有多少页,每一页都有哪些内容。


http://dtstack-static.oss-cn-hangzhou.aliyuncs.com/2021bbs/files_user1/article/ad89e4d243e80da4291e8cce455d3dd9..jpg


http://dtstack-static.oss-cn-hangzhou.aliyuncs.com/2021bbs/files_user1/article/08267778c167df2d65d6e7fa901dbf3e..jpg


这样,我们基于以上的准备,就可以按部就班的去输出我们的分析报告了。


我在这里的建议是,一定要把任何一个数据分析当成自己的作品一样,高标准高要求的进行产出。这样,不仅可以锻炼我们的撰写报告能力,也可以更好的让业务方对你形成专业可信赖的印象。


基于外卖流量分配为例,截取分析报告如下:


http://dtstack-static.oss-cn-hangzhou.aliyuncs.com/2021bbs/files_user1/article/62cefdb1266d5fc0409e37aef34baf38..jpg


备注:以上所有具体数据均经过虚构处理,请勿作为行业参考。


http://dtstack-static.oss-cn-hangzhou.aliyuncs.com/2021bbs/files_user1/article/0dda61284a22defca03b3ca8c959b8d4..jpg


如上以外卖流量分配为例,详细介绍了数据分析的全流程。


最后,对数据分析的方法论总结如下:


http://dtstack-static.oss-cn-hangzhou.aliyuncs.com/2021bbs/files_user1/article/68a4bd2746073b0077a722fbf5503cf3..jpg

免责申明:

本文系转载,版权归原作者所有,如若侵权请联系我们进行删除!

《数据治理行业实践白皮书》下载地址:https://fs80.cn/4w2atu

《数栈V6.0产品白皮书》下载地址:https://fs80.cn/cw0iw1

想了解或咨询更多有关袋鼠云大数据产品、行业解决方案、客户案例的朋友,浏览袋鼠云官网:https://www.dtstack.com/?src=bbs

同时,欢迎对大数据开源项目有兴趣的同学加入「袋鼠云开源框架钉钉技术群」,交流最新开源技术信息,群号码:30537511,项目地址:https://github.com/DTStack

0条评论
社区公告
  • 大数据领域最专业的产品&技术交流社区,专注于探讨与分享大数据领域有趣又火热的信息,专业又专注的数据人园地

最新活动更多
微信扫码获取数字化转型资料
钉钉扫码加入技术交流群