博客 数据分析方法论系列之矩阵法

数据分析方法论系列之矩阵法

   数栈君   发表于 2023-07-28 16:40  326  0

1、高大上的鸡肋方法论


在各路的数据分析软文和课程中,提到数据分析方法论,都会出现一些看起来非常专业的鸡肋数据分析模型


比如以下这些:


PEST分析法:政治(Politics)、经济(Economy)、社会(Society)、技术(Technology)


5W2H分析法:为什么(Why)、什么事(What)、谁(Who)、什么时候(When)、什么地方(Where)、如何做(How)、什么价格(How much)


SWOT分析法:S (strengths)是优势、W (weaknesses)是劣势,O (opportunities)是机会、T (threats)是威胁或风险


4P营销理论:4P即产品(Product)、价格(Price)、渠道(Place)、推广(Promotion)


波特五力模型:供应商的议价能力、购买者的议价能力、新进入者的威胁、替代品的威胁、同业竞争者的竞争程度


为什么说这些看似高大上的理论是鸡肋呢?


因为这些理论太过宏观,无法量化具体的业务问题进行具体分析,也没有判断标准,进而也就无法产生任何有价值的结论辅助业务。


所以当你真的按照上述这些方法论的各个维度进行填充分析,看起来是产出了一套严谨而科学的分析,但其实在这所谓的分析过程中,你并没有产生任何自己的思考,只是机械的按照框架进行了内容的填充。


而且,所谓的分析结果只要业务方多问几句 so what?就会发现一顿操作全是自我感动,无法产出任何有价值的结论。


2、矩阵法是什么?


吐槽了这么多,圆规正转http://dtstack-static.oss-cn-hangzhou.aliyuncs.com/2021bbs/files_user1/article/6468866aa55011d6366ed460268b0aec..jpg
(言归正传),今天分享的方法论是矩阵法。

矩阵法是指根据事物的两个低相关性的属性维度,进行交叉分类分析的一种数据分析方法。

交叉分类后,每个象限分类都应该可以得出一个明显的业务含义,最后针对每个分类象限作出不同的决策或处理。

其实矩阵法的本质就是一个二维属性交叉表,然后做散点图将两个属性的关联性直观地表现出来,此时如果坐标中心位于左下角就叫矩阵法,如果坐标中心位于图中央,分为了四个象限,就叫象限法。

这里为什么要强调两个属性维度要低相关性呢?

这是因为如果两个维度高度相关,有明显的共线性,做出的矩阵散点图会是一个类似于y=kx+b的直线,没有任何的业务意义。

比如用不同产品的购买人数和销售额做矩阵图,明显购买人数越多,销售额就会越高,二者高度相关,此时也就没有必要做矩阵图进行分析了。

3、矩阵法的使用场景

那么什么场景下,我们会使用矩阵法进行分析呢?简单来说,就是当两个指标的交叉时,可以明显解读出一些业务含义时,我们可以用矩阵法来辅助业务进行决策和落地。


1)波士顿矩阵


矩阵法中最著名的莫过于波士顿矩阵。


该矩阵将市场增长率与市场占有率这两个维度作为横纵坐标轴,将产品或者服务分为下面四个有明显不同业含义的类型


http://dtstack-static.oss-cn-hangzhou.aliyuncs.com/2021bbs/files_user1/article/b75dec719d637c960318013b76bcce8d..jpg

明星类:增长率高、占有率高,代表着十分成功的产品。

这类产品处于成长期,未来可能成为企业的金牛类产品,需要加大投资以支持其迅速发展;

金牛类:增长率低、占有率高,又称厚利产品。

这类产品一般已进入成熟期,销售量大,产品利润率高、负债比率低,可以为企业提供资金,而且由于增长率低,也无需增大投资;

问题类:增长率高、占有率低。前者说明市场机会大,前景好,用户需求高。而后者则说明在市场营销上存在问题,需要改进优化。

这类产品一般是在产品生命周期中处于引进期,因种种原因未能开拓市场局面的新产品;

瘦狗类:增长率低、占有率低。

这类产品一般已进入衰退期,利润率低、处于保本或亏损状态,无法为企业带来收益。对这类产品首先应减少批量,尽快淘汰。

2)渠道分析


互联网公司通常会在不同的渠道进行付费投放,以期不断获取新用户。但是如果获客单价一直高于单个用户带来的价值,公司就会持续亏损,不断亏钱。


所以我们可以根据投入和产出两个维度进行筛选,对如果有成本低产出高的优质渠道,就加大投入;如果有成本高产出低的劣质渠道,就尽快淘汰。


成本对应的指标就是获取一个新用户所需要的成本(Customer Acquisition Cost,CAC)。


其中ToC产品和ToB产品计算CAC的方式又略有不同。


ToC产品的CAC = 线上渠道投放费用 / 同时期新增用户数


ToB产品的CAC = 线上渠道投放费用费用 + 线下费用(会议、活动、销售等)/ 同时期新增用户数


产出其实就是看哪个渠道获客的留存时间最长、LTV(生命周期价值)最高?对应的指标分别就是留存率和LTV。


不过由于留存率和LTV这两项数据可能需要较长的时间才能产出,所以这二者在短期内也可以分别由新下载用户的注册比例和付费比例进行模拟。


然后我们以注册比例或付费比例为横轴,CAC为纵轴,制作散点图,每个渠道是其中一个点。


以各项指标的均值作为分隔线,高于均值定义为高,低于均值定义为低,这样就完成了一个矩阵图。


最后,我们要找出的就是矩阵中低成本高产出和高成本低产出这两类较为特殊的渠道(如果有的话,也有可能不存在),然后对好的渠道加大投入,将坏的渠道尽快淘汰。


3)用户分群


我们可以通过交叉业务中串行的两个低相关维度,来对用户进行分群定义,然后采取不同的策略进行运营。本质上,这是一种简单的用户画像。


比如用一个月内的活跃天数和日均付费金额进行交叉,可以得出以下四类用户:


  • 高活跃高付费(上瘾VIP用户)

  • 高活跃低付费(上瘾白嫖用户)

  • 低活跃高付费(需求较少的VIP用户)

  • 低活跃低付费(普通用户)


可以看到四类用户有明显不同的标签,这样就可以有针对性的进行运营,以期尽可能将用户向上瘾VIP用户的方向进行转化。

免责申明:

本文系转载,版权归原作者所有,如若侵权请联系我们进行删除!

《数据治理行业实践白皮书》下载地址:https://fs80.cn/4w2atu

《数栈V6.0产品白皮书》下载地址:
https://fs80.cn/cw0iw1

想了解或咨询更多有关袋鼠云大数据产品、行业解决方案、客户案例的朋友,浏览袋鼠云官网:
https://www.dtstack.com/?src=bbs

同时,欢迎对大数据开源项目有兴趣的同学加入「袋鼠云开源框架钉钉技术群」,交流最新开源技术信息,群号码:30537511,项目地址:
https://github.com/DTStack

0条评论
社区公告
  • 大数据领域最专业的产品&技术交流社区,专注于探讨与分享大数据领域有趣又火热的信息,专业又专注的数据人园地

最新活动更多
微信扫码获取数字化转型资料
钉钉扫码加入技术交流群