博客指标设计需要使用一些常用的统计学工具

指标设计需要使用一些常用的统计学工具

数栈君发表于 2023-07-28 16:11 943 0

具体到指标设计，我们需要使用一些常用的统计学工具：

http://dtstack-static.oss-cn-hangzhou.aliyuncs.com/2021bbs/files_user1/article/04077b4552daf5bce8d40af5af601dc2..jpg

以顾客质量分析为例：概况是我们看下顾客的平均支付金额，或者支付中位数，来了解顾客概况。如果我们想了解这批顾客的质量是都比较好，还是良莠不齐，则需要通过方差和标准差来描述。如果想知道更详细的内容，可以了解每个区间的用户数是多少，来做判断。

有一些 Tips 供大家参考：

比率指标：关注实际效果（下单转化率，光看下单数是没有用的）
伴生指标：既要看新客数也要看 CAC，确保数量的前提也要确保质量
防止坏指标：错误指标，虚荣指标，复杂指标

这里简单解释下每个 Tips 的目标。之所以采取比率指标和伴生指标，是因为能够明显反映业务的「效率」且能够有效防止因为追求单个指标而导致动作变形。如果说这辆车能跑十万公里，其实并不能表示这辆车的性能怎么样。只有「速率=路程/时间」，才能反映这辆车的效率。同时，如果片面追求速率，会导致汽车在设计时剑走偏锋，给驾驶者带来危险，因此需要再加个「故障率」或「事故率」等伴生指标来确保安全。

http://dtstack-static.oss-cn-hangzhou.aliyuncs.com/2021bbs/files_user1/article/67915644f9ec6fda0cbe1366e1f97d1f..jpg

坏指标中的「虚荣指标」首次出现《精益数据分析》一书中，作者简单把「PV/UV」等指标都归为虚荣指标。刚开始时我颇为认可，但后续在实际的应用过程中，发现对于很多业务的监控，这些指标并避免不了。后续我便把「虚荣指标」更正为「把距离业务目标过远的环节定义为核心监控指标」。对于一个即时通讯 APP 来讲，下载次数，启动用户数，注册用户数需要监控，但不能作为核心监控的指标。更合适的应该是消息数或「进行过对话的用户数」。复杂指标往往是各种「指数」，用了很多指标各种加减乘除，这会导致此类指标在发生波动时，很难分析原因。

拥有对指标的定义权和解释权是个段位非常高的事情。这要求设计者深入了解业务和拥有极高的抽象能力。对于分析师来讲，拥有指标定义权将凸显出你在业务方的重要性。当然，这里并不是鼓励大家为了定义指标而定义指标。寻找业界已有量化方法并在公司内推广，也是件功德无量的事情。

举个美女外卖的「美女厨师率加权指导值」为例。为避免泄露商业机密，将这个原本用来衡量用户体验的指标换成「美女厨师率」，以下背景也稍作修改，大家领会精神即可。指标的背景是为了保证用户的用餐体验，美女外卖总部提出每个城市的商家必须配备一定比例的美女厨师。但城市提出异议：不同城市拥有的商家情况不一样，大型的商家厨师多，美女厨师率会相对较低，不能用统一的值来对比所有城市。因此总部便设计出来这么一个指导值：将全国商家进行分层，每个层次的商家得出全国平均值，然后各个城市对标平均值产出自身的对标值，即「美女厨师率加权指导值」。虽然在计算上稍微复杂点，但在实际应用的过程中，BD 们只需要知道总体的差距和每一层商家的差别，很容易针对性的落地和优化。

http://dtstack-static.oss-cn-hangzhou.aliyuncs.com/2021bbs/files_user1/article/d9dad063aaefa6d336e62eeef3533974..jpg

1.1.2 建立指标体系

在根据「指标设计方法」上，如何建立起围绕业务的指标体系呢。核心是根据业务特征确定核心指标，在核心指标的基础上以不同的角度进行拆解。然后再慢慢补充其他业务的指标情况。

拆解的时候，要做到按指标拆解而非维度。比如订单数，也可以拆解为各品类的订单数合计。这一点可以通过保持上下两层指标名称不一致来避免。拆解的过程依照金字塔方法论的「逐层拆解，不重不漏（MECE）」。若拆解出来或业务补充的指标过多，可借鉴数据仓库的「域」概念来管理这些指标，如上图的「交易域」，「商品域」和「用户域」。

在一个规范的指标体系中，已经涉及到元数据管理的领域了。包括针对指标命名的规范，数据存储和计算的管理等等。大家有兴趣地可以搜下相关文章，或阅读阿里巴巴新出的《阿里巴巴大数据实践之路》。下面截取一张来自云栖大会的，关于指标命名规范的 PPT 给大家：

http://dtstack-static.oss-cn-hangzhou.aliyuncs.com/2021bbs/files_user1/article/89247f99b130792328af2e0c86b17341..jpg

免责申明：

本文系转载，版权归原作者所有，如若侵权请联系我们进行删除！

《数据治理行业实践白皮书》下载地址：https://fs80.cn/4w2atu

《数栈V6.0产品白皮书》下载地址：https://fs80.cn/cw0iw1

想了解或咨询更多有关袋鼠云大数据产品、行业解决方案、客户案例的朋友，浏览袋鼠云官网：https://www.dtstack.com/?src=bbs

同时，欢迎对大数据开源项目有兴趣的同学加入「袋鼠云开源框架钉钉技术群」，交流最新开源技术信息，群号码：30537511，项目地址：https://github.com/DTStack