博客 5000字详解数据分析方法分类汇总

5000字详解数据分析方法分类汇总

   数栈君   发表于 2023-05-29 15:46  804  0

1、基本描述统计


基本描述统计分析包括频数分析、描述分析、分类汇总;是对收集的数据进行基本的说明。


  • 频数分析一般使用频数、百分比、饼图等形式进行描述。

  • 描述分析常见的指标有平均值、标准差、最大值、最小值、中位数等;更深入的描述指标包括百分位数、峰度、偏度、变异系数等。

  • 分类汇总用于研究不同分类时的汇总情况,输出的指标为汇总结果。比如不同区域分类项,销售额(汇总项)的差异情况。


http://dtstack-static.oss-cn-hangzhou.aliyuncs.com/2021bbs/files_user1/article/8a024caa1626100e60f13048d7fb0652..jpg


下方链接均会跳转至SPSSAU帮助手册:

频数分析

描述分析

分类汇总


2、差异关系研究


常见的差异关系研究方法包括方差分析、t检验、卡方检验、非参数检验


‍(1)方差分析


方差分析用于进行定类数据与定量数据之间的差异关系研究;按照研究内容和数据类型等不同,可分为以下几类:


http://dtstack-static.oss-cn-hangzhou.aliyuncs.com/2021bbs/files_user1/article/6f08fd5d7b507578af3b81f5bb98619f..jpg


下方链接均会跳转至SPSSAU帮助手册:

单因素方差分析

双因素方差分析

多因素方差分析

事后多重比较

协方差分析

重复测量方差分析


视频教学——几类方差分析方法对比说明:

SPSSAU
,赞19

(2)t检验


t检验,用于分析定类数据与定量数据之间的差异情况,按照研究内容和数据类型等不同,可分为以下几类:


http://dtstack-static.oss-cn-hangzhou.aliyuncs.com/2021bbs/files_user1/article/e2ce15dfb024d4451f400a5e52a8897a..jpg


下方链接均会跳转至SPSSAU帮助手册:

独立样本t检验

单样本t检验

配对t检验

概要t检验


视频教学——t检验的类型及区分:

SPSSAU
,赞26

(3)卡方检验


卡方检验,用于分析定类数据与定类数据之间的差异情况,按照研究内容和数据类型等不同,可分为以下几类:


http://dtstack-static.oss-cn-hangzhou.aliyuncs.com/2021bbs/files_user1/article/4185f800d12a8382bb6b59135557ba17..jpg



下方链接均会跳转至SPSSAU帮助手册:

卡方检验

配对卡方

卡方拟合优度

分层卡方

Fisher卡方


视频教学——几类卡方检验的对比说明:

SPSSAU
,赞57

(4)非参数检验


前面讲的常见的数据差异性分析方法:例如方差分析、t检验都属于参数检验的范围。参数检验一般需要数据满足正态性、方差齐性。与参数检验相对的是非参数检验,非参数检验不对总体的分布形态做假定,所以当数据不正态或方差不齐时,可使用非参数检验进行差异性研究。


参数检验对应非参数秩和检验如下:


http://dtstack-static.oss-cn-hangzhou.aliyuncs.com/2021bbs/files_user1/article/a59730bea7174d4b08abd20783b0b3ad..jpg


下方链接均会跳转至SPSSAU帮助手册:

单样本Wilcoxon秩和检验
配对样本Wilcoxon秩和检验
非参数检验(Mann-Whitney秩和检验&Kruskal-Wallis秩和检验)
Friedman秩和检验
相关分析(Spearman秩相关&Kendall秩相关)

教学视频——非参数检验和参数检验

SPSSAU
,赞20

3、影响关系研究

影响关系研究包括进行相关分析、回归分析、logit回归分析三大类。

‍(1)相关分析


相关分析可分为以下三类:


http://dtstack-static.oss-cn-hangzhou.aliyuncs.com/2021bbs/files_user1/article/f7c0835070fcd97c88a277fbff60817e..jpg


下方链接均会跳转至SPSSAU帮助手册:

相关分析

偏相关分析

典型相关分析


‍(2)回归分析


回归分析主要进行影响关系研究,可以细分为二十几种,由于篇幅有限,这里仅介绍比较常用的回归分析方法,感兴趣同学可以登陆SPSSAU进行学习。


http://dtstack-static.oss-cn-hangzhou.aliyuncs.com/2021bbs/files_user1/article/3f5c482a682ef6a067411787eca61316..jpg


下方链接均会跳转至SPSSAU帮助手册:

线性回归

逐步回归

岭回归

曲线回归

分组回归

‍(3)logit回归分析


当研究X对Y的影响时,如果因变量Y为定类数据,则应该使用logit回归分析。


http://dtstack-static.oss-cn-hangzhou.aliyuncs.com/2021bbs/files_user1/article/9731801f29f7133e86a359b8ada62394..jpg


下方链接均会跳转至SPSSAU帮助手册:

二元logit回归

有序logit回归

多分类logit回归


视频教学——3种logit回归分析对比及剖析

SPSSAU
,赞58

4、信息浓缩方法

信息浓缩常见方法为因子分析、主成分分析


因子分析和主成分分析都是信息浓缩的方法,即将多个分析项信息浓缩成几个概括性指标。如果希望进行将指标命名,SPSSAU建议使用因子分析。原因在于因子分析在主成分基础上,多出一项旋转功能,该旋转目的即在于命名。


下方链接均会跳转至SPSSAU帮助手册:

因子分析

主成分分析


5、聚类分析方法

聚类分析以多个研究标题作为基准,对样本对象进行分类。


http://dtstack-static.oss-cn-hangzhou.aliyuncs.com/2021bbs/files_user1/article/96b657b11fd6b6ef10f39dcc229f874f..jpg



下方链接均会跳转至SPSSAU帮助手册:

聚类分析(K-means、K-modes、K-prototype)

分层聚类


6、信度分析

信度分析的方法主要有以下三种:Cronbach α信度系数法、折半信度法、重测信度法。


http://dtstack-static.oss-cn-hangzhou.aliyuncs.com/2021bbs/files_user1/article/2e90c901ebf73eff8fb5367f1a61abcd..jpg


下方链接均会跳转至SPSSAU帮助手册:

Cronbach α信度

折半信度法

重测信度(使用相关系数分析)


7、效度分析

效度有很多种,可分为四种类型:内容效度、结构效度、区分效度、聚合效度。


http://dtstack-static.oss-cn-hangzhou.aliyuncs.com/2021bbs/files_user1/article/36c2392416bf30dc06ee859eb1929277..jpg


下方链接均会跳转至SPSSAU帮助手册:



8、中介/调节

中介作用、调节作用、调节中介作用分析说明如下:


http://dtstack-static.oss-cn-hangzhou.aliyuncs.com/2021bbs/files_user1/article/4ccefb6ac99c1d03568c85b27b37b92d..jpg


下方链接均会跳转至SPSSAU帮助手册:

中介作用

调节作用

调节中介


9、权重研究

权重研究是用于分析各因素或指标在综合体系中的重要程度,最终构建出权重体系。权重研究有多种方法:


http://dtstack-static.oss-cn-hangzhou.aliyuncs.com/2021bbs/files_user1/article/9b2c35ded90eabd77da27cfa2c5fffce..jpg


下方链接均会跳转至SPSSAU帮助手册:

AHP层次分析法

熵值法

TOPSIS法

因子分析

主成分分析

灰色关联法

其他


10、模型研究方法

当需要研究多个变量之间的关系情况时,通常可构建统计模型用于分析及预测,分析方法说明见下表:



下方链接均会跳转至SPSSAU帮助手册:

线性回归

logistic回归

典型相关

PLS回归

路径分析

结构方程模型


11、一致性研究方法

一致性检验的目的在于比较不同方法得到的结果是否具有一致性。检验一致性的方法有很多比如:Kappa检验、ICC组内相关系数、Kendall W协调系数等。


http://dtstack-static.oss-cn-hangzhou.aliyuncs.com/2021bbs/files_user1/article/7ba9f7ce011a18d223f3c80e17d867e5..jpg


下方链接均会跳转至SPSSAU帮助手册:

Kappa一致性检验

Kendall协调系数

ICC组内相关系数


12、可视化分析方法

常用的可视化分析方法如下:


http://dtstack-static.oss-cn-hangzhou.aliyuncs.com/2021bbs/files_user1/article/51e501bcc0271bf76942d4c1375fba07..jpg


免责申明:

本文系转载,版权归原作者所有,如若侵权请联系我们进行删除!

《数据治理行业实践白皮书》下载地址:https://fs80.cn/4w2atu

《数栈V6.0产品白皮书》下载地址:https://fs80.cn/cw0iw1

想了解或咨询更多有关袋鼠云大数据产品、行业解决方案、客户案例的朋友,浏览袋鼠云官网:https://www.dtstack.com/?src=bbs

同时,欢迎对大数据开源项目有兴趣的同学加入「袋鼠云开源框架钉钉技术群」,交流最新开源技术信息,群号码:30537511,项目地址:https://github.com/DTStack



0条评论
社区公告
  • 大数据领域最专业的产品&技术交流社区,专注于探讨与分享大数据领域有趣又火热的信息,专业又专注的数据人园地

最新活动更多
微信扫码获取数字化转型资料