SPSS - 相关分析 - 皮尔逊简单相关系数

最编程 2024-04-27 13:05:41

...

简介

相关分析属于数据分析流程前端的探索性分析，探究变量间关系及性质，其结果在于指导下一步采取何种方法，是数据挖掘之前的基础工作；

场景

相关分析之前，有必要搞清楚变量的类型，根据具体类型选择合适的相关系数。Pearson相关系数适用于两变量的度量水平都是尺度数据，并且两变量的总体是正态分布或者近似正态分布的情况，还有说法认为其样本量应大于30，可供参考，在这些条件之外的，考虑选择spearman系数或者kendall系数。

步骤

这里写图片描述

数学特性

这里写图片描述

几何解释

对于相对中心性的数据（例如，一组已经通过样本均值转换为均值为0的数据），相关系数可以看做是由两随机变量样本绘出的两个向量之间夹角的余弦值。

这里写图片描述

假设检验

相关系数的显著性检验的目的是为了检验两个变量之间样本相关系数r(r≠0)与一个相关系数=0的已知总体之间的差别是否是由于抽样误差所产生的，如果差别有统计学意义，则说明两个变量之间存在相关关系。在已经检验两个变量存在相关关系的情况下，相关系数的绝对值越趋近于1，则两个变量相关关系越密切，越趋近于0，则两个变量相关关系越不密切。

基于数学近似的方法

H0：两样本服从正态分布，且不相关

这里写图片描述

准确服从高斯分布的数据

这里写图片描述

菜单

这里写图片描述

数据集  car_sales.sav

参数设置

这里写图片描述

简单散点图

这里写图片描述

结果分析

散点图

这里写图片描述

SPSS - 相关分析 - 皮尔逊简单相关系数

简介

场景

相关分析和回归分析的联系和区别

步骤

相关图分析

相关系数

相关系数的性质

相关系数的划分

Pearson简单相关系数

定义

数学特性

几何解释

假设检验

基于数学近似的方法

准确服从高斯分布的数据

菜单

参数设置

简单散点图

结果分析

散点图

相关性

数据可视化（VII）：用 Pandas 对香港酒店数据进行高级分析，包括相关系数、协方差、数据离散化、数据透视表和其他精美的可视化。

SPSS - 相关分析 - 皮尔逊简单相关系数

如何使用 SPSS 进行相关分析

SPSS (XV) SPSS 中的聚类分析（图形 + 数据集）[简单易懂］

皮尔逊相关系数及 p 值

关于如何计算皮尔逊相关系数的显著性 p 值及其背后原因的思考

Scipy 计算皮尔逊相关系数的用法，以及 p 值和置信度的原理和区别 - I. 应用程序接口的用法

使用SPSS进行多元相关性研究分析

用R语言ggplot2快速绘制简易热图：先做相关系数分析，得到相关系数值