首发于 SPSSAU数据科学
全流程总结相关分析

全流程总结相关分析

大家好,这里是SPSSAU。上周SPSSAU做了一个小调查,结果让我们十分意外。

得到最多的反馈是大家对于常见分析方法,不知道如何选择,如何分析。

虽说越实用的方法,往往也越简单。但刚开始接触数据分析时,确实就是会因为一些奇奇怪怪的术语看不懂,让大家产生很难懂学不会的挫败感。


为了帮大家快速度过新手期, 我们整理了一份常见分析方法的流程总结。

其中包括每种分析方法的分析流程,以及每个环节中可能出现的问题及应对方法。不会分析的同学可以按照图中的流程一步步操作,就能得到准确可靠的结果。

本文将介绍的是相关分析的分析流程,即SPSSAU通用方法中的“相关”。

相关分析流程总结


为了便于理解,我们先简单介绍下相关分析,然后按照分析流程顺序,对每一步可能会涉及的问题进行简要说明。

相关分析

我们使用相关分析,通常是研究两个变量的相关性情况。比如学习成绩和听课质量的关系;员工敬业度与薪资的关系等等。


1. 数据类型

相关分析的适用范围很广,理论上讲,凡是考察两个变量相关性,都可以叫做相关分析。

但依据习惯,我们通常说的相关分析,多指的是两个定量数据之间的简单相关分析,这就要求两个变量都是定量数据,即选项数字大小要可比较,且有实际意义。

如果两个数据均为定类数据,则不可以直接用相关分析,而应该使用卡方分析测量相关性(准确说应该是差异分析)。

如果一个是定类数据,一个是定量数据,则应该使用方差分析。


这种误用常见于分析背景信息题与核心研究题项的相关情况。

2. 正态性

相关分析要求数据服从正态分布,因此分析前需要检验数据的正态性。

正态性有多种检验方法,常见方法如:正态图、正态性检验、P-P图/Q-Q图等。

正态性的判断标准可以查看之前的文章: 判断数据正态性的常见方法汇总

由于相关分析对正态性要求比较宽松,即使违反计算结果也比较稳健,只要数据基本满足正态即可。如果数据完全不正态,则可以用Spearman相关系数。


3. 查看线性趋势

当两个定量数据在散点图上的散点呈现直线趋势时,就可以认为两者存在直线相关趋势,这也是相关分析的一个基本前提。

SPSSAU-散点图
散点图

例如上图,当X增大时,可以比较明显地看出Y会随着增大,说明X和Y之间有着正向相关关系。如果是负相关,散点图会呈现随着一个变量值的增加,另一个变量值降低的趋势。


非线性关系

如果数据呈现非线性的趋势,可以选择对变量进行数据转换(如对数转换),或是使用Spearman相关系数进行分析。


4. 检验异常值

相关分析对极端值较为敏感,异常值会影响分析结果。需要在分析前查看是否存在异常值,保证结果的可靠性,此步可以和上一步一起通过散点图查看。


存在异常值

如果存在极端值,需要在分析前进行剔除。使用方法:SPSSAU数据处理->异常值。


这是上一步中得到的散点图,有一个明显的离群值,研究者需要根据情况选择保留或删除。建议按照 SPSSAU异常值帮助手册的说明,对异常值进行处理。


5. 相关系数类型

当完成以上步骤且满足相关分析的分析条件后,即可进行相关分析。

点击‘通用方法’-‘相关’。


这时又出现一个问题。SPSSAU提供了三种相关系数,分别是Pearson、Spearman,Kendall相关系数,该选哪一种呢?



多数情况下,SPSSAU建议使用pearson相关系数。如果数据不满足正态性或不满足线性关系,可以考虑使用Spearman相关系数。

Kendall相关系数用于判断两个变量的等级相关性,是否具有一致性,比如评委打分,数据排名等。

关于三种相关系数的比较具体可以查看 相关分析帮助手册。


6. SPSSAU操作

终于到了分析这一步了。相对于其他分析软件,SPSSAU的操作相对简单,将变量从左侧拖拽到分析项处,点击‘开始相关分析’即可。

分析项X可选

需要特别强调的一点是,相关分析通常不会特别区分哪个变量是X,哪个变量是Y。因此分析时,常常是直接把分析项都放入“分析项Y(定量)”里即可。

如果有明确的X、Y可以分开放置,两种放置方法只在表格的展示格式上有区别,结果是一样的。


指标解读

分析步骤可参考SPSSAU输出结果中的“分析建议”及“智能分析”。

SPSSAU智能文字分析

需要注意的是相关系数代表变量之间的相关程度,相关系数越大,说明相关程度越紧密。

P值用于判断相关系数是否有统计学意义,P<0.05即说明变量间有相关关系,P值并不代表相关关系的强弱。

平均成绩、能力评分两个分析项交叉处的数字代表相关系数,而星号代表P值。一个星号代表P<0.05,两个星号代表P<0.01。如果没有星号,则说明P值>0.05。


7. 后续分析

相关分析的结果并不能代替回归分析,而相关分析通常是作为回归分析的基础,保证在有相关性的前提下,才可能有回归影响关系。

因此后续可以通过回归分析,进一步得到影响关系和具体的函数表达式。


最后总结

以上就是相关分析的分析流程梳理。理论上都应该按照上述步骤进行分析,但在实际过程中,即使忽略其中的步骤,也能得到稳定的结果。

因此即使不按照步骤分析,也没有问题,而对于没有分析经验的研究者,SPSSAU建议按提供的步骤进行分析,才是最保险的做法。


更多内容登录SPSSAU官网查看:

SPSSAU:方差分析、T检验、卡方分析如何区分?

SPSSAU:从问卷设计到数据分析,近百篇教程合集真是太太太全面了!

SPSSAU:问卷调查数据应该怎么分析?


代做工资流水公司遵义打印流水杭州签证流水费用九江代做入职银行流水西宁入职工资流水代办咸阳车贷流水代做金华办理企业流水打印芜湖做工资证明邯郸打入职流水中山做企业对公流水湖州工资流水账单模板临沂代办银行流水账单信阳打个人银行流水泰州打对公账户流水南阳个人工资流水 模板烟台代做企业流水打印洛阳查对公流水北京工资流水账单价格中山代办房贷收入证明株洲转账银行流水代开台州开转账流水惠州开薪资流水单烟台打印工资流水app截图肇庆银行流水电子版多少钱西宁打印日常消费流水唐山离职证明打印银川公司流水价格曲靖银行流水单价格潍坊代做工资代付流水深圳入职工资流水报价株洲薪资银行流水多少钱香港通过《维护国家安全条例》两大学生合买彩票中奖一人不认账让美丽中国“从细节出发”19岁小伙救下5人后溺亡 多方发声卫健委通报少年有偿捐血浆16次猝死汪小菲曝离婚始末何赛飞追着代拍打雅江山火三名扑火人员牺牲系谣言男子被猫抓伤后确诊“猫抓病”周杰伦一审败诉网易中国拥有亿元资产的家庭达13.3万户315晚会后胖东来又人满为患了高校汽车撞人致3死16伤 司机系学生张家界的山上“长”满了韩国人?张立群任西安交通大学校长手机成瘾是影响睡眠质量重要因素网友洛杉矶偶遇贾玲“重生之我在北大当嫡校长”单亲妈妈陷入热恋 14岁儿子报警倪萍分享减重40斤方法杨倩无缘巴黎奥运考生莫言也上北大硕士复试名单了许家印被限制高消费奥巴马现身唐宁街 黑色着装引猜测专访95后高颜值猪保姆男孩8年未见母亲被告知被遗忘七年后宇文玥被薅头发捞上岸郑州一火锅店爆改成麻辣烫店西双版纳热带植物园回应蜉蝣大爆发沉迷短剧的人就像掉进了杀猪盘当地回应沈阳致3死车祸车主疑毒驾开除党籍5年后 原水城县长再被查凯特王妃现身!外出购物视频曝光初中生遭15人围殴自卫刺伤3人判无罪事业单位女子向同事水杯投不明物质男子被流浪猫绊倒 投喂者赔24万外国人感慨凌晨的中国很安全路边卖淀粉肠阿姨主动出示声明书胖东来员工每周单休无小长假王树国卸任西安交大校长 师生送别小米汽车超级工厂正式揭幕黑马情侣提车了妈妈回应孩子在校撞护栏坠楼校方回应护栏损坏小学生课间坠楼房客欠租失踪 房东直发愁专家建议不必谈骨泥色变老人退休金被冒领16年 金额超20万西藏招商引资投资者子女可当地高考特朗普无法缴纳4.54亿美元罚金浙江一高校内汽车冲撞行人 多人受伤

代做工资流水公司 XML地图 TXT地图 虚拟主机 SEO 网站制作 网站优化