SPSS统计分析-第6章相关分析

整理文档很辛苦,赏杯茶钱您下走!

免费阅读已结束,点击下载阅读编辑剩下 ...

阅读已结束,您可以下载文档离线阅读编辑

资源描述

第6章相关分析•研究中常常需要分析两个或多个变量之间的相互关系,如数学成绩与语文成绩之间的关系、广告投入与产品销量之间的关系。如果分析目的是为了了解变量间相互联系的密切程度,像班主任神马想了解数学、物理、语文和英语成绩之间有何关联一样,就需要使用本章所要讲述的相关分析。•通过相关分析,可以确定变量之间是否存在相关关系和它的表现形式,并了解其相关关系的密切程度。6.1相关分析的基本原理•相关就是用数字来表明两个或两个以上变量之间的变动伴随关系。相关系数(coefficientofcorrelation)是变量间相关程度的数字表现形式,一般以ρ表示总体相关系数,以r表示样本相关系数,r的取值范围是[-1,1]。6.1.1相关的概念依据不同的标准,相关可以划分成不同的种类。1.完全相关、不完全相关和零相关按变量间的紧密程度,相关关系可分为完全相关、不完全相关和零相关。•完全相关是指变量间的关系是一一对应的,当一个变量变化时,另一变量有一确定的值与它对应。完全相关通常在自然科学研究中出现,而在人文社科类的研究中却很少出现。•不完全相关是指变量间不是一一对应的关系,当一个变量取某一值时,另一变量无法有确定的值与它对应。例如通过分析看出,学生的物理成绩和数学成绩有一定的关系,但两者没有一一对应的关系。本章所讲述的相关,就是这种不完全相关。•零相关是变量间没有关系,互不影响。2.正相关和负相关按相关的方向,相关关系可分为正相关和负相关。•正相关是指两个变量按照相同的方向变化,一个变量变化时,另一变量随之做相同方向的变化。如年龄增长,晶体智力随之增长。•负相关是指两个变量按照相反的方向变化,一个变量变化时,另一变量随之做相反方向的变化,如教师的教学效能越高,发生失职倦怠的可能性就越小。3.线性相关和非线性相关按相关的形式,相关关系可分为线性相关和非线性相关。•线性相关是所有数据在某一条直线附近,以后提到的相关分析,如果没有特殊说明,就是指线性相关。•非线性相关是所有数据在某一曲线附近。4.单相关、复相关和偏相关按变量的多少,相关关系可分为单相关、复相关和偏相关。•单相关是指两个变量之间的相关关系,如学生的数学成绩和语文成绩的关系。•复相关是指3个或3个以上变量间的相关关系,如教师的职业倦怠和教学效能感、人格特征等关系。•偏相关是指,某一变量和多种变量相关的情况下,假定其他变量不变,对其中两个变量所求的相关关系。•对所得数据进行统计时,一般计算样本统计量r,以推断总体参数ρ。相关系数r具有以下特征:•相关系数r的取值范围为[-1,1],常用小数形式表示。•相关系数的符号表示两变量间相关的方向,若r为正值,则表明两变量是正相关;若r为负值,则表明两变量是负相关。6.1.2相关的性质•相关系数的绝对值大小表明相关程度的强弱。在统计中,相关系数绝对值的大小与相关程度一般有如下关系。如表所示:•在数据文件建立后,选择“分析”下拉菜单中的“相关”子菜单,其中共有3个相关分析功能命令,如图所示,读者可根据不同的统计需求选择相应的命令。6.1.3相关分析的基本步骤•班主任发现本班学生的数学、物理、语文、英语成绩之间可能存在某些联系。如果他想要了解任意两科成绩之间的关系,就可采用本节所要讲述的双变量相关分析。现在,我们一起来帮助班主任学会如何使用双变量相关分析吧。6.2双变量相关分析•双变量相关过程是“相关”子菜单中最常使用的分析过程,研究者使用此过程对两个变量进行线性相关分析。根据不同的数据类型和条件,在SPSS中可选用Pearson积差相关、Kendall的tau-b等级相关或Spearman等级相关。下面将一一列出其各自的适用条件。•1.Pearson积差相关•英国统计学家Pearson认为积差相关系数是两个标准分数乘积之和除以n所得的商。其公式为:SSXYXYSSrXXYYXXYYnn6.2.1双变量相关分析的基本原理其适用条件是:•必须是成对数据,且每对数据之间是相互独立的;•样本容量大于等于30,这样才能保证计算的数据具有代表性,计算出的积差相关系数可以有效说明两个变量的相关关系;•两个变量的所属总体都呈正态分布,至少是接近正态的单峰分布;•两个变量都是由测量所得的连续性数据;•两个变量间的相关是线性相关;•排除共变因素的影响。2.Kendall相关•Kendall的tau-b相关是一种对两列等级变量的关系程度的测量,结果为交错系数(τ,读作tau),其公式为:ij0102sgn()sgn()ijijxxyyTTTT3.Spearman等级相关•英国心理学家、统计学家Spearman在Pearson积差相关的基础上,提出了Spearman等级相关,其公式为:•其适用条件是:•只有两个变量,且都为顺序变量,或一列数据是顺序变量数据,另一列数据是连续变量数据。•两个连续变量观测的数据,至少有一列数据是由非测量方法粗略评估得到的。如使用作品分析法时,评价者只能在一定标准基础上,依靠自己的经验进行粗略评估。2264311111XYDRRRNNNNNrN•双变量相关用于计算两变量之间的相关关系,在SPSS中操作过程如下:•(1)打开或建立数据文件。•(2)打开主对话框:依次选择“分析”“相关”“双变量”命令,打开“双变量相关”主对话框,如图所示。在该对话框可以选择分析变量、相关系数、检验类型等。6.2.2双变量相关分析的操作过程•(3)选择变量:左边的列表框是数据中所包含的所有变量,读者可以将想要分析的变量选中,单击按钮,将其选入“变量”列表框中。当变量多于两个时,结果中会给出“变量”列表框中所有变量两两之间的相关系数。•(4)选择相关系数:此选项组包含Pearson、Kendall的tau-b和Spearman三个复选框,读者可以在此选择相关系数的计算方法。•(5)选择检验类型:研究者可以使用此选项组选择相关系数的假设检验方式。•(6)选择“标记显著性相关”:选择是否在统计结果中用“*”号标记有显著相关的相关系数,系统默认选中。当P0.05时,相关系数旁会标识“*”,表明两变量在0.05水平上达到显著相关;当P0.01时,相关系数旁会标识“**”,表明两变量在0.01水平上达到显著相关。•(7)“选项”设置:单击“选项”按钮,打开“双变量相关性:选项”子对话框,如图所示。•(8)单击“确定”按钮,执行操作,输出结果。•下表列出了2008年江苏省各地级市的总生产总值、专利申请受理量和高校数量,试计算各地级市的生产总值与专利申请受理量之间有无联系。生产总值专利申请受理量高校数量生产总值专利申请受理量高校数量南京3825.761422037淮安685.6134494无锡2740.61236839盐城528.5543664徐州1143.3668987扬州830.8774683常州1919.12121169镇江741.2686084苏州2992.336133613泰州458.5362653南通1144.90219046宿迁308.587781连云港369.54175236.2.3实例分析:地级市生产总值与专利申请受理量的积差相关•解:在进行相关分析之前,需要先做散点图。因为进行相关分析的两变量必须是线性相关,所以在做相关分析之前,为了更好、更直接的看到两变量之间的关系,应先做散点图,再进行后续分析。由于变量“生产总值”、“专利申请受理量”和“高校数量”都是由测量所得的连续性数据,且每对数量间是独立的,首选相关系数为Pearson系数。(1)建立SPSS数据文件。变量1为GDP,定义为数值型;变量2为patents,定义为数值型;变量3为college,定义为数值型。(2)选择“图形”|“旧对话框”|“散点图/点图”命令,打开“散点图/点图”主对话框。如下图所示:(3)选择简单分布选项,单击“定义”按钮,打开“简单散点图”子对话框,如右图所示:(4)将左侧的变量“生产总值[GDP]”和“专利申请受理量[patents]”分别选入右侧的“Y轴”和“X轴”列表框中。单击“确定”按钮,运行SPSS程序,生成相应的散点图,如下所示:•从散点图看出,生产总值和专利申请受理量存在线性相关关系,可以继续进行相关分析。操作如下所示:(1)选择“分析”|“相关”|“双变量”命令,打开“双变量相关”主对话框,如下图所示:(2)将左侧的变量“生产总值[GDP]”和“专利申请受理量[patents]”选入右侧的“变量”列表框中。(3)勾选Pearson、“标记显著性相关”复选框,单击“确定”按钮。(4)输出结果如下表所示。6.3偏相关分析•有人研究儿童身高与智力的关系,结果发现相关系数很显著,于是他们认为儿童身高越高,智力也就越高。事实真的如此吗?•偏相关,也叫纯相关或净相关,是指在多个变量中,两个连续变量的相关系数是在排除其他变量影响后计算得到的。•运用简单相关计算两个变量的相关系数时,常常因为第三个变量的影响,使简单相关系数不能真正反映两个变量间的线性关系的程度和方向。在研究两个变量之间的线性关系时,可以运用偏相关,对可能产生影响的第三变量进行控制。偏相关的公式如下:12132312.322132311rrrrrr6.3.1偏相关分析的基本原理偏相关用于控制第三变量后,计算两变量间的相关系数,在SPSS中操作过程如下:•(1)打开或建立数据文件。•(2)打开主对话框:选择“分析”“相关”“偏相关”命令,打开“偏相关”主对话框,如图所示。6.3.2偏相关分析的操作过程•(3)选择变量:左边列表框中包含所有变量,选择需要分析变量,单击按钮,将其选入“变量”列表框中;选择控制变量,按钮,将其选“控制”列表框中。•(4)“显著性检验”选项组:功能与上节相同,读者可选择相关系数是单侧检验或是双侧检验。双侧检验为默认选项。•(5)“显示实际显著性水平”复选框:如勾选此选项,则在显示相关系数同时,给出确定的P值;如不勾选此选项,则只使用“*”或“**”表示显著性水平。•(6)单击“选项”按钮,打开“偏相关性:选项”子对话框,如图所示。•(7)单击“确定”按钮,执行操作,输出结果。•运用6.2.3节中表中的数据,对江苏省各地级市生产总值、专利申请受理量和高校数量进行偏相关分析。解:生产总值、专利申请受理量和高校数量3个变量之间都存在相关关系,但每两个变量间的相关是因为受到了第三变量的影响还需要运用偏相关分析才可以了解。(1)建立SPSS数据文件,与双变量相关的操作方法相同。6.3.3实例分析:地级市生产总值、专利申请受理量与高校数量的偏相关分析(2)选择“分析”|“相关”|“偏相关”命令,打开“偏相关”主对话框,如下图所示。(3)将左侧的变量“生产总值[GDP]”和“专利申请受理量[patents]”选入右侧“变量”列表框中;将左侧的“高校数量[college]”变量选入右侧的“控制”列表框中。(4)单击“选项”按钮,打开“偏相关性:选项”对话框,如图所示。勾选“统计量”选项组中的“零阶相关系数”选项,单击“继续”按钮,返回“偏相关”主对话框。(5)主对话框中的选项使用默认值。单击“确定”按钮。(6)输出结果如下表所示:用同样的方法,可以将“生产总值”、“专利申请受理量”分别作为控制变量,对另两个变量进行偏相关分析,结果如下面的两个表所示:•上表显示,在控制变量生产总值的条件下,专利申请受理量和高校数量间的相关系数为-0.637,P=0.0260.05,相关显著,但二者为负相关。•上表显示,在控制变量专利申请受理量的条件下,生产总值与高校数量的相关系数为0.909,P0.0000.001,相关极其显著。•二十一世纪国家间的竞争是综合国力的竞争,综合国力的测量是由不同指标构成,这些指标之间有没有联系呢,哪些指标间的联系比较密切、可划为一类呢?6.4距离相关分析•距离相关分析是在观测量间或者是变量间进行相似性或不相似性测量的方法,用户通常使用它为进一步的聚类分析、

1 / 56
下载文档,编辑使用

©2015-2020 m.777doc.com 三七文档.

备案号:鲁ICP备2024069028号-1 客服联系 QQ:2149211541

×
保存成功