SPSS相关分析

整理文档很辛苦,赏杯茶钱您下走!

免费阅读已结束,点击下载阅读编辑剩下 ...

阅读已结束,您可以下载文档离线阅读编辑

资源描述

第8章:相关分析Correlationsone2world@yahoo.com.cn8.1相关分析8.1.1统计关系与函数关系客观事物之间的关系大致可分为两大类关系:(1)函数关系:当一个或几个变量取一定的值时,另一个变量有确定值与之相对应,我们称这种关系为确定性的函数关系。(2)统计关系:两事物之间的一种非一一对应的关系,即当一个变量x取一定值时,另一变量y无法依确定的函数取唯一确定的值。one2world@yahoo.com.cn8.1.2线性相关和非线性相关统计关系可再进一步分为:(1)线性相关:当一个变量的值发生变化时,另外的一个变量也发生大致相同的变化。在直角坐标系中,如现象观察值的分布大致在一条直线上,则现象之间的相关关系为线性相关或直线相关(Linearcorrelation)。(2)非线性相关:如果一个变量发生变动,另外的变量也随之变动,但是,其观察值分布近似的在一条曲线上,则变量之间的相关关系为非线性相关或曲线相关(Curvilinearcorrelation)one2world@yahoo.com.cn8.1.3正线性相关与负线性相关线性相关可以分为:(1)正线性相关:两个变量线性的相随变动方向相同。(2)负线性相关:两个变量线性的相随变动方向相反。one2world@yahoo.com.cn8.1.4相关分析如果仅仅研究变量之间的相互关系的密切程度和变化趋势,并用适当的统计指标描述。这就是相关分析。如果要把变量间相互关系用函数表达出来,用一个或多个变量的取值来估计另一个变量的取值,这就是回归分析。绘制散点图和计算相关系数是相关分析最常用的工具,它们的相互结合能够达到较为理想的分析效果。one2world@yahoo.com.cn8.2绘制散点图8.2.1散点图的特点散点图:是将数据以点的形式画在直角坐标系上,通过观察散点图能够直观的发现变量间的相关关系及它们的强弱程度和方向。在实际分析中,散点图经常表现出某些特定的形式。如绝大多数的数据类似于“橄榄球”的形状,或集中形成一根“棒状”,而剩余的少数数据点则零散地分布在四周。通常“橄榄球”和“棒状”代表了数据对的主要结构和特征,可以利用曲线将这种主要结构的轮廓描绘出来,是数据的主要特征更突出。one2world@yahoo.com.cnr=1r=0.7~0.8r=0r=0r=-0.7~-0.8r=-1yxyxyxyxyx完全正相关正相关无相关完全负相关负相关无相关one2world@yahoo.com.cn8.2.2散点图应用举例案例:利用住房状况问卷调查数据,分析家庭收入与打算购买的住房面积之间存在怎样的统计关系。(数据:住房状况调查.sav)操作:【图形(Graps)】【散点图(Scatter)】one2world@yahoo.com.cnone2world@yahoo.com.cn简单散点图①表示一对变量间统计关系的散点图②将纵轴变量选入【Y轴】,③将横轴变量选入【X轴】,④将分组变量选入【设置标记】:用该变量分组,并在一张图上用不同颜色绘制若干个散点图。⑤将标记变量选入【标注个案】:将标记变量的各变量值标记在散点图相应点的旁边。one2world@yahoo.com.cnone2world@yahoo.com.cnone2world@yahoo.com.cn8.3计算相关系数8.3.1相关系数的特点利用相关系数进行变量间线性关系的分析通常需要完成以下两个步骤:1.计算样本相关系数r;①相关系数r的取值在-1~+1之间②r0表示两变量存在正的线性相关关系;r0表示两变量存在负的线性相关关系③r=1表示两变量存在完全正相关;r=-1表示两变量存在完全负相关;r=0表示两变量不相关④|r|0.8表示两变量有较强的线性关系;|r|0.3表示两变量之间的线性关系较弱one2world@yahoo.com.cn2.对样本来自的两总体是否存在显著的线性关系进行推断。由于存在随机抽样和样本数量较少等原因,通常样本相关系数不能直接用来说明样本来自的总体是否具有显著的线性相关性,而需要通过假设检验的方式对样本来自的总体是否存在显著的线性相关关系进行统计推断。基本步骤是:(1)提出原假设,即两总体无显著的线性关系。(2)选择检验统计量,即不同的相关系数。(3)计算检验统计量的观测值和对应的概率值。(4)决策:p与a的关系。one2world@yahoo.com.cn8.3.2相关系数的种类对不同类型的变量应采用不同的相关系数来度量,常用的相关系数主要有Pearson简单相关系数、Spearman等级相关系数和Kendall相关系数等。1.Pearson简单相关系数(适用于两个变量都是数值型的数据)Pearson简单相关系数的检验统计量为:nininiiixyyyxxyxRiiyx11221)()())(()2(~122ntrnrtone2world@yahoo.com.cn2Spearman等级相关系数①Spearman等级相关系数用来度量定序变量间的线性相关关系,②设计思想与Pearson简单相关系数相同,只是数据为非定距的,故计算时并不直接采用原始数据,而是利用数据的秩,用两变量的秩代替代入Pearson简单相关系数计算公式③于是其中的和的取值范围被限制在1和n之间,且可被简化为:(,)iixy(,)iixy(,)iiUVixiy222i21161()(1)nniiiiiDrDUVnn,其中one2world@yahoo.com.cn①如果两变量的正相关性较强,它们秩的变化具有同步性,于是的值较小,r趋向于1;②如果两变量的正相关性较弱,它们秩的变化不具有同步性,于是的值较大,r趋向于0;③小样本下,在零假设成立时,Spearman等级相关系数服从Spearman分布;④在大样本下,Spearman等级相关系数的检验统计量为Z统计量,定义为Z统计量近似服从标准正态分布。22i11()nniiiiDUV1Zrn22i11()nniiiiDUVone2world@yahoo.com.cn3.Kendall相关系数(1)用非参数检验方法度量定序变量间的线性相关关系(2)利用变量秩数据计算一致对数目和非一致对数目。①当两个变量具有较强的正相关关系,则一致对数目较大,非一致对数目较小,②当两个变量具有较强的负相关关系,则一致对数目较小,非一致对数目较大,③当两个变量相关性较弱,则一致对数目和非一致对数目大致相等,one2world@yahoo.com.cnKendall相关系数在小样本下,Kendall相关系数服从Kendall分布;在大样本下,Kendall相关系数的检验统计量为Z统计量,定义为:Z统计量近似服从标准正态分布。非一致对数目,一致对数目,VUnnVU)1(2)()52(2)1(9nnnZone2world@yahoo.com.cn8.3.3计算相关系数的应用举例对于案例8-1,通过绘制散点图得知家庭收入与计划购买的住房面积之间存在一定的正的弱相关关系,为更确定地反映两者之间线性关系的强弱,采用计算相关系数的方法。由于这两个变量为定距变量,故采用Pearson相关系数。【分析(Analyze)】【相关(correlate)】【两变量(bivariate)】one2world@yahoo.com.cnone2world@yahoo.com.cn因p=0.000a(0.01)故拒绝原假设,即拒绝零相关因相关系数为0.323,意味着两者存在弱相关。one2world@yahoo.com.cn8.4偏相关分析8.4.1偏相关分析和偏相关系数(1)简单相关系数研究两变量间线性相关性,若还存在其他因素影响,其往往夸大变量间的相关性,不是两变量间线性相关强弱的真实体现。例如,研究商品的需求量、价格和消费者收入之间的线性关系时,需求量和价格的相关关系实际还包含了消费者收入对价格和商品需求量的影响。此时,单纯利用简单相关系数来评价变量间的相关性是不准确的,需要在剔除其他相关因素影响的条件下计算变量间的相关。偏相关的意义就在于此。one2world@yahoo.com.cn(3)偏相关分析也称净相关分析,它在控制其他变量线性影响的条件下分析两变量间的线性关系,所采用的工具是偏相关系数。(4)控制变量个数为1时,偏相关系数称一阶偏相关;当控制两个变量时,偏相关系数称为二阶偏相关;当控制变量的个数为0时,偏相关系数称为零阶偏相关,也就是简单相关系数。one2world@yahoo.com.cn偏相关系数的分析步骤(1)计算样本的偏相关系数假设有三个变量y、x1和x2,在分析x1和y之间的净相关时,需控制x2的线性作用,则x1和y之间的一阶偏相关定义为:偏相关系数的取值范围及大小含义与相关系数相同。12121,2222121212212(1)(1)yyxxxyyyyyyrrrrrrrrr1其中,、、分别表示和x的相关系数、和的相关系数、和的相关系数。one2world@yahoo.com.cn(2)对样本来自的两总体是否存在显著的净相关进行推断,检验统计量为:其中,r为偏相关系数,n为样本数,q为阶数。t统计量服从n-q-2个自由度的t分布。221nqtrrone2world@yahoo.com.cn8.4.2偏相关分析的应用举例对于案例8-1,已经分析了家庭收入与计划购房面积之间的相关性。直观感觉这种相关性会受到家庭常住人口数影响。为此可将家庭常住人口数作为控制变量,对家庭收入与计划购房面积作偏相关分析。【分析(analyze)】【相关(correlate)】【偏相关(partial)】one2world@yahoo.com.cnone2world@yahoo.com.cn相关分析因p=0.000a(0.01)故拒绝原假设,即拒绝零相关因相关系数为0.323,意味着两者存在弱相关。偏相关分析在常住人口作为控制变量的条件下,家庭收入与计划面积间的偏相关系数为0.335,仍呈一定的弱相关。与简单相关系数相比略高了一些,其原因是家庭常住人口与计划面积之间定的相关系数为负数,呈极弱的负相关性。该负数带入偏相关系数的计算公式后使偏相关系数微略增大。

1 / 29
下载文档,编辑使用

©2015-2020 m.777doc.com 三七文档.

备案号:鲁ICP备2024069028号-1 客服联系 QQ:2149211541

×
保存成功