相关分析

整理文档很辛苦,赏杯茶钱您下走!

免费阅读已结束,点击下载阅读编辑剩下 ...

阅读已结束,您可以下载文档离线阅读编辑

资源描述

第14章相关分析本章主要内容:1、相关分析简介;2、简单相关分析;3、偏相关分析;4、Distance过程14.1相关分析简介一、相关分析的指标体系1、连续变量的相关指标2、有序变量的相关指标3、名义变量的相关指标4、其他特殊指标1、连续变量的相关指标(积差)相关系数(或Pearson相关系数)Spearman相关系数2、有序变量的相关指标有序变量的相关性称为一致性。(1)Gamma统计量(2)Kendall’sTau-b(3)Kendall’sTau-c(4)Somer’sd四个系数都在-1到+1之间取值、其解释与Pearson相关系数相同。值得注意的是对各自对tie(并列值)的不同处理。Gamma不考虑并列值,即在计算时,并列值出现的次数不被计入分母之中。Somers'd将自变量的并列值考虑了进去、但没有考虑因变量的并列值。Kendall'stau-b则将自变量和因变量的并列值同时考虑了进去;而Kendall'stau-c则如同Gamma一样,忽略任何并列值。3、名义变量的相关指标(1)列联系数(2)Phi和Crammer’sV(3)系数(4)UncertainlyCoefficient4、其他特殊指标Eta指标:名义变量和连续变量的相关程度。KappaORRR二、SPSS的相关分析功能(1)Crosstabs中Statistics子对话框(2)Correlate子菜单BivariatePartialDistances14.2简单相关分析一、方法原理1、基本概念直线相关曲线相关正相关与负相关完全相关2、系数计算3、积差相关系数的适用条件(1)积差相关系数适用于线性相关的情形。(2)样本中存在的极端值对积差相关系数的计算影响极大,要慎重考虑和处理,必要时可以对其进行剔除,或进行变量变换。(3)积差相关系数要求相应的变量呈双变量正态分布。4、散点图的作用(1)变量间是否存在相关趋势;(2)相关趋势呈现为线性趋势还是曲线趋势;(3)发现明显的异常点,或者强影响点。二案例:考察总信心指数值和年龄的相关性操作步骤:1、打开数据库后,绘制总信心指数和年龄的散点图;2、单击AnalyzeCorrelateBivariate打开Bivariate对话框。2、从左边的变量框中选择需要考察的两个变量进入Variables框内,从CorrelationCoefficients栏内选择相关系数的种类,有Pearson相关系数,Kendall′s一致性系数和Spearman等级相关系数。从检验栏内选择检验方式,有双尾检验和单尾检验两种。3、单击Options按纽,选择输出项和缺失值的处理方式。本例中选择输出基本统计描述。4、单击OK,可以得到相关分析的结果。三秩相关系数秩相关系数又称Spearman等级相关系数。秩相关系数是利用两变量的秩次大小进行线性相关分析。适用范围:对于连续变量,当积差相关系数不适用时,可以使用Spearman等级相关系数来衡量两个变量之间的相关系数。四Kendall相关系数Kendall相关系数适用于有序分类变量。14.3偏相关分析一、方法原理简单相关关系只反映两个变量之间的关系,但如果因变量受到多个因素的影响时,因变量与某一自变量之间的简单相关关系显然受到其它相关因素的影响,不能真实地反映二者之间的关系,所以需要考察在其它因素的影响剔除后二者之间的相关程度,即偏相关分析。偏相关分析是指在相关的基础上考虑两个因素以外的各种影响因素,或者说在扣除了其他因素的作用大小以后,重新来考虑这两个因素间的关联程度。计算公式:参见《多元统计分析》。二案例:例:在控制家庭收入对总信心指数影响的前提下,考察总信心指数值和年龄的相关性。总信心指数与年龄存在相关关系,即年龄越老,信心指数越小,年龄越年轻,信心指数越大。同样,总信心指数与家庭收入也存在负相关关系。那么,总信心指数与年龄之间的负相关关系受不受家庭收入的影响?这种影响有多大?这就需要考虑偏相关关系。操作步骤:单击AnalyzeCorrelatePartial打开Partial对话框。此处,偏相关系数等于-0.203,与前文的相关系数-0.219是不一样的。14.4Distance距离一、距离测量与相似性指标在统计学中,距离可以用来表示两个变量的相似程度。另一个常用的相似指标是相关关系。根据变量的不同类型,可以有不同的距离/相似指标。具体内容参见《多元统计分析》中的判别分析和聚类分析。1、距离测量指标(1)欧式距离(2)频数表距离或卡方值距离(3)二分类距离2、相似性测量指标(1)计量资料:如,相关系数等(2)二分类变量:如,RussellandRao等。二案例:基因间距离的计算例:某实验室制作了一张基因芯片,上面一共检测了上万个基因,现在从数据库中提取了7个基因的数据,对其进行距离测量,确定哪些基因的距离比较接近。数据见:distance.sav操作步骤:单击AnalyzeCorrelateDistances打开Distances对话框。

1 / 23
下载文档,编辑使用

©2015-2020 m.777doc.com 三七文档.

备案号:鲁ICP备2024069028号-1 客服联系 QQ:2149211541

×
保存成功