实验主题专业统计软件应用实验题目相关分析实训时间2011学年2学期15周(2011年5月30日—31日)学生姓名官其虎学号2009211467班级0360901实训地点信息管理实验室设备号B25指导教师刘进一实验目的衡量事物之间,或称变量之间线性相关程度的强弱并用适当的统计指标表示出来,这个过程就是相关分析。相关系数是衡量变量之间相关程度的一个指标,总体的相关系数用ρ表示,样本的相关系数用r表示。理解和学会使用相关分析方法解决问题。二实验内容第一题:K.K.Smith在烟草杂交繁殖的花上收集到如表8.16所示的数据,要求对以上3组数据两两之间进行相关分析,以0.05的显著性水平检验相关系数的显著性。(数据来源:《统计软件SPSS系列应用实践篇》苏金明,电子工业出版社;数据文件:data8-5.sav)表8.16K.K.Smith所调查的长度资料花瓣长494432423253363937454148453940343735花枝长27241222132914201212225231820152013花萼长116121710191514152114222215141515161、实验原理:二元变量相关分析是分析两个变量变量之间的相关关系,称为单相关,三个或以上变量之间的相关关系称为相关,这种相关涉及一个因变量与两个以上的自变量,在实际工作中,如果存在多个自变量与一个因变量的关系,则应抓住其中最主要的因素,研究其相关关系。调用Bivariate过程时允许同时输入两个变量或两个以上变量,但系统输出的是变量间两两相关的相关系数。检测的零假设是两个变量的相关系数为0。2、实验步骤:第1步分析:分析三组数据的两两之间的相关性,而且给出的是具体的数值,这是一个二元相关性问题;第2步数据组织:将三个变量分别定义为花瓣、花枝和花萼;第3步按Analyze|Correlate|Bivariate顺序打开二元变量的分析主对话框BivariateCorrelations;运行即可(你再单击Options按钮,打开BivaiateCorrelations:Option对话框,选择Statistics方框内的两个复选框,看效果又如何。)3、实验结果:DescriptiveStatisticsMeanStd.DeviationN花瓣长40.445.97318花枝长19.675.02918花萼长16.173.29418Correlations花瓣长花枝长花萼长花瓣长PearsonCorrelation1.955**.797**Sig.(2-tailed).000.000SumofSquaresandCross-poducts606.444487.667266.667Cvariance35.67328.68615.686N181818花枝长PearsonCorrelation.955**1.678**Sig.(2-tailed).000.002SumofSquaresandCross-products487.667430.000191.000Covariance28.68625.29411.235N181818花萼长PearsonCorrelation.797**.678**1Sig.(2-tailed).000.002SumofSquaresandCross-products266.667191.000184.500Covariance15.68611.23510.853N181818**.Correlationissignificantatthe0.01level(2-tailed).分析:表中给出了3个变量两两之间的Pearson相关系数(PearsonCorrelation)、双侧显著情况检验概率(Sig.(2-tailed))和数据组数(N)。脚注内容显示相关分析结果在0.01的水平上显著。另外,从表中可以看出,花瓣长和花枝长的数据具有很强的相关性。而双侧检验的显著性概率均小于0.05,因此否定零假设(零假设是变量之间不具有相关性),认为相关系数不为零,变量之间具有相关性。第二题:试确定1962-1988年安徽省国民收入与城乡居民储蓄存款余额两个变量间的线性相关性,数据如表8.17所示。(数据来源:《数据统计与管理》1990年第5期,中国商场统计研究会主办;数据文件:data8-6.sav)表8.171962-1988年安徽省国民收入数据表年份19621963196419651966196719681969197019711972197319741975国民收入(亿元)34.6135.6739.5247.3254.1450.8649.6951.6165.0672.5777.7283.578287.44存款余额(亿元)0.590.10.8511.221.141.321.281.35.61.874.22.552.61年份1976197719781979198019811982198319841985198619871988国民收入(亿元)95.6397.23103.81116.29127.87150.29161.47180.2221.17271.81310.53357.86444.78存款余额(亿元)2.743.133.915.758.7612.1916.3620.9528.3238.4355.4374.289.831、实验原理:二元变量线性相关性是分析两个变量变量之间的相关关系,称为单相关,三个或以上变量之间的相关关系称为相关,这种相关涉及一个因变量与两个以上的自变量,在实际工作中,如果存在多个自变量与一个因变量的关系,则应抓住其中最主要的因素,研究其相关关系。调用Bivariate过程时允许同时输入两个变量或两个以上变量,但系统输出的是变量间两两相关的相关系数。检测的零假设是两个变量的相关系数为0。2、实验步骤:第1步分析:分析三组数据的两两之间的相关性,而且给出的是具体的数值,这是一个二元相关性问题;第2步数据组织:将2个变量分别定义为国民收入与城乡居民储蓄存款余额;第3步按Analyze|Correlate|Bivariate顺序打开二元变量的分析主对话框BivariateCorrelations;运行即可(你再单击Options按钮,打开BivaiateCorrelations:Option对话框,选择Statistics方框内的两个复选框,看效果又如何。)3、实验结果:DescriptiveStatisticsMeanStd.Deviation国民收入128.5452106.1875327存款余额14.121923.7969327Correlations国民收入存款余额国民收入PearsonCorrelation1.976**Sig.(2-tailed).000SumofSquaresandCross-products293170.56764137.265Covariance11275.7912466.818N2727存款余额PearsonCrrelation.976**1Sig.(2-tailed).000SumofSquaresandCross-products64137.26514723.639Covariance2466.818566.294N2727**.Correlationissignificantatthe0.01level(2-tailed).分析:从表中可看出相关系数(PearsonCorrelation)为0.9760,说明呈正相关,而伴随概率sig为0.0000.05,因此应拒绝零假设(两变量之间不具有相关性),即说明国民收入与城乡居民储蓄存款余额显著性正影响的。第三题:某高校抽样得到10名短跑运动员,测出100米的名次和跳高的名次如表8.18,问这两个名次是否在0.05的显著性水平下具有相关性。(数据来源:《应用统计学:数据统计方法、数据获取与SPSS应用》马庆国,科学出版社;数据文件:data8-7.sav)表8.1810名运动员的100米及跳高名次百米名次12345678910跳高名次431527108961、实验原理:二元变量相关分析2、实验步骤:第1步分析:分析三组数据的两两之间的相关性,而且给出的是具体的数值,这是一个二元相关性问题;第2步数据组织:将2个变量分别定义为百米名次和跳高名次第3步按Analyze|Correlate|Bivariate顺序打开二元变量的分析主对话框BivariateCorrelations;运行即可(你再单击Options按钮,打开BivaiateCorrelations:Option对话框,选择Statistics方框内的两个复选框,看效果又如何。)3、实验结果:DescriptiveStatisticsMeanStd.DeviationN百米名次5.503.02810跳高名次5.503.02810Correlations百米名次跳高名次百米名次PearsonCorrelation1.697*Sig.(2-tailed).025SumofSquaresandCross-products82.50057.500Covariance9.1676.389N1010跳高名次PearsonCorrelation.697*1Sig.(2-tailed).025SumofSquaresandCross-products57.50082.500Covariance6.3899.167N1010*.Correlationissignificantatthe0.05level(2-tailed).分析:从表中可看出相关系数(PearsonCorrelation)为0.6970,说明呈正相关,而伴随概率sig为0.0000.05,因此应拒绝零假设(两变量之间不具有相关性),即说明百米名次与跳高名次显著性正影响的。第四题:某公司太阳镜销售情况如表8.19所示,请分析销售量与平均价格、广告费用和日照时间之间的关系,并说明此题用偏相关分析是否有实际意义(显著性水平为0.05)。(数据来源:《SPSSforWindows统计分析(第3版)》卢纹岱,电子工业出版社;数据文件:data8-8.sav)表8.19某公司销售太阳镜的数据月份123456789101112销量759014818324226327831825620014080价格6.86.563.532.92.62.13.13.64.24.2广告费用2567222528302218102日照时间2.444.26.888.410.411.59.66.13.421、实验原理:偏相关分析2、实验步骤:第1步分析:这4个因素彼此均有影响,分析时应对生长量与4个因素分别求偏相关,在求销售量与一个因素的相关时控制其他因素的影响,然后比较相关系数,按4个因素对销售量的影响的大小排序。第2步定义变量:销售量与平均价格、广告费用和日照时间;第3步按Analyze|Correlate|Partial顺序启动偏相关分析的主对话框,指定分析变量和控制变量,第一次分析变量为销售量与平均价格,其余为控制变量。在主对话框中使用系统默认的双尾检验,显示实际的显著性概率;在Option对话框中选择要求输出各变量的均值和标准差,显示Pearson相关系数矩阵,对缺失值的正理使用系统默认值。3、实验结果:CorrelationsControlVariables销量价格广告费用&日照时间销量Correlation1.000-.699Significance(2-tailed)..024df08价格Correlation-.6991.000Significance(2-tailed).024.df80CorrelationsControlVariables销量广告费用日照时间&价格销量Correlation1.000.666Significance(2-tailed)..036df08广告费用Correlation.6661.000Significance(2-tail