第九章spss的回归分析1、利用习题二第4题的数据,任意选择两门课程成绩作为解释变量和被解释变量,利用SPSS提供的绘制散点图功能进行一元线性回归分析。请绘制全部样本以及不同性别下两门课程成绩的散点图,并在图上绘制三条回归直线,其中,第一条针对全体样本,第二和第三条分别针对男生样本和女生样本,并对各回归直线的拟和效果进行评价。选择fore和phy两门成绩做散点图步骤:图形→旧对话框→散点图→简单散点图→定义→将phy导入X轴、将fore导入Y轴,将sex导入设置标记→确定图标剪辑器内点击元素菜单→选择总计拟合线→选择线性→确定→再次选择元素菜单→点击子组拟合线→选择线性→确定分析:如上图所示,通过散点图,被解释变量y与fore有一定的线性相关关系。2、线性回归分析与相关性回归分析的关系是怎样的?线性回归分析是相关性回归分析的一种,研究的是一个变量的增加或减少会不会引起另一个变量的增加或者减少。3、为什么需要对线性回归方程进行统计检验?一般需要对哪些方面进行检验?线性回归方程能够较好地反映被解释变量和解释变量之间的统计关系的前提是被解释变量和解释变量之间确实存在显著的线性关系。回归方程的显著性检验正是要检验被解释变量和解释变量之间的线性关系是否显著,用线性模型来描述他们之间的关系是否恰当。一般包括回归系数的检验,残差分析等。4、SPSS多元线性回归分析中提供了哪几种解释变量筛选策略?包括向前筛选策略、向后筛选策略和逐步筛选策略。5、先收集到若干年粮食总产量以及播种面积、使用化肥量、农业劳动人数等数据,请利用建立多元线性回归方程,分析影响粮食总产量的主要因素。数据文件名为“粮食总产量.sav”。步骤:分析→回归→线性→粮食总产量导入因变量、其余变量导入自变量→确定结果如图:VariablesEntered/RemovedbModelVariablesEnteredVariablesRemovedMethoddimension01农业劳动者人数(百万人),总播种面积(万公顷),风灾面积比例(%),粮食播种面积(万公顷),施用化肥量(kg/公顷),年份a.Entera.Allrequestedvariablesentered.b.DependentVariable:粮食总产量(y万吨)ModelSummaryModelRRSquareAdjustedRSquareStd.ErroroftheEstimatedimension01.994a.989.986901.93038a.Predictors:(Constant),农业劳动者人数(百万人),总播种面积(万公顷),风灾面积比例(%),粮食播种面积(万公顷),施用化肥量(kg/公顷),年份ANOVAbModelSumofSquaresdfMeanSquareFSig.1Regression2.025E963.375E8414.944.000aResidual2.278E728813478.405Total2.048E934a.Predictors:(Constant),农业劳动者人数(百万人),总播种面积(万公顷),风灾面积比例(%),粮食播种面积(万公顷),施用化肥量(kg/公顷),年份b.DependentVariable:粮食总产量(y万吨)CoefficientsaModelUnstandardizedCoefficientsStandardizedCoefficientstSig.BStd.ErrorBeta1(Constant)-613605.817230903.867-2.657.013年份304.688119.427.4022.551.016粮食播种面积(万公顷).736.782.053.942.354总播种面积(万公顷)1.939.650.1112.984.006施用化肥量(kg/公顷)141.07711.186.75512.612.000风灾面积比例(%)-307.20951.870-.174-5.923.000农业劳动者人数(百万人)-5.12122.286-.038-.230.820a.DependentVariable:粮食总产量(y万吨)分析:如以上4个表所示,影响程度来由大到小依次是风灾面积、使用化肥量、总播种面积和年份。(排除农业劳动者人数和粮食播种面积对粮食产量的影响)粮食总产量回归方程:Y=-7.893X1+15.68X2+7.126X3+7.268X4-7.4566、一家产品销售公司在30个地区设有销售分公司。为研究产品销售量(y)与该公司的销售价格(x1)、各地区的年人均收入(x2)、广告费用(x3)之间的关系,搜集到30个地区的有关数据。进行多元线性回归分析所得的部分分析结果如下:1)将第一张表中的所缺数值补齐。2)写出销售量与销售价格、年人均收入、广告费用的多元线性回归方程,并解释各回归系数的意义。3)检验回归方程的线性关系是否显著?4)检验各回归系数是否显著?5)计算判定系数,并解释它的实际意义。6)计算回归方程的估计标准误差,并解释它的实际意义。1)略2)各回归表示不同的变量对总体销售量的影响程度。销售量Y=-3.6958X1+5.4586X2+3.9814X3+3.10393)在对回归进行检验中,其P值为8.88341E-13,其小于0.05,所以可以认为检验回归方程的线性关系显著。4)在对回归进行检验中,各解释变量解释解释变量中的P值均小于0.05,所以认为其线性关系显著。5)、6)略7、试根据“粮食总产量.sav”数据,利用SPSS曲线估计方法选择恰当模型,对样本期外的粮食总产量进行外推预测,并对平均预测误差进行估计。步骤:图形→旧对话框→线形→简单→个案值→定义→将粮食总产量导入线的表征→确定结果如下图:步骤:分析→相关→曲线估计→粮食总产量导入因变量、年份导入变量,点击年份→在模型中选择二次项、立方→点击保存选择保存预测值→继续→确定模型汇总RR方调整R方估计值的标准误.978.957.9551651.679ANOVA平方和df均方FSig.回归1.961E929.804E8359.372.000残差8.730E7322728042.572总计2.048E934分析:如上表所示,粮食总产量总体呈现上升趋势,在对回归进行检验时,sig值为00.05,故拒绝原假设,即认为回归方程个解释变量与被解释变量间显著。