1第七章相关与回归分析【例】有10个企业生产某种产品,月产量和生产费用的数据如表所示:10个企业月产量和生产费用数据企业编号月产量(千吨)(x)生产费用(万元)(y)11.26222.08633.18043.811055.011566.113277.213588.016099.71681010.3180要求:(1)进行相关性分析;(2)建立一元线性回归方程;(3)对一元线性回归方程进行统计学检验。【解】第一步:画散点图。打开数据文件data07-1.sav,选择Graphs→LegacyDialogs→Scatter/Dot→SimpleScatter→Define→将月产量和生产费用两个变量分别送入x轴框中和y轴框中→Ok,结果如图所示:2由图可看出:10个企业的月产量和生产费用之间大致呈一条直线,两者之间可建立一元线性回归模型。第二步:计算相关系数。打开数据文件data07-1.sav,选择Analyze→Correalate→Bivariate→将月产量和生产费用两个变量送入Variables框中→Ok,输出结果如表所示:月产量和生产费用之间的相关分析表月产量生产费用月产量PearsonCorrelation1.983**Sig.(2-tailed).000N1010生产费用PearsonCorrelation.983**1Sig.(2-tailed).000N1010**.Correlationissignificantatthe0.01level(2-tailed).由表7-2可看出:10个企业的月产量和生产费用之间的单相关系数为0.983,说明两者之间呈高度正相关关系,可建立一元线性回归模型。第三步:建立一元线性回归模型。打开数据文件data07-1.sav,选择Analyze→Regression→Linear→将月产量和生产费用两个变量分别送入Independent框中和Dependent框中→Ok,得到回归估计的结果。Spss软件得到的回归估计的结果主要包括回归估计、方差分析和回归系数估计三个部分,具体如表7-3、7-4、7-5所示:表7-3回归估计结果表ModelRRSquareAdjustedRSquareStd.ErroroftheEstimate1.983a.966.9617.76794a.Predictors:(Constant),月产量3表7-4方差分析结果表ModelSumofSquaresdfMeanSquareFSig.1Regression13556.873113556.873224.672.000aResidual482.727860.341Total14039.6009a.Predictors:(Constant),月产量b.DependentVariable:生产费用表7-5回归系数估计表ModelUnstandardizedCoefficientsStandardizedCoefficientstSig.BStd.ErrorBeta1(Constant)53.4345.23910.199.000月产量12.299.821.98314.989.000a.DependentVariable:生产费用从输出的回归系数估计表中的Coefficient可以得到估计的常数项为53.434,估计的斜率为12.299,即估计的一元线性回归方程为:ˆ53.43412.299yx(1)判定系数为20.966R;(2)一元回归方程的显著性检验224.672FF>0.05(1,8)5.32F回归方程显著(3)回归系数的显著性检验0.05214.989(8)2.306tt回归系数显著这说明所建立的一元线性回归方程在0.05的显著性水平下通过了统计学检验,统计学检验即拟合优度检验、t检验和F检验,也说明所建立的回归方程比较好。从所建立的回归方程可以看出:10个企业的月产量每增加1千吨,生产费用将平均增加12.299万元。