5-7-1线性回归模型kkXXXY22110总体回归模型j也被称为偏回归系数(partialregressioncoefficients),表示在其他解释变量保持不变的情况下,Xj每变化1个单位时,Y的均值E(Y)的变化。kkXXXYˆˆˆˆˆ22110样本回归函数参数估计最小二乘法模型统计推断检验拟合优度检验方程显著性检验(F检验)变量显著性检验(t检验)(1)拟合优度检验回归方程的拟合优度检验就是要检验样本数据聚集在样本回归直线周围的密集程度,从而判断回归方程对样本数据的代表程度。回归方程的拟合优度检验一般用调整判定系数R2实现。该统计量的值越接近于1越好。(注:在一元线性回归中拟合优度的检验可用判定系数R2实现)(2)回归方程的显著性检验(F检验)回归方程的显著性检验是对因变量与所有自变量之间的线性关系是否显著的一种假设检验。回归方程的显著性检验一般采用F检验,利用方差分析的方法进行。FαHk012000:,,,(3)回归系数的显著性检验(t检验)所谓回归系数的显著性检验,就是根据样本估计的结果对总体回归系数的有关假设进行检验。之所以对回归系数进行显著性检验,是因为回归方程的显著性检验只能检验所有回归系数是否同时与零有显著性差异,它不能保证回归方程中不包含不能较好解释说明因变量变化的自变量。因此,可以通过回归系数显著性检验对每个回归系数进行考察。回归参数显著性检验的基本步骤。①提出假设②计算回归系数的t统计量值③根据给定的显著水平α确定临界值,或者计算t值所对应的p值④作出判断H0:j=0(j=1,2…k)一、一元线性回归y=a+bx例5-7-1已知我国分地区家庭人均食品支出、人均收入。试作一元线性回归分析。(e5-7-1)操作步骤:使用系统默认选择项进行线性回归分析Analyze-------Regression---------Linear分析——回归——线性Dependent:存放因变量Independent:存放自变量输出结果及结果分析VariablesEntered/RemovedbINCOMEa.EnterModel1VariablesEnteredVariablesRemovedMethodAllrequestedvariablesentered.a.DependentVariable:FOODEXPb.变量引入或剔出表:Model1引入变量income,用强迫输入法Enter。输入/移去的变量bincomea.输入模型1输入的变量移去的变量方法已输入所有请求的变量。a.因变量:foodexpb.ModelSummary.923a.852.84773.83Model1RRSquareAdjustedRSquareStd.ErroroftheEstimatePredictors:(Constant),INCOMEa.模型摘要表相关系数R=0.923,判定系数R2=0.852,调整判定系数R2=0.847,估计值的标准误为73.83注:在一元线性回归中可用判定系数R2来判断模型的拟合度。调整判定系数R2的值越大,模型的拟合优度越好。模型摘要.923a.852.84773.829模型1RR方调整的R方估计的标准差预测变量:(常量),income。a.ANOVAb878382.331878382.334161.149.000a152621.13285450.7551031003.529RegressionResidualTotalModel1SumofSquaresdfMeanSquareFSig.Predictors:(Constant),INCOMEa.DependentVariable:FOODEXPb.方差分析表回归的均方(Regression–MeanSquare)=878382.334,剩余(残差)的均方(Residual-Meansquare)=5450.755,F=161.149P=0.000.可以认为这两个变量之间有直线关系.注:H0为模型线性关系不成立,即b=0ANOVAb878382.331878382.33161.149.000a152621.13285450.7551031003.529回归残差合计模型1平方和df均方F显著性预测变量:(常量),income。a.因变量:foodexpb.Coefficientsa-53.08667.963-.781.441.422.033.92312.694.000(Constant)INCOMEModel1BStd.ErrorUnstandardizedCoefficientsBetaStandardizedCoefficientstSig.DependentVariable:FOODEXPa.系数a-53.08667.963-.781.441.422.033.92312.694.000(常量)income模型1B标准误非标准化系数Beta标准化系数t显著性因变量:foodexpa.变量显著性检验(t检验)回归系数:t=12.694,p=0.00,拒绝原假设,显著不为0常数项:t=-0.781,p=0.441,接受原假设,常数项与0没有显著差异。注意:在实际中一般不以t检验决定常数项是否保留在模型中,而是从经济意义方面分析回归线是否应该通过原点。回归方程:常数项=-53.086,回归系数=0.422,则线性回归方程为:y=-53.086+0.422x二、多元回归分析1、从“Analyze”(分析)——“Regression”(回归)——“Linear”(线性),打开Linear线性回归主对话框。2、在左侧的源变量栏中选择一数值变量作为因变量进入Dependent栏中,选择一个或更多的变量作为自变量进入Independent(s)栏中。3、如果要对不同的自变量采用不同的引入方法,可利用“Previous”与“Next”按钮把自变量归类到不同的自变量块(Block)中,然后对不同的变量子集选用不同的引入方法(Method)。Enter(进入):强迫引入法,默认选择项。定义的全部自变量均引入方程。Remove(移去):强迫剔除法。定义的全部自变量均删除。Forward(向前):向前引入法。自变量由少到多一个一个引入回归方程,直到不能按检验水准引入新的变量为止。该法的缺点是:当两个变量一起时效果好,单独时效果不好,有可能只引入其中一个变量,或两个变量都不能引入。Backward(向后):向后剔除法。自变量由多到少一个一个从回归方程中剔除,直到不能按检验水准剔除为止,能克服向前引入法的缺点。当两个变量一起时效果好,单独时效果不好,该法可将两个变量都引入方程。Stepwise(逐步):逐步引入一剔除法。将向前引入法和向后剔除法结合起来,在向前引入的每一步之后都要考虑从已引入方程的变量中剔除作用不显著者,直到没有一个自变量能引入方程和没有一个自变量能从方程中剔除为止。缺点同向前引入法,但选中的变量比较精悍。说明:为弥补各种选择方法和各种标准的局限性,不妨分别用各种方法和多种引入或剔除处理同一问题,若一些变量常被选中,它们就值得重视。4、Selectionvariable(选择变量):可从源变量栏中选择一个变量,单击Rule后,通过该变量大于、小于或等于某一数值,选择进入回归分析的观察单位。5、CaseLabels(个案标签):在左侧的源变量框中选择一变量作为标签变量进入CaseLabels框中。6、Statistics(统计)对话框单击“Statistics”按钮,进入统计对话框如图:Estimates(默认选择项):回归系数的估计值(B)及其标准误(Std.Error)、常数(Constant);标准化回归系数(Beta);B的t值及其双尾显著性水平(Sig.)。Modelfit(默认选择项):列出进入或从模型中剔除的变量;显示下列拟合优度统计量:复相关系数(R)、判定系数(R2)、调整R2(AdjustedRSquare)、估计值的标准误以及方差分析表。Confidenceintervals:回归系数B的95%可信区间(95%ConfidenceintervalforB)。Descriptives:变量的均数、标准差、相关系数矩阵及单尾检验。Covariancematrix:方差——协方差矩阵。Rsqaredchange:R2和F值的改变,以及方差分析P值的改变。Partandpartialcorrelations:显示方程中各自变量与因变量的零阶相关(Zero一order,即Pearson相关)、偏相关(Partial)和部分相关(part)。进行此项分析要求方程中至少有两个自变量。Collinearitydiagnostic(共线性诊断)。显示各变量的容差(Tolerance)、方差膨胀因子(VIC,VarianceInflationFactor)和共线性的诊断表。容差(Tolerance)是不能由方程中其它自变量解释的方差所占的构成比。所有进入方程的变量的容差必须大于默认的容差水平值(Tolerance:0.0001)。该值愈小,说明该自变量与其他自变量的线性关系愈密切。该值的倒数为方差膨胀因子(VarianceInflationFactor)。当自变量均为随机变量时,若它们之间高度相关,则称自变量间存在共线性。在多元线性回归时,共线性会使参数估计不稳定。逐步选择变量是解决共线性的方法之一。Durbin-Waston:用于随机误差项的分析,以检验回归模型中的误差项的独立性。如果误差项不独立,那么对回归模型的任何估计与假设所做出的结论都是不可靠的。•计算DW值•给定,由n和k的大小查DW分布表,得临界值dL和dU•比较、判断0D.W.dL存在正自相关dLD.W.dU不能确定dUD.W.4-dU无自相关4-dUD.W.4-dL不能确定4-dLD.W.4存在负自相关说明:当D.W.值在2左右时,模型不存在一阶自相关。Casewisediagnostic:对标准化残差(服从均数=0,标准差=1的正态分布)进行诊断。判断有无奇异值(离群值)(outliers)。Outliers:显示标准化残差超过n个标准差的奇异值,n=3为默认值。AllCases:显示每一例的标准化残差、实测值和预测值、残差。7、Plots(图)对话框单击“Plots”按钮,对话框如下图所示。Plots可帮助分析资料的正态性、线性和方差齐性,还可帮助检测奇异值或异常值。(1)散点图:可选择如下任何两个变量为Y(纵轴变量)与X(横轴变量)作图。为获得更多的图形,可单击“Next”按钮来重复操作过程。DEPENDENT:因变量。*ZPRED:标准化预测值。*ZRESID:标准化残差。*DRESID:删除的残差。*ADJPRED:调整残差。*SRESID:Student氏残差。*SDRESID:Student氏删除残差。(2)StandardizedResidualPlots:标准化残差图。Histogram:标准化残差的直方图,并给出正态曲线。NormalProbalityPlot:标准化残差的正态概率图(P-P图)。(3)ProduceallPartialplots:偏残差图。8、Save(保存新变量)对话框单击“Save”按钮,对话框如下图所示。每项选择都会增加新变量到正在使用的数据文件中。(1)预测值(PredictedValues):Unstandardized:未标准化的预测值,简称预测值(新变量为pre_1)。Standardized标准化的预测值(新变量为Zpr_1)。S·E·Ofmeanprediction:预测值的标准误(新变量为Sep_l)。(2)残差(Residuals)Unstandardized未标准化残差(新变量为res_1)。Standardized:标准化残差(新变量为Zre_1)。(3)预测区间估计(PredictionIntervals)Mean:是总体中当X为