多元线性回归模型一.概述当今农村农民人均纯收入与多个因素存在着紧密的联系,例如人均工资收入,人均农林牧渔产值人均生产费用支出,人均转移性和财产性收入等。本次将以安徽1995-2009年农村居民纯收入与人均工资收入,人均生产费用支出,人均转移性和财产性收入等因素的数据,通过建立计量经济模型来分析上述变量之间的关系,强调农村居民生活的重要性,从而促进全国经济的发展。二、模型构建过程⒈变量的定义被解释变量:农民人均纯收入y解释变量:人均工资收入x1,人均农林牧渔产值x2人均生产费用支出x3人均转移性和财产性收入x4。建立计量经济模型:解释农民人均纯收入与人均工资收入,人均生产费用支出,人均转移性和财产性收入的关系⒉模型的数学形式设定农民人均纯收入与五个解释变量相关关系模型,样本回归模型为:Yi=0+1Xi1+2Xi2+3Xi3+4Xi4+ei⒊数据的收集该模型的构建过程中共有四个变量,分别是中国从1995-2009年人均工资收入,人均农林牧渔产值人均生产费用支出,人均转移性和财产性收入,因此为时间序列数据,最后一个即2009年的数据作为预测对比数据,收集的数据如下所示:⒋用OLS法估计模型回归结果,散点图分别如下:iYˆ=33.632+0.659X1+0.59X2-0.274X3+0.152X4d.f.=10,R2=0.997116,Se=(186.261)(0.1815(0.1245)(0.2037)(0.5699)t=(0.1805)(3.632)(4.741)(-1.347)(2.674)三、模型的检验及结果的解释、评价⒉拟合优度检验及统计检验R2=0.997,可以看到模型的拟合优度非常高,说明农民人均纯收入与上述四个解释变量之间总体线性关系显著。模型总体性检验(F检验):给定显著水平=0.05,查自由度为(4,10)的F分布表,得F(4,10)=3.48,可见该模型的F值远大于临界值,因此该回归方程很明显是显著的。但由于X3系数不显著且符号为负,与经济意义不符,因此我们认为解释变量之间存在多重共线性。变量的显著性检验(t检验):给定显著水平=0.05,查自由度为10的t分布表,得t2/10=1.812,大于该临界值的的显著变量为x1,x2,x4;x3解释变量未通过检验,说明x3与被解释变量之间不存在显著的线性相关关系。⒊多重共线性的检验⑴相关系数检验法上图是Eviews输出所有变量的相关系数矩阵,可发现Y与所有解释变量都是正相关的关系,所以进一步确定了上面的回归存在共线性问题。另外,我们发现X1和X2的相关系数很高,两变量很可能存在共线性。⑵多个解释变量的相关性检验由上面的分析可知,X1和X2有很高的相关性,那么我们这里就用X1做被解释变量,X2和X3做解释变量,可得回归模型如下:Xˆ1=-757.251+0.477X2+0.2454X3t=(-4.373)(3.662)(0.744)R2=0.9675,R2=0.9621,F=178.78,DW=1.19。可以看到,回归模型的拟合优度非常高,F值也远大于临界值。如果将显著水平扩大到=10%的话,X2系数显著,X3系数不显著。因此x1,x2存在共线性。四、模型的建立这里我们用逐步回归法得到农民人均纯收入模型。⒈分别用四个解释变量对Y进行回归,回归结果分别如下:可以看出,Y与2x拟合优度R2最大,因此将这个方程作为基本方程,然后往里加入其他变量。⒉引入第二个变量引入变量1x后,t值3.17临界值3.18,其系数通不过显著性检验。引入变量3x后,t值-0.22444临界值3.18,其系数通不过显著性检验。引入变量4x后,t值2.715临界值3.18,其系数通不过显著性检验。综上所述,本次模型只引入变量2x,其最终输出结果如下:模型的最终结果为Y=-745.76+1.0692X(-7.644)(34.22)R2=0.989,R2=0.988,F=1171.031,DW=1.4611一.异方差检验(怀特检验)n*R2=1.935205.0(2)=5.991,不存在异方差。六、自相关检验及修正LM=n*R2=0.021205.0(1)=3.841,模型不存在一阶自相关。