1实验六多重共线性【实验目的】掌握多重共线性的检验及处理方法【实验内容】建立并检验我国钢材产量预测模型【实验步骤】【例1】表1是1978-1997年我国钢材产量(万吨)、生铁产量(万吨)、发电量(亿千瓦时)、固定资产投资(亿元)、国内生产总值(亿元)、铁路运输量(万吨)的统计资料。表1我国钢材产量及其它相关经济变量统计资料年份钢材产量Y生铁产量X1发电量X2固定资产投资X3国内生产总值X4铁路运输量X51978220834792566668.7232641101191979249736732820699.3640381118931980271638023006746.945181112791981267034173093638.2148621076731982292035513277805.952951134951983307237383514885.26593511878419843372400137701052.43717112407419853693438441071523.51896413070919864058506444951795.321020213563519874386550349732101.691196314065319884689570454522554.861492814494819894859582058482340.5216909151489199051536238621225341854815068119915638676567753139.032161815289319926697758975394473.762663815762719937716895683956811.353463416266319948428974192819355.354675916309319958980105291007010702.975847816585519969338107231081312185.796788516880319979979115111135613838.9674463169734一、检验多重共线性⒈相关系数检验利用相关系数可以分析解释变量之间的两两相关情况。在Eviews软件中可以直接计算相关系数矩阵。本例中,在Eviews软件命令窗口中键入:CORX1X2X3X4X5或在包含所有解释变量的数组窗口中点击View\Correlations,其结果如图1所示。由相关系数矩阵可以看出,解释变量之间的相关系数均为0.93以上,即解释变量之间时高度相关的。2图1解释变量相关系数矩阵⒉辅助回归方程检验当解释变量多余两个且变量之间呈现出较复杂的相关关系时,可以通过建立辅助回归模型来检验多重共线性。本例中,在Eviews软件命令窗口中键入:LSX1CX2X3X4X5LSX2CX1X3X4X5LSX3CX1X2X4X5LSX4CX1X2X3X5LSX5CX1X2X3X4对应的回归结果如图2-6所示。图2图33图4图5图6上述每个回归方程的F检验值都非常显著,方程回归系数的T检验值表明:X1与X5、X2与X3、X3与X5、X4与X、X5与X1、X3、X4的T检验值较小,这些变量之间可能不相关或相关程度较小。二、利用逐步回归方法处理多重共线性⒈建立基本的一元回归方程根据相关系数和理论分析,钢材产量与生铁产量关联程度最大。所以,设建立的一元回归方程为:1XY4⒉逐步引入其它变量,确定最适合的多元回归方程(回归结果如表2所示)表2钢材产量预测模型逐步回归结果模型X1X2X3X4X5Y=f(X1)0.9214(56.807)0.99490.9941Y=f(X1,X2)0.4159(3.5394)0.4872(4.3234)0.99740.9970Y=f(X1,X3)0.959(14.185)0.0249(-0.5738)0.99500.9940Y=f(X1,X4)0.9414(13.025)-0.0025(-0.2846)0.99450.9938Y=f(X1,X5)0.8578(20.229)0.0084(-0.2846)0.99190.9910Y=f(X1,X2,X3)0.405(2.835)0.491(4.1225)0.0046(0.1424)0.99690.9974Y=f(X1,X2,X4)0.4433(3.4857)0.4911(4.2748)-0.0039(-0.6347)0.99690.9974Y=f(X1,X2,X5)0.4073(3.1797)0.5025(3.6357)-0.001(-0.2041)0.99690.9974所以,建立的多元回归模型为:Y=-287.68669+0.4159*X1+0.4872*X22R2R