1异方差案例分析中国农村居民人均消费支出主要由人均纯收入来决定。农村人均纯收入除从事农业经营的收入外,还包括从事其他产业的经营性收入以及工资性收入、财产收入和转移支付收入等。为了考察从事农业经营的收入和其他收入对中国农村居民消费支出增长的影响,可使用如下双对数模型:1122lnlnlnYXX其中,Y表示农村家庭人均消费支出,X1表示从事农业经营的收入,X2表示其他收入。下表列出了中国2001年各地区农村居民家庭人均纯收入及消费支出的相关数据。中国2001年各地区农村居民家庭人均纯收入与消费支出单位:元地区人均消费支出Y从事农业经营收入X1其他收入X2地区人均消费支出Y从事农业经营收入X1其他收入X2北京3552.1579.14446.4湖北1649.213521000.1天津2050.91314.62633.1湖南1990.3908.21391.3河北1429.8928.81674.8广东2703.361242.92526.9山西1221.6609.81346.2广西1550.621068.8875.6内蒙古1554.61492.8480.5海南1357.431386.7839.8辽宁1786.31254.31303.6重庆1475.16883.21088吉林1661.71634.6547.6四川1497.52919.31067.7黑龙江1604.51684.1596.2贵州1098.39764647.8上海4753.2652.55218.4云南1336.25889.4644.3江苏2374.71177.62607.2西藏1123.71589.6814.4浙江3479.2985.83596.6陕西1331.03614.88762安徽1412.41013.11006.9甘肃1127.37621.6887福建2503.110532327.7青海1330.45803.8753.5江西17201027.81203.8宁夏1388.79859.6963.4山东190512931511.6新疆1350.231300.1410.3河南1375.61083.81014.1资料来源:《中国农村住户调查年鉴》(2002)、《中国统计年鉴》(2002)。我们不妨假设该线性回归模型满足基本假定,采用OLS估计法,估计结果如下:12ˆln1.6550.3166ln0.5084lnYXX(1.87)(3.02)(10.04)R2=0.7831R2=0.7676D.W.=1.89F=50.53RSS=0.8232图1估计结果显示,其他收入而不是从事农业经营的收入的增长,对农户消费支出的增长更具有刺激作用。下面对该模型进行异方差性检验。31.图示法。首先做出Y与X1、X2的散点图,如下:图2可见1X基本在其均值附近上下波动,而2X散点存在较为明显的增大趋势。再做残差平方项2ˆie与1lnX、2lnX的散点图:4图3图4可见图1中离群点相对较少而图2呈现较为明显的单调递增的5异方差性。故初步判断异方差性主要是2X引起的。2.G-Q检验根据上述分析,首先将原始数据按X2升序排序,去掉中间7个数据,得到两个容量为12的子样本,记数据较小的样本为子样本1,数据较大的为子样本2。对子样本1进行OLS回归,结果如下:图5得到子样本1的残差平方和RSS1=0.064806;再对子样本2进行OLS回归,结果如下:6图6得到子样本2的残差平方和RSS2=0.279145。计算F统计量:21RSS0.279145F4.3082RSS0.064806在5%的显著水平下,F0.05(9,9)=3.18F,故应拒绝同方差假设,表明该总体随机干扰项存在单调递增的异方差。3.white检验记原模型残差平方项为2ˆe,将其与X1,X2及其平方项与交叉项做辅助回归,结果如下:7图7由各参数的t值可见各项都不是很显著,而且可决系数值也比较小,但white统计量nR2=310.464=14.38该值大于5%显著水平下自由度为5的2分布相应的临界值20.05=11.07,因此应拒绝同方差假设。去掉交叉项后的辅助回归结果如下:8图8显然,X2和X2的平方项的参数的t检验是显著的,并且white统计量nR2=310.437376=11.58656大于5%显著水平下自由度为5的2分布相应的临界值20.05=11.07,因此应拒绝同方差假设。4.异方差的修正——加权最小二乘法我们以1/X2为权重进行异方差的修正。加权后的估计结果如下:9图9可见修正后各解释变量的显著性总体相对提高。其white检验结果如下:10图10此时white统计量nR2=310.023325=0.723小于5%显著水平下自由度为5的2分布相应的临界值20.05=11.07,故此时满足同方差假设。故修正后的估计结果为:12ˆln2.3250.441ln0.284lnYXX