第9章异方差:如果误差方差不是常数会有什么结果第9章2古典线性回归模型(CLRM)的基本假定中有一条是:随机扰动项是同方差的。如果随机扰动项ui随着i的不同而不同,我们称随机扰动项具有异方差性。本章主要讨论的是以下问题:(1)异方差有什么性质?(2)异方差的后果是什么?(3)如何检验异方差的存在与否?(4)异方差有那些补救措施?第9章39.1异方差的性质9.2异方差的后果9.3异方差的诊断9.4异方差的补救措施9.5White异方差校正后的标准误和t统计量9.6若干异方差实例9.7小结第9章49.1异方差的性质XY储蓄0X0Y储蓄(a)同方差(b)异方差个人可支配收入个人可支配收入异方差:E(ui2)=i2返回首页第9章5例9.1放松管制后纽约股票交易所(NYSE)的经纪人佣金1975年四五月间,债券交易委员会废除了对于纽约股票交易所股票交易固定佣金率的规定,允许股票经纪人在竞争的基础上索取佣金。表9-1给出了从1975年4月到1978年12月间经纪人对机构投资者索要的平均每股佣金的季度数据。表9-1中X1—佣金率,美分/股(0至199股)X2—佣金率,美分/股(200至999股)X3—佣金率,美分/股(1000至9999股)X4—佣金率,美分/股(10000股以上)第9章6表9-1:纽约股票交易所佣金率趋势(单位:美分/股)月份年度X1X2X3X44月197559.645.727.615.06月54.536.821.312.19月51.734.520.411.512月48.931.918.910.43月197650.333.819.010.86月50.033.419.510.99月46.731.118.410.212月47.031.217.610.03月197744.328.816.09.86月43.728.115.59.79月40.426.114.59.112月40.425.414.08.93月197840.225.013.98.16月43.127.014.48.59月42.526.914.48.712月40.724.513.77.8平均值46.50030.63817.44410.094标准差5.6775.5023.7231.783方差32.22330.26813.8643.181最小值40.224.513.77.8最大值59.645.727.615.0第9章7表9-1的数据有两个特征1.放松管制以来,佣金率有下降的趋势2.四类佣金率的均值、方差存在显著差异(见表9-1和下图)05101520253035404550556012345678910111213141516X1X2X3X4佣金率第9章8四类佣金率的方差有显著差异,也就是说,随着股票交易量的增大,佣金率的方差也随之变化,这就是异方差。如果我们想建立一个回归模型来解释佣金率对股票交易数量(和其它变量)的函数,那么与高交易量客户相关的误差项方差将会低于与低交易量客户相关的误差项方差。这对我们建立的回归模型是否有影响、有怎样的影响?该怎样修正?下面来看例9.2。第9章9例9.2523个工人的工资等数据表9-2(见Excel文件)给出了一个纯截面数据的例子。表中收集了523个工人的工资、受教育年限和工龄等数据。考虑以下模型:iiiiuExperBEduBBWage321第9章10Eviews软件回归结果如下:DependentVariable:WAGEMethod:LeastSquaresSample:1523Includedobservations:523VariableCoefficientStd.Errort-StatisticProb.C-4.5244721.239348-3.6506870.0003EDUC0.9130180.08219011.108680.0000EXPER0.0968100.0177195.4635130.0000R-squared0.194953Meandependentvar9.118623AdjustedR-squared0.191856S.D.dependentvar5.143200S.E.ofregression4.623573Akaikeinfocriterion5.905932Sumsquaredresid11116.26Schwarzcriterion5.930366Loglikelihood-1541.401F-statistic62.96235Durbin-Watsonstat1.867684Prob(F-statistic)0.000000(9-3)例9-3第9章11图9-3回归方程(9-3)的残差平方第9章12图9-4第9章139.2异方差的后果1.OLS估计量仍是线性无偏的,但不再具有有效性,即不再具有最小方差性。2.残差方差不再是真实的无偏估计量3.根据常用估计OLS估计量方差的公式得到的方差通常是有偏的。4.T检验和F检验失效回到例9.2中得到的回归方程(9-3),由于异方差的存在,该方程的t检验失效。返回首页22ˆ/()ienk2第9章14我们来简单看一下为什么会产生这样的后果。运用普通最小二乘法的原理是要使残差平方和最小,如果在异方差情况下仍然使用普通最小二乘法,每一个ei2都有同样的权重,无论它是来自于一个较大方差的总体还是来自于一个较小方差的总体。这样做是不合适的。我们应该给那些取自较小方差总体的观察值以更大的权重,而给那些取自较大方差总体的观察值以较小的权重,这能够使我们更为精确地估计总体回归函数。这就是加权最小二乘法(weightedleastsquares)。第9章15图9-5第9章169.3异方差的诊断:如何知道存在异方差问题对具体问题异方差的检验并非易事,因为我们仅仅知道一个样本,很难知道总体的情况,是否是异方差便不易确定。直接计算得到方差不太可能,但我们可以借助于一些检测工具来检验异方差是否存在。检验方法有(1)根据问题的性质(2)残差的图形检验(3)帕克检验(Parktest)(4)Glejser检验(Glejsertest)(5)White检验(6)异方差的其它检验方法返回首页第9章179.3.1根据问题的性质所考察问题的性质往往提供了是否存在异方差的信息。在涉及不均匀单位的横截面数据中,常存在异方差。在例9.2中便是如此。我们可以根据问题的性质定性地分析是否存在异方差问题。这是常用方法之一。第9章189.3.2残差的图形检验对回归得到的残差作图进行分析是常用的另一种异方差的检验方法。为观察异方差的存在与否,我们常常使用的残差图有下列几种:1.残差ei对X的散点图;2.残差ei对每一个解释变量的散点图;3.残差ei对应变量的估计值的散点图;4.残差平方ei2对X的散点图;5.残差平方ei2对每一个解释变量的散点图;6.残差平方ei2对应变量的估计值的散点图;第9章19如果图形中没有可观察到的系统模式,表明数据中可能不存在异方差,否则表明数据中很可能存在异方差。第9章200Xe2a)0Xe2b)0Xe2e)0Xe2d)0Xe2c)..........…...............................................................................第9章21回到例9.2,现在我们做ei2对X的散点图。图9-7与(9.3)式工资的估计值2ie第9章229.3.3帕克检验(Parktest)如果存在异方差,异方差中的方差可能与一个或多个解释变量系统相关。为此,我们可作i2对一个或多个解释变量的回归。例如在双变量模型中,可运行下面的回归方程:lni2=B1+B2lnXi+vi(9-4)其中vi是误差项。这就是帕克检验。由于方差i2是未知的,帕克建议用ei来代替i,运行如下回归方程:lnei2=B1+B2lnXi+vi(9-5)ei2可从原始的回归方程中获得,比如模型(9-3)。第9章23帕克检验的步骤:(1)作普通最小二乘回归,不考虑异方差问题。(2)从原始回归方程中得残差ei,求其平方,再取对数。(3)利用原始模型中的每个解释变量作形如(9-5)的回归。或作ei2对Y的估计值的回归。(4)检验零假设B2=0,也即不存在异方差。(5)如果拒绝零假设,则意味着可能存在异方差,但接受零假设并不意味着一定不存在异方差。第9章24在5%的显著水平下,估计的斜率系数是统计显著的。帕克检验的缺陷:在上述回归方程中,误差项vi本身可能存在异方差。所以,判断回归方程中是否存在异方差,可能需要更多的检验。另外:帕克所选择的特殊函数形式只是建议性的,其它的函数形式也许会使我们得到不同的结论。例9.3工资回归与帕克检验我们来解释工资回归方程(9-3)。把从这个回归方程中得到的残差提取出来,估计得到如下结果(lsss1^2cwagef):=-10.35965+3.4672ˆiese=(11.795)(1.255)(9-6)t=(-0.8783)(2.762)r2=0.0.0144p=(0.3802)(0.0059)iyˆ第9章25取对数后Eviews软件的回归结果如下:lslog(ss1^2)clog(wagef)DependentVariable:LOG(ss1^2)Method:LeastSquaresSample:1523Includedobservations:522VariableCoefficientStd.Errort-StatisticProb.C-3.3509780.809702-4.1385330.0000LOG(WAGEF)2.2319660.3686666.0541620.0000R-squared0.211964Meandependentvar1.518696AdjustedR-squared0.162712S.D.dependentvar2.194627S.E.ofregression2.024705Akaikeinfocriterion4.347534Sumsquaredresid65.59091Schwarzcriterion4.363847Loglikelihood-37.17848F-statistic36.65287Durbin-Watsonstat1.661072Prob(F-statistic)0.000000第9章269.3.4Glejser检验(Glejsertest)Glejser检验实质上与帕克检验很相似。Glejser建议作ei的绝对值对X的回归。Glejser建议的一些函数形式如下:(9-8)(9-9)iiivXBBe21||iiivXBBe21||(9-7)iiivXBBe1||21第9章27每种情形的零假设都是不存在异方差,零假设为B2=0。如果零假设被拒绝,则表明可能存在异方差。第9章28例9.4工资回归与Glejser检验根据回归方程(9-3)的残差估计前面模型,得到的结果如下:133.0)6561.2)(6923.10(16224.123879.4|ˆ|0489.0)1764.5)(5068.2(8263.11905.3|ˆ|0557.0)5483.5)(4739.0(2829.03208.0|ˆ|222rtEducertEducertEduceiiiiii(9-10)(9-11)(9-12)第9章29Eviews软件回归:分别用在编辑框用以下命令即可:lsabs(ss1)cEduclsabs(ss1)cEduc^0.5lsabs(ss1)c1/Educ结果见Eviews文件。第9章30对回归方程(9-3)的残差估计以上模型,对斜率系数进行显著性检验,从而判断是否存在异方差。可以看出三个方程的检验结果都是一样的,即拒绝零假设,斜率系数是统计显著的,存在异方差。对Glejser检验要注意的问题与帕克检验一样,上述方程中的误差项本身可能就存在异方差和系列相关问题,但对于大样