7©陈强,《高级计量经济学及Stata应用》课件,第二版,2014年,高等教育出版社。第7章异方差与GLS7.1异方差的后果“异方差”(heteroskedasticity)是违背球型扰动项假设的一种情形,即Var(|)iX依赖于i,不是常数。在异方差的情况下:(1)OLS估计量依然无偏、一致且渐近正态,因为在证明这些性质时并未用到“同方差”的假定。2(2)OLS估计量方差Var(|)bX的表达式不再是21()XX,因为2Var(|)εXI。因此,通常的t检验、F检验也失效了。(3)高斯-马尔可夫定理不再成立,OLS不再是BLUE。在异方差的情况下,GLS才是BLUE。为何OLS不再是BLUE?假设Var(|)iX是某解释变量ix的增函数,参见图7.1。3图7.1异方差的一种情形GLS及其特例“加权最小二乘法”(WeightedLeastSquare,简记WLS),通过对不同数据包含信息量的不同进行加权以提高效率。47.2异方差的例子(1)消费函数:iiiCY其中,C为消费,Y为收入。富人的消费计划较有弹性,而穷人的消费多为必需品。富人的消费支出难测量,包含较多测量误差。(2)企业的投资、销售收入与利润:大型企业的商业活动以亿元计,而小型企业以万元计,扰动项规模不同。(3)组间异方差:样本包含两组(类)数据,第一组为自我雇佣者(企业主、个体户)的收入,第二组为打工族的收入,前者的收入波动比后者大。5(4)组平均数:如果数据为组平均数,则大组平均数的方差要比小组平均数的方差小。比如,全国各省的人均GDP,人口多的省份其方差较小,方差与人口数成反比。(5)时间序列数据中也可能出现条件异方差,比如第22章的ARCH模型。7.3异方差的检验1.看残差图(residualplot)看“残差ie与拟合值ˆiy的散点图”(residual-versus-fittedplot),或“残差ie与某个解释变量ikx的散点图”(residual-versus-predictorplot)。6-1012Residuals-2024Fittedvalues2.怀特检验(Whitetest)在条件同方差下,稳健标准误还原为普通标准误,二者的差别7可用来度量条件异方差。怀特检验正是基于这一思想。在同方差的原假设220:E(|)iHX下,稳健协方差矩阵与普通协方差矩阵之差收敛到一个零矩阵:22222111111ˆ()nnnpXXiiiiiiiiKKiiisesesnnn0SSxxxxxx实际操作上,进行辅助回归:OLS2ie常数i并检验iψ中所有变量的系数γ均为0。8如果2R很低,意味着2ie无法由解释变量及其平方项与交叉项来解释,故倾向于接受同方差的原假设。可以证明:22()dnRm如果2nR很大(超过临界值),则拒绝原假设0H。在大样本中,2nR与检验整个方程显著性的F统计量渐近等价。对于回归方程122iiKiKiyxx,检验原假设02:0KH,则F统计量:922/(1)~(1,)(1)/()RKFFKnKRnK在大样本下,F分布与2分布等价(第5章附录,见下),即222()(1)(1)(1)dnKRKFKR在原假设成立的情况下,当n时,()nKn,2(1)1R,故2(1)KFnR,故F检验与2nR检验在大样本下等价。怀特检验的优点是,可以检验任何形式的异方差;缺点是,如果0H被拒绝,并不提供有关异方差具体形式的信息。10A5.3F分布与2分布在大样本下是等价的命题假设~(,)FFmnK分布,则当n时,2()dmFm。证明:因为~(,)FFmnK,故可设22()()()mmFnKnK。根据2分布的性质,2E()nKnK,而2Var()2()nKnK。故F统计量分母的期望值为:2E()()1nKnK11F统计量分母的方差为:2Var()()nKnK22()20()nKnKnK(当n时)故分母依均方收敛于1。因此,分母依概率收敛于1,即2()()1pnKnK。所以,2()dFmm。故2()dmFm。123.BP检验(BreuschandPagan,1979)假设回归模型为122iiKiKiyxx,检验以下原假设:2202:E(|,,)iKHxx如果0H不成立,则条件方差22E(|,,)iKxx是2(,,)Kxx的函数,称为“条件方差函数”(conditionalvariancefunction)。BP检验假设此条件方差函数为线性函数:2122iiKiKixxu13原假设简化为02:0KH由于i不可观测,故使用2ie进行辅助回归:2122iiKiKiexxerror使用2nR统计量:22(1)dnRKBP检验与怀特检验的区别在于,后者还包括平方项与交叉项。14BP检验的优点在于其建设性,可帮助确认异方差的具体形式。7.4异方差的处理1.使用“OLS+稳健标准误”一种处理方法是,仍进行OLS回归,但使用稳健标准误。这是最简单,也是目前通用的方法。只要样本容量较大,即使在异方差的情况下,若使用稳健标准误,则所有参数估计、假设检验均可照常进行。15但还可能存在比OLS更有效的方法,比如GLS。2.广义最小二乘法(GLS)假设22Var(|)()nεXVXI,其中()VX为对称正定矩阵且已知,可能依赖于X。GLS的基本思想是,通过变量转换,使得转换后的模型满足球型扰动项的假定。命题对于对称正定矩阵nnV,存在非退化矩阵nnC,使得1VCC。16在一维情况下,“V正定”即要求V为正数,故1V也是正数,可分解为11VV;如果V为负数,则无法进行此分解。矩阵C不唯一,但不影响GLS的最终结果。将原回归模型yX两边同时左乘矩阵C:CyCXC定义变量转换:,,yCyXCXC17可将模型写为y=X变换后的模型仍满足严格外生性:E(|)E(|)E(|)E(|)0XCCXCXCX球型扰动项的假定也得到满足:2211212112Var(|)E(|)E(|)E(|)()()()nXXCCXCXCCVCCVCCCCCCCCCI故高斯-马尔可夫定理成立。18对变换后的模型使用OLS即得到GLS估计量:11GLS111ˆ()()()()()()1XXXyCXCXCXCyXCCXXCCyXVXXVy虽然C不唯一,但GLSˆ唯一,因为GLSˆ不依赖于C。由于高斯-马尔可夫定理成立,故GLSˆ是BLUE,比OLS更有效。但前提是必须知道协方差矩阵V。193.加权最小二乘法(WLS)假设仅存在异方差,无自相关,()VX为对角矩阵。方差小的数据提供的信息量大。WLS根据信息量大小进行加权。假定22E(|)Var(|)()iiiiivxxX,即112210101,001nnvvvvvvVV20由于1VCC,可知1210101nvvvCC1111222210101nnnnvyvyyvyvyvyvyCy2111112122110......1...01KKnnKnvxxxxvxxvXCX11111212221.........KKnnnKnxvxvxvxvxvxv22故权重为1iv(标准差的倒数)。对于第i个观测值,回归方程为1212iiiiKiKiiiiiyxxxvvvvv新扰动项为iiv,可将WLS视为最小化“加权的残差平方和”:2211minSSRnniiiiiieevv从这个角度来看,权重为1iv,Stata也是这样约定的。234.可行广义最小二乘法(FeasibleGLS,简记FGLS)必须先用样本数据估计()VX,然后才能使用GLS,称为FGLS或“可行加权最小二乘法”(FeasibleWLS,简记FWLS),即11FGLSˆˆˆ()1XVXXVy其中,ˆV是V的一致估计。()VX包含很多参数。实践中,常考虑只有异方差,或只有一阶自相关的情形(参见第8章)。以FWLS为例。在作BP检验时,通过辅助回归242122iiKiKiexxerror就可获得2i的估计值2ˆi。为保证2ˆi为正,假设辅助回归为指数函数的形式:22122exp()iiKiKiexxv其中,iv为乘积形式的扰动项。取对数后可得22122ln(ln)lniiKiKiexxv得到对2lnie的预测值,记为2ˆlni,进而得到拟合值2ˆln2ˆiie,然后以2ˆ1i为权重进行WLS估计。255.究竟使用“OLS+稳健标准误”还是FWLS理论上,GLS是BLUE,但FGLS既非线性估计,也不是无偏估计,无资格参加BLUE的评选。根据方程(7.22),11FGLSˆˆˆ()1XVXXVy,而ˆV是数据(,)yX的非线性函数,故FGLSˆ是y的非线性函数,一般来说是有偏的。FWLS的优点主要体现在大样本理论中。如果ˆV是V的一致估计,则FWLS一致,且在大样本下比OLS更有效。FWLS的缺点是必须估计条件方差函数Var(|)iix,而通常不知道条件方差函数的具体形式。如果该函数的形式设定不正确,则26根据FWLS计算的标准误可能失效,导致不正确的统计推断。使用“OLS+稳健标准误”的好处是,对回归系数及标准误的估计都一致,不需要知道条件方差函数的形式。Stata操作十分简单,只要在命令reg之后加选择项“robust”即可。总之,“OLS+稳健标准误”更为稳健,而FWLS更有效。必须在稳健性与有效性之间做选择。由于“病情”通常难以诊断,故特效药也可能失效或起反作用。如果对V的估计不准,则FGLS的性能可能还不如OLS。StockandWatson(2011)推荐,大多数情况下应使用“OLS+稳健标准误”。