第八章异方差性2019.1.12袁昕计量经济学导论第四版伍德里奇一、异方差----基本概念•定义:不可观测因素的方差随总体的不同部分(由不同解释变量值所决定)而变化,即:2iiiVarux=()•异方差对OLS影响:•通常的t、F检验以及置信区间不确当•OLS不是BLUE,也不再是渐进有效的•不导致估计系数出现偏误或产生不一致•拟合优度指标的解释也不受影响二、OLS估计后的异方差-稳健推断•适用情况:异方差形式未知1.出现异方差时的标准误和t统计量j1n22iii=12xjn22ijii=1ijijj2jjjˆˆVarVarˆx-xuSSTˆVarˆˆruˆˆˆVar=rxiSSRSSRˆ--(),对任何形式的异方差(包括同方差),()的一个确当估计为:(),在一般多元回归模型中,()的一个确当估计为:(),表示将对其他自变量做回归所得到的第个残差,则是这个回归的残差平方和。该式子的平方根叫的异方差稳健标准误。相应的有异方差稳t-t=健统计量:估计值假设值,因此计算标准误是关键。标准误例8.1P253用stata求异方差-稳健的t统计量:WAGE•gensingle=(~married)•genmale=(~female)•genmarrmale=male*married•genmarrfem=female*married•gensingfem=single*female•reglwagemarrmalemarrfemsingfemeducexperexpersqtenuretenursq,robust异方差-稳健t估计OLS估计:reglwagemarrmalemarrfemsingfemeducexperexpersqtenuretenursq异方差-稳健的t统计量推断的适用性:异方差-稳健t检验统计量只有在样本容量越来越大时才能使用。小样本时可能不服从t分布异方差-稳健的F统计量例8.2P255GPA3.DTA例8.2P255GPA3.DTA•1.异方差-稳健回归得R-square=0.4006(注意是春季学期,所以有条件项)2.联合显著性检验—约束方程回归求R-squared=0.3983普通OLS回归普通OLS回归的约束方程回归•计算F统计量:异方差-稳健的LM检验例8.3P256CRIME1.DTA例8.3P256CRIME1.DTATurningpointforavgsendi_b[avgsen]/(2*_b[avgsensq])-17.2768621.ROBUST回归受约束方程robust回归并预测残差rur受约束变量avgsen对其他没有排除的自变量回归,保留残差r1注意回归不包含原来的y受约束变量avgsensq对其他没有排除的自变量回归,保留残差r2对观测值求r×rur无截距语句与robust不能同时使用?求F统计量的p值用1对每个r×rur回归,得到LM统计量=n-SSR1,SSR1就是该步骤的残差平方和异方差-稳健的LM=4.00,查表,在自由度为2的分布中,10%,X=4.61;5%,X=5.99;1%,X=9.21,不能拒绝H0.22.同理求普通LMregnarr86pcnvptime86qemp86inc86blackhispanpredicturr,residregavgsenpcnvptime86qemp86inc86blackhispanpredictur11,residregavgsensqpcnvptime86qemp86inc86blackhispanpredictur22,residgenurr11=urr*ur11genurr22=urr*ur22genio=1regiourr11urr22?•predictubar1,resid•quiteregavgsenpcnvptime86qemp86inc86blackhispan•predictr1,r•quiteregavgsensqpcnvptime86qemp86inc86blackhispan•predictr2,r•quitegenur1=ubar1*r1•quitegenur2=ubar1*r2•geniota=1•regiotaur1ur2,noconstant•scalarhetlm=e(N)-e(rss)•scalarpval=chi2tail(2,hetlm)•display_nRobustLMstatistic:%6.3fhetlm/*•*/_nUnderH0,distribChi2(2),p-value:%5.3fpval•RobustLMstatistic:3.997•UnderH0,distribChi2(2),p-value:0.136•predictubar2,residregubar2pcnvavgsenavgsensqptime86qemp86inc86blackhispan•scalarlm1=e(N)*e(r2)display_nLMstatistic:%6.3flm1/*•通常的LM=3.54•异方差—稳健LM=4.00•仍然不能拒绝H0•问题:语句的意思,有没有直接计算LM的命令(robustLMstatistic已有,则前面的计算?)三、异方差的检验•原理:22222011012ˆ2ˆ2ˆ2ˆu=+x...1:..0/(1)/(1)1kkkuuuuxvHRkFRnkLMnRR……()为方程()的拟合优度方法1:异方差的BPagan检验STATA准备:BPagan检验不是标准语句,需要下载,操作如下:输入命令:.finditbpagan.searchbpagan,all得到词条:bpaganfromfmbc.edu/RePEc/bocode/b点击后按install然后helpbpagan,可以看到:'BPAGAN':moduletoperformBreusch-Pagantestforheteroskedasticity/方法2:异方差的怀特检验•原理:•步骤:2201212ˆˆˆu=+y+y+H0==0误差项:异方差的BPagan检验和white检验例8.4,8.5P259HPRICE1.DTA1.普通回归2.异方差检验?whitetst,fittedoptionfittednotallowed•P值都不显著,存在异方差3.因变量采用对数形式回归及检验:消除异方差问题:两个检验出现矛盾的结论?•注意:进行异方差检验时应该首先检验模型的误设问题,否则异方差检验可能都是显著的四、加权最小二乘WLS估计•若已知异方差的形式,采用WLS比OLS更有效,且能得到确当的t、F统计量。情况1:除一个常数倍数外异方差是已知的:011k2iiiii2iii*ixy=+x...+x1Varux=hxhxhxhxu/hx0Varux=h1hGLStFku令表示……()中所有解释变量,并假定:()(),其中,()是解释变量的某种函数,并决定着异方差,()0由于是的函数,所以以为条件的期望值为,并且(),所以可以将方程()两边同时除以经过变换以后得到的估计量即为广义最小二乘估计量,此时得到的标准误、、统计量是确当WLSGLSWLSOLS的。但拟合优度对原估计无意义。上述方法即为,纠正异方差的估计量为估计量。其思想是对误差方差越大的观察值赋予越小的权数,则对每个值权数相等。在现代软件包中不需手动变形,但要输入加权函数。WLS原理WLS应用:例8.6P265401KSUBS.DTA(与答案例子不同)1.OLS回归,得到第一列结果。(注意,只用单身个人数据iffsize==1)2.WLS回归,得第二列结果WLS语句:[aw=1/inc]3.genagenew=(age-25)^2注意数据集中对age的解释有误。控制新变量的OLS回归,得第三列结果(?系数及t与书上略有差异)4.控制新变量的WLS回归,得第四列结果(?系数及t与书上略有差异)问题:什么时候权数是除以h,什么时候是除以根号h?取决于是否先对变量进行变换。不变换,则无根号WLS权数的选择•多数情况中,对权数的选择有一定随机性•当研究问题没有个人层次数据而只有样本小组的均值数据时,如果个体方程同方差,则可以用小组人数(如企业规模,城市人口数)作为权数,以保证较大的子样本得到较高权数•但由于总体样本平均误差的形式不确定,在利用人均数据估计模型时研究倾向于简单使用OLS并计算稳健的标准误和统计量•另一种方法是以组规模进行加权,但在WLS估计中报告异方差-稳健统计量。情况2.异方差形式未知,需估计异方差函数:可行GLS•原理:如果异方差形式未知,则模型化函数h,并利用数据来估计这个模型中的未知参数,在GLS变换中用每个hi的估计值取代hi得到原方程的可行的GLS(FGLS)估计量。因为使用同样的数据进行估计,所以FGLS不是无偏的,但是一致的,且比OLS渐进有效。0112011iiii011hx=exp+x+ˆ+x+,gˆˆh=expgˆ1/hWLSy=+x..kkkkkkex()(...+x)log(u)=...+x该方程的拟合值记为()以为权数用估计•模型化函数h的一种特殊方法:线性模型不能保证预测值都为正,但进行WLS变换要求估计的方差必须为正估计hi的另一个方法22ˆˆˆloguyy将步骤三中的回归换为:()对,的回归。FGLS应用:例8.7P270SMOKE.DTA1.普通OLS回归价格、收入都不显著1.收入对吸烟量的影响display_b[lincome]*10/1000.088026822.年龄与吸烟量的二次关系转折点display_b[age]/2/_b[agesq]-42.7081163.怀特检验whitetstWhite‘sgeneralteststatistic:52.17226Chi-sq(25)P-value=.00114.whitetst,fittedWhite’sspecialteststatistic:26.57258Chi-sq(2)P-value=1.7e-065.Bpagan检验bpagancigslincomelcigpriceducageagesqrestaurnBreusch-PaganLMstatistic:1021.143Chi-sq(7)P-value=3.e-216因此有强证据证明存在异方差2.计算残差u并将残差平方的对数与自变量回归注:答案少了一步predictub,resid3.求上述回归的拟合值并用该拟合值取指数后的倒数为权重进行WLSxbcalculatelinearprediction收入显著,价格不显著但系数变化大五、再议线性概率模型•当因变量y是二值变量,除非所有斜率参数都为零,否则就一定包含异方差。•方法1:继续使用OLS,同时也要计算检验统计量的稳健标准误•例8.8P275MROZ.DTA例8.8P275MROZ.DTA1,普通OLS2.Robust回归在本例中差异不大方法2:用加权最小二乘法估计例8.9P277GPA1.DTA步骤2的解释:即当hi的拟合值为负,不能作为权数,因此,iiiiiiiˆˆˆh=y1-yLPMˆˆˆˆy0,y=0.01y1,y=0.99对于(),(异方差的估计形式)当取,当取例8.9P277GPA1.DTAgenparcoll=(x1Ix2)代表x1与x2至少有一个为11.普通OLS回归2.求稳健标准误,判断异方差存在与否并无明显差异,异方差证据不强烈2.求出上述回归的拟合值并构造h进行WLS谢谢你的阅读知识就是财富丰富你的人生