•在教材P29-32和P64-65,分别对一元和多元线性回归模型提出了若干基本假设,只有在满足这些基本假设的情况下,应用普通最小二乘法才能得到无偏的、有效的参数估计量。•但是,在实际的计量经济学问题中,完全满足这些基本假设的情况并不多见。•如果违背了某一项基本假设,那么应用普通最小二乘法估计模型所得参数估计量就可能不具有某些优良特性,这就需要发展新的方法估计模型。•本章正是要讨论违背了某一项基本假设的问题及其估计方法。引言异方差性Heteroscedasticity一、异方差性的概念及类型二、异方差性的后果三、异方差性的检验四、异方差的修正五、案例1.什么是异方差?对于模型(i=1,2,…,n)同方差性假设为Vari()2(i=1,2,…,n)如果出现Varii()2(i=1,2,…,n)即对于不同的样本点i,随机误差项的方差不再是常数,则认为出现了异方差性。注意:对于每一个样本点i,随机误差项i都是随机变量,服从均值为0的正态分布;而方差i2衡量的是随机误差项围绕其均值0的分散程度。所以,所谓异方差性,是指这些服从正态分布的随机变量围绕其均值0的分散程度不同。一、异方差性的概念及类型iikkiiiXXXY22110异方差性示意图XY概率密度或者,也可以说,对于每一个样本点i,随机误差项的方差i2衡量的是被解释变量的观测值Yi围绕回归线E(Yi)=0+1Xi1+…+kXik的分散程度。而所谓异方差性,是指被解释变量观测值的分散程度随样本点的不同而不同。【庞皓P130】2.异方差的类型•同方差性假定是指,每个i围绕其0均值的方差并不随解释变量Xi的变化而变化,不论解释变量的观测值是大还是小,每个i的方差保持相同,即i2=常数(i=1,2,…,n)•在异方差的情况下,i2已不是常数,它随Xi的变化而变化,即i2=f(Xi)(i=1,2,…,n)•异方差一般可以归结为三种类型:(1)单调递增型:i2=f(Xi)随Xi的增大而增大;(2)单调递减型:i2=f(Xi)随Xi的增大而减小;(3)复杂型:i2=f(Xi)随Xi的变化呈复杂形式。3.实际经济问题中的异方差性在该模型中,i的同方差假定往往不符合实际情况。对高收入家庭来说,储蓄的差异较大;低收入家庭的储蓄则更有规律性(如为某一特定目的而储蓄),差异较小。因此,i的方差往往随Xi的增加而增加,呈单调递增型变化。例4.1.1:在截面资料下研究居民家庭的储蓄行为Yi=0+1Xi+iYi和Xi分别为第i个家庭的储蓄额和可支配收入。一般情况下:居民收入服从正态分布,处于中等收入组中的人数最多,处于两端收入组中的人数最少。而人数多的组平均数的误差小,人数少的组平均数的误差大。所以样本观测值的观测误差随着解释变量观测值的增大而先减后增。例4.1.2:以绝对收入假设为理论假设、以分组数据(将居民按照收入等距离分成n组,取组平均数为样本观测值)作样本建立居民消费函数:Ci=0+1Yi+i如果样本观测值的观测误差构成随机误差项的主要部分,那么对于不同的样本点,随机误差项的方差随着解释变量观测值的增大而先减后增(U形),出现了异方差性。例4.1.3:以某一行业的企业为样本建立企业生产函数模型Yi=Ai1Ki2Li3ei产出量为被解释变量,选择资本、劳动、技术等投入要素为解释变量,那么每个企业所处的外部环境对产出量的影响被包含在随机误差项中。由于每个企业所处的外部环境对产出量的影响程度不同,造成了随机误差项的异方差性。这时,随机误差项的方差并不随某一个解释变量观测值的变化而呈规律性变化,为复杂型的一种。规律•一般经验告诉人们:对于采用截面数据作样本的计量经济学问题,由于在不同样本点(即不同空间)上解释变量以外的其他因素的差异较大,所以往往存在异方差性。1.参数估计量非有效•当计量经济学模型出现异方差性时,其普通最小二乘法参数估计量仍然具有无偏性,但不具有有效性。而且,在大样本情况下,参数估计量仍然不具有渐近有效性。即同方差和无序列相关条件。因为在有效性证明(见教材P70-71)中利用了E()2IjiCovniVarjii,0),(,,2,1,)(2二、异方差性的后果2.变量的显著性检验失去意义在变量的显著性检验中,t统计量(j=0,1,2,…,k)包含有随机误差项共同的方差2。如果出现了异方差性,而仍按同方差时的公式计算t统计量,将使t统计量失真【偏大或偏小,见第三版P110补充说明】,从而使t检验失效【使某些原本显著的解释变量可能无法通过显著性检验,或者使某些原本不显著的解释变量可能通过显著性检验】。122)(ˆˆ)ˆ(ˆjjjjjjjjjjjXXcSet3.模型的预测失效0102ˆ)(100XXXXYYSE一方面,由于上述后果,使得模型不具有良好的统计性质;另一方面,在预测值的置信区间中也包含有随机误差项共同的方差2。所以,当模型出现异方差性时,Y预测区间的建立将发生困难,它的预测功能失效。其中1)ˆˆ(002002ˆ00ˆ0YYYYSEtYYSEtYP【书上这句话有点问题】1.检验方法的共同思路•既然异方差性就是相对于不同的解释变量观测值,随机误差项具有不同的方差,那么:检验异方差性,也就是检验随机误差项的方差与解释变量观测值之间的相关性及其相关的“形式”。•各种检验方法正是在这个共同思路下发展起来的。三、异方差性的检验(教材P111)问题在于:用什么来表示随机误差项的方差?首先采用OLS法估计模型,以求得随机误差项的估计量(注意,该估计量是不严格的),我们称之为“近似估计量”,用~ei表示。于是有一般的处理方法:VarEeiii()()~22即用2~ie来表示随机误差项的方差。lsiiiYYe0)ˆ(~2.图示检验法(1)用X-Y的散点图进行判断(李子奈P108)看是否存在明显的散点扩大、缩小或复杂型趋势(即不在一个固定的带型域中)。随机误差项的方差描述的是取值的离散程度。而由于被解释变量Y与随机误差项有相同的方差,所以利用Y与X之间的相关图形也可以粗略地看出的离散程度与X之间是否有相关关系。~ei2~ei2XX同方差递增异方差~ei2~ei2XX递减异方差复杂型异方差(2)用X—2~ie的散点图进行判断看是否形成一条斜率为零的直线。(教材P111)3.戈里瑟(Gleiser)检验与帕克(Park)检验•戈里瑟检验与帕克检验的思想:选择关于变量jX的不同的函数形式(如2)(jijiXXf或ivjijieXXf2)(),对方程进行估计并进行显著性检验;如果存在某一种函数形式,使得方程显著成立,则说明原模型存在异方差性。以|e~|或~ei2为被解释变量,以原模型的某一解释变量jX为解释变量,建立如下方程:ijiiXfe)(|~|i=1,2,…,n(Gleiser)或ijiiXfe)(~2i=1,2,…,n(Park)由于f(Xj)的具体形式未知,因此需要选择各种形式进行试验。4.戈德菲尔德-匡特(Goldfeld-Quandt)检验G-Q检验以F检验为基础,仅适用于样本容量较大、异方差为单调递增或单调递减的情况。G-Q检验的思想:先按某一被认为有可能引起异方差的解释变量对样本排序,再将排序后的样本一分为二,对子样本①和子样本②分别进行OLS回归,然后利用两个子样本的残差平方和之比构造F统计量进行异方差检验。G-Q检验的步骤:①将n对样本观察值(Xi1,Xi2,…,Xik,Yi)按某一被认为有可能引起异方差的解释变量观察值Xij的大小排队。②将序列中间的c=n/4个观察值除去,并将剩下的观察值划分为较小与较大的容量相同的两个子样本,每个子样本的样本容量均为(n-c)/2。③对每个子样本分别求回归方程,并计算各自的残差平方和。将两个残差平方和中较小的一个规定为21~ie,较大的一个规定为22~ie。二者的自由度均为12kcn。④提出假设:0H:2221,1H:222121与22分别为两个子样对应的随机项方差。⑤构造统计量)12,12(~)12(~)12(~2122kcnkcnFkcnekcneFii⑥检验。给定显著性水平,确定F分布表中相应的临界值F(1,2)。若F≥F(1,2),则拒绝H0,认为存在异方差;反之,则不存在异方差。H0成立,意味着同方差;H1成立,意味着异方差。5.怀特(White)检验•G-Q检验需按某一被认为有可能引起异方差的解释变量对样本排序,而且只能检验单调递增或单调递减型异方差;怀特(White)检验则不需要排序,且对任何形式的异方差都适用。怀特(White)检验的基本思想与步骤•下面,以二元回归为例,说明怀特检验的基本思想与步骤:设回归模型为:iiiiXXY22110首先,对该模型做普通最小二乘回归,记残差为:lsiiiYYe0)ˆ(~然后,以上述残差的平方为被解释变量,以原模型中各解释变量的水平项、平方项(还可以有更高次项)、交叉项等各种组合为解释变量,做如下的辅助回归:iiiiiiiiXXXXXXe215224213221102~)(~22nR则在同方差性假设下【也即H0:1=…=5=0】,该辅助回归方程的可决系数R2与样本容量n的乘积渐近地服从自由度=辅助回归方程中解释变量个数【该例=5】的2分布:显然,辅助回归仍是检验2~ie与解释变量可能的组合的相关性。如果存在异方差性,那么2~ie与解释变量的某种组合之间必定存在显著的相关性,这时往往显示出有较大的可决系数2R,并且某一参数的t检验值较大。所以,检验准则是:如果2nR≥)(2,则存在异方差;反之,则不存在异方差。怀特(White)检验的EViews软件操作要点•在OLS的方程对象Equation中,选择View/Residualtests/WhiteHeteroskedasticity。–在选项中,EViews提供了包含交叉项的怀特检验“WhiteHeteroskedasticity(crossterms)”和没有交叉项的怀特检验“WhiteHeteroskedasticity(nocrossterms)”这样两个选择。•软件输出结果:最上方显示两个检验统计量:F统计量和White统计量nR2;下方则显示以OLS的残差平方为被解释变量的辅助回归方程的回归结果。–以教材P118的例子为例,包含交叉项的怀特检验“WhiteHeteroskedasticity(crossterms)”的输出结果为:WhiteHeteroskedasticityTest:F-statistic9.833740Probability0.000027Obs*R-squared20.55085Probability0.000985TestEquation:DependentVariable:RESID^2Method:LeastSquaresDate:05/03/11Time:17:21Sample:131Includedobservations:31VariableCoefficientStd.Errort-StatisticProb.C10.243285.4745221.8710820.0731LNX1-2.3290701.116442-2.0861530.0473LNX1^20.1491140.0581072.5661950.0167LNX1*LNX20.0193330.0412650.4685070.6435LNX2-0.4573070.454020-1.0072380.3235LNX2^20.0211010.0133571.5796940.1267R-squared0.662931Meandependentvar0.02