第四章违背古典假定的计量经济模型*概述*异方差*自相关*随机解释变量*多重共线性第一节概述一、古典假定假定1、随机项i具有零均值E(i)=0i=1,2,…,n假定2、随机项i具有同方差Var(i)=2i=1,2,…,n假定3、随机项i无序列相关性Cov(i,j)=0i≠ji,j=1,2,…,n假定4、随机项与解释变量X之间不相关:Cov(Xj,i)=0i=1,2,…,n假定5、服从正态分布i~N(0,2)i=1,2,…,n假定6、多元回归模型中解释变量之间不存在多重共线性rank(X)=k+1k+1<n根据Gauss-Markov定理可知,古典回归模型的最小二乘估计量(OLSE)是线性无偏有效的估计量,而且由于正态性假定,它们服从正态分布的。因此,就有可能得出区间估计式,而且也可以检验真实总体回归系数。二、古典假定的违背及造成的后果在实际经济问题中,上述的古典假定不一定都能得到满足。如果这些假定不完全满足,则OLSE的BLUE特性将不复存在。当然,每一个假定不满足所造成的后果是不同的。在本章中,我们将严格考察上述假定,找出如果有一个或多个假定得不到满足时,估计量的性质将会发生什么变化,并研究当出现这些情况时,应该如何处理,即古典模型假定违背的经济计量问题。关于假定1,一般地我们认为假定E(i)=0是合理的。因为随机项是多种因素的综合,而每种因素的影响都“均匀”地微小,它对因变量的影响不是系统的,且正负影响相互抵消,故所有可能取值平均起来为零。即使有轻度的违反,从实践的观点来看可能不会产生严重的后果,因为它可能只影响回归方程的截距项。关于随机项正态性分布的假定,如果我们的目的仅仅是估计,这种假定并不是绝对必要的。事实上,无论是否是正态分布,OLSE估计式都是BLUE。剩下的四个假定将在下面的四节中分别加以讨论。三、广义最小二乘法(GLS)给定线性回归模型Y=Xβ+U若古典假定完全满足,根据Gauss-Markov定理,其系数的最小二乘估计量B=(XTX)–1XTY具有BLUE性质。若古典假定得不到完全满足,特别是假定2(同方差性)和假定3(无序列相关性)得不到满足时,对OLSE的影响更大。广义最小二乘法(GeneralLeastSquares-GLS)就是为了解决上述问题提出的。其基本思路是:若假定2(同方差性)和假定3(无序列相关性)得不到满足时,我们可以采取适当的变换,使原模型变为以下的形式:使得其中的重新满足假定2(同方差性)和假定3(无序列相关性)。这样就可以对上式使用OLS估计参数,从而使得上式的OLSE仍然为BLUE。若因假定2和假定3不满足时,有其中Ω≠I,Ω是一个n×n的正定对称方阵。YXBU2varcov()()TuUEUUU此时可可以觅得一个n×n的非奇异矩阵P,使得:PΩPT=I然后用觅得的P乘以原模型的两边,有:PY=PXβ+PU记原模型就转换为:可证明转换后的模型其随机项满足同方差性和无序列相关性,即可以采用OLS估计参数了。,,YPYXPXUPUYXBU第二节异方差性一、异方差的涵义二、异方差性的后果三、异方差的检验四、异方差的消除方法五、案例对于模型ikikiiiiXXXY2210如果出现Varii()2即对于不同的样本点,随机误差项的方差不再是常数,而互不相同,则认为出现了异方差性(Heteroscedasticity)。一、异方差的概念异方差举例例:截面资料下研究居民家庭的储蓄行为Yi=0+1Xi+uiYi:第i个家庭的储蓄额Xi:第i个家庭的可支配收入高收入家庭:储蓄的差异较大低收入家庭:储蓄则更有规律性,差异较小ui的方差呈现单调递增型变化例以某一行业的企业为样本建立企业生产函数模型Yi=ALiαKiei被解释变量:产出量Y解释变量:资本K、劳动力L那么:每个企业所处的外部环境对产出量的影响被包含在随机误差项中。每个企业所处的外部环境对产出量的影响程度不同,造成了随机误差项的异方差性。这时,随机误差项的方差并不随某一个解释变量观测值的变化而呈规律性变化,呈现复杂型。异方差产生的原因:一.模型中省略的解释变量;二.测量的误差;三.截面数据中总体各单位的差异.二、异方差产生的后果计量经济学模型一旦出现异方差性,如果仍采用OLS估计模型参数,会产生下列不良后果:1、参数估计量非有效OLS估计量仍然具有无偏性,但不具有有效性因为在有效性证明中利用了E(uuT)=2I而且,在大样本情况下,尽管参数估计量具有一致性,但仍然不具有渐近有效性。2、变量的显著性检验和置信区间失去意义变量的显著性检验中,构造了t统计量t=b1/s(b1)它是建立在σ2不变而正确估计了参数方差s(b1)的基础之上的。如果出现了异方差,估计的s(b1)出现偏误(偏大或偏小),t检验失去意义。其他检验也是如此。3、参数方差的估计量是有偏的虽然最小二乘法参数的估计量是无偏的,但这些参数方差的估计量、是有偏的。正的偏差会高估参数估计值的真实方差,负的偏差会低估参数估计值的真实方差。4、模型的预测失效一方面,由于上述后果,使得模型不具有良好的统计性质;所以,当模型出现异方差性时,参数OLS估计值的变异程度增大,从而造成对Y的预测误差变大,降低预测精度,预测功能失效。三、异方差性的检验•检验思路:由于异方差性就是相对于不同的解释变量观测值,随机误差项具有不同的方差。那么:检验异方差性,也就是检验随机误差项的方差与解释变量观测值之间的相关性及其相关的“形式”。(一)图示法既可利用因变量Y与解释变量X的散点图,也可利用残差e2--X的散点图,对随机项u的异方差作近似的直观判断。(1)用X-Y的散点图进行判断看是否存在明显的散点扩大、缩小或复杂型趋势(即不在一个固定的带型域中)(2)X-~ei2的散点图进行判断看是否形成一斜率为零的直线~ei2~ei2XX同方差递增异方差~ei2~ei2XX递减异方差复杂型异方差(二)戈德菲尔德-匡特(Goldfeld-Quandt)检验G-Q检验以F检验为基础,适用于大样本、异方差递增或递减的情况。G-Q检验的思想:先排序,将样本去掉中间的c个,然后一分为二,对子样①和子样②分别作回归,然后利用两个子样的残差平方和之比构造统计量进行异方差检验。022212:inHu是同方差,即2iH1:随x递增(或递减)G-Q检验的步骤:①将n对样本观察值(Xi,Yi)按观察值Xi的大小排队②将序列中间的c=n/4个观察值除去,并将剩下的观察值划分为较小与较大的相同的两个子样本,每个子样样本容量均为(n-c)/2③对每个子样分别进行OLS回归,并计算各自的残差平方和分别用RSS1与RSS2表示解释变量较小与较大的残差平方和(自由度均为(n-c)/2-k);⑤给定显著性水平,确定临界值F(v1,v2),若FF(v1,v2),则拒绝同方差性假设,表明存在异方差。④在同方差性假定下,选择如下满足F分布的统计量如果检验递增方差F==~F(k,k)2212/()/()ncncRSSkRSSk21RSSRSS2nc2nc12RSSRSS如果检验递减方差F==~F(k,k)1222/()/()ncncRSSkRSSk2nc2nc(三)戈里瑟(Gleiser)检验基本思想:尝试建立|ei|关于解释变量X的各种幂次方程:如:|ei|=β0+β1Xi+vi|ei|=β0+β1Xi-1+vi等等选择关于变量X的不同的函数形式,对方程进行估计并进行显著性检验,如果存在某一种函数形式,使得方程显著成立,则说明原模型存在异方差性。(四)Spearman等级(秩)相关检验这是一种非参数检验。方法为:1.利用最小二乘法对模型进行回归,计算残差ei及其绝对值|ei|;2.给出X的每个Xi的位次和|ei|的位次;3.计算每个样本点的Xi的位次和|ei|的位次的差di4.计算Spearman等级(秩)相关系数:22161(1)nsiirdnn5.对Spearman等级(秩)相关系数进行显著性检验。检验统计量为2(1)(2)ssrtrn上述统计量服从自由度为(n-2)的t分布。对应给定显著性水平的临界值,若t≤,则认为不存在异方差,若t>,则认为存在异方差。2(2)tn2(2)tn2(2)tn(五).怀特(White)检验怀特检验不需要排序,且适合任何形式的异方差。怀特检验的基本思想与步骤(以二元为例):iiiiXXY22110然后做如下辅助回归iiiiiiiiXXXXXXe215224213221102~可以证明,在同方差假设下:(*)R2为(*)的可决系数,h为(*)式解释变量的个数,表示渐近服从某分布。做如下辅助回归注意:辅助回归仍是检验与解释变量可能的组合的显著性,因此,辅助回归方程中还可引入解释变量的更高次方。如果存在异方差性,则表明确与解释变量的某种组合有显著的相关性,这时往往显示出有较高的可决系数以及某一参数的t检验值较大。当然,在多元回归中,由于辅助回归方程中可能有太多解释变量,从而使自由度减少,有时可去掉交叉项。2ie四、异方差的消除方法异方差消除的基本思路是将原模型加以“变换”,使得“变换”后的模型具有同方差性。但是变换的形式与每个随机项方差的真实值是已知还是未知有关。(一)随机项方差σi2已知当σi2已知或者可以估计出来的情况,可利用广义的最小二乘法。下面介绍广义最小二乘法的另一种情形:加权最小二乘法(WeightedLeastSquares,WLS)乘以模型的两端,得以一元线性回归模型为例,变换的方法是用1()iiiy01()i1()iiiixuiiiuv令把它称为变换后的随机项.|iiux2(0,)iN~因为iiiuv而|iivx(0,1)N~所以由此可得()()1iiiuVarVarviiy01()i1()iiiixu所以中随机项iv满足了同方差性的假定。故可以用常规的OLS对其进行估计.加权最小二乘法的基本思想:加权最小二乘法是对原模型加权,实质是用方差σi2的平方根σi对原模型进行变换。使之变成一个新的不存在异方差性的模型,然后采用OLS估计其参数。注意:加权最小二乘法的思路很简单,但在具体实践中有关随机项方差的信息极少,我们很难找出真实的随机项方差σi2。因此加权最小二乘法仅是理论上的存在,实际上往往很难使用它。所以,当σi2未知或者利用已知观测数据无法估计的情况下,必须寻求其它的方法。(二)随机项方差未知从异方差的意义看,异方差就是随机项在解释变量取不同数值时方差不同。这就意味着异方差σi2是解释变量x的函数,这种函数形式我们可假设出来。ijiijijiijiXXfXXfXfYXf22110)(1)(1)(1)(1ijikijikXfXXf)(1)(1例如,如果只与一个解释变量有关,可假设2i()jifx可以用去除该模型,得222()()()iiijiVaruEufx新模型中,存在即满足同方差性,可用OLS法估计。222111()()()()()()iiijijijiVaruEuEufxfxfx若与m(1≤m≤k)个解释变量有关,则异方差形式可写作2i2i21(,,ifx)mix1(,,)imifxx以遍除原模型,得:1(,,)iimiyfxx0111(,,)ikkiimixxfxx=+1(,,)iimiufxx*1(,,)iiimiuufxx记**11()(,,)(,,)ijijimijmjuuEuuEfxxfxx20ijij当当可以对转换后的模型OLS应用进行参数估计。这说明转换后的模型具有了同方差性。如果给定的模型为:假定1:01iiiyxu222()iiEux01101iiiiiiiyuvxxxx此时用1