第11章模型的诊断与检验11.1模型总显著性的F检验(已讲过)11.2模型单个回归参数显著性的t检验(已讲过)11.3检验若干线性约束条件是否成立的F检验11.4似然比(LR)检验(不讲)11.5沃尔德(Wald)检验11.6拉格朗日乘子(LM)检验11.7邹(Chow)突变点检验11.8JB(Jarque-Bera)正态分布检验11.9格兰杰(Granger)因果性检验(第3版252页)在建立模型过程中,要对模型参数以及模型的各种假定条件作检验。这些检验要通过运用统计量来完成。在第2章和第3章已经介绍过检验单个回归参数显著性的t统计量和检验模型参数总显著性的F统计量。在第5章介绍了模型误差项是否存在异方差的Durbin-Watson检验、White检验;在第6章介绍了模型误差项是否存在自相关的DW检验和BG检验。本章开始先简要总结模型参数总显著性的F检验、单个回归参数显著性的t检验。然后再介绍几个在建模过程中也很常用的其他检验方法。他们是检验模型若干线性约束条件是否成立的F检验和似然比(LR)检验、Wald检验、LM检验、JB检验以及Granger非因果性检验。第11章模型的诊断与检验11.1模型总显著性的F检验以多元线性回归模型,yt=0+1xt1+2xt2+…+kxtk+ut为例,原假设与备择假设分别是H0:1=2=…=k=0;H1:j不全为零在原假设成立条件下,统计量其中SSR指回归平方和;SSE指残差平方和;k+1表示模型中被估参数个数;T表示样本容量。判别规则是,若FF(k,T-k-1),接受H0;若FF(k,T-k-1),拒绝H0。(详见第3章)(第3版252页))1,(~)1/()/(kTkFkTSSEkSSRF11.2模型单个回归参数显著性的t检验(第3版253页)对于多元线性回归模型,yt=0+1xt1+2xt2+…+kxtk+ut如果F检验的结论是接受原假设,则检验止。如果F检验的结论是拒绝原假设,则进一步作t检验。检验模型中哪个(或哪些)解释变量是重要解释变量,哪个是可以删除的变量。原假设与备择假设分别是H0:j=0;H1:j0,(j=1,2,…,k)。注意:这是做k个t检验。在原假设成立条件下,统计量t=)ˆ(ˆjjstk-1,(j=1,2,…,k)其中jˆ是对j的估计,)ˆ(js,j=1,2,…,k是jˆ的样本标准差。判别规则是,若ttk-1,接受H0;若ttk-1,拒绝H0。详见第2章。11.3检验若干线性约束条件是否成立的F检验(第3版254页)如H0:10,20,1+0+1=1,1/20.8等是否成立的检验。以k元线性回归模型yt=0+1xt1+2xt2+…+kxtk+ut(无约束模型)为例,比如要检验模型中最后m个回归系数是否为零。模型表达式是yt=0+1xt1+2xt2+…+k-mxtk-m+ut(约束模型)在原假设:k-m+1=…=k=0,成立条件下,统计量)1,(~)1/(/)(kTmFkTSSEmSSESSEFuur其中SSEr表示由估计约束模型得到的残差平方和;SSEu表示由估计无约束模型得到的残差平方和;m表示约束条件个数;T表示样本容量;k+1表示无约束模型中被估回归参数的个数。判别规则是,若FF(m,T–k-1),约束条件成立;若FF(m,T–k-1),约束条件不成立。这里所介绍的F检验与检验模型总显著性的F统计量实际上是一个统计量。注意:F检验只能检验线性约束条件。例11.1:建立中国国债发行额模型。首先分析中国国债发行额序列的特征。1980年国债发行额是43.01亿元,占GDP当年总量的1%,2001年国债发行额是4604亿元,占GDP当年总量的4.8%。以当年价格计算,21年间(1980-2001)增长了106倍。平均年增长率是24.9%。中国当前正处在社会主义市场经济体制逐步完善,宏观经济运行平稳阶段。国债发行总量应该与经济总规模,财政赤字的多少,每年的还本付息能力有关系。11.3检验若干线性约束条件是否成立的F检验0100020003000400050008082848688909294969800DEBT(第3版254页)例11.1:建立中国国债发行额模型选择3个解释变量,国内生产总值,财政赤字额,年还本付息额,根据散点图建立中国国债发行额模型如下:DEBTt=0+1GDPt+2DEFt+3REPAYt+ut其中DEBTt表示国债发行总额(单位:亿元),GDPt表示年国内生产总值(单位:百亿元),DEFt表示年财政赤字额(单位:亿元),REPAYt表示年还本付息额(单位:亿元)。01000200030004000500002004006008001000GDPDEBT010002000300040005000-10000100020003000DEFDEBT01000200030004000500005001000150020002500REPAYDEBT(第3版255页)用19802001年数据得输出结果如下;DEBTt=4.31+0.35GDPt+1.00DEFt+0.88REPAYt(0.2)(2.2)(31.5)(17.8)R2=0.999,DW=2.12,T=22,SSEu=48460.78,(1980-2001)是否可以从模型中删掉DEFt和REPAYt呢?可以用F统计量完成上述检验。原假设H0是3=4=0(约束DEFt和REPAYt的系数为零)。给出约束模型估计结果如下,DEBTt=-388.40+4.49GDPt(-3.1)(17.2)R2=0.94,DW=0.25,T=22,SSEr=2942679,(1980-2001)已知约束条件个数m=2,T-k-1=18。SSEu=48460.78,SSEr=2942679。因为F=537.5F(2,18)=3.55,所以拒绝原假设。不能从模型中删除解释变量DEFt和REPAYt。)1/(/)(kTSSEmSSESSEFuur5.537)422/(78.484602/)78.484602942679((第3版256页)例11.1:建立中国国债发行额模型EViews可以有三种途径完成上述F检验。(1)在无约束模型输出结果窗口中点击View,选CoefficientTests,WaldCoefficientRestrictions功能(Wald参数约束检验),在随后弹出的对话框中填入c(3)=c(4)=0。可得如下结果。其中F=537.5。例11.1:建立中国国债发行额模型(第3版256页)(2)在非约束模型输出结果窗口中点击View,选CoefficientTests,RedundantVariables-LikelihoodRatio功能(模型中是否存在多余的不重要解释变量),在随后弹出的对话框中填入REPAY,DEF。可得计算结果F=537.5。(3)在约束模型输出结果窗口中点击View,选CoefficientTests,OmittedVariables-LikelihoodRatio功能(模型中是否丢了重要的解释变量),在随后弹出的对话框中填入拟加入的解释变量REPAY,DEF。可得结果F=537.5。(第3版256页)11.5沃尔德(Wald)检验(第3版259页)沃尔德检验的优点是只需估计无约束一个模型。当约束模型的估计很困难时,此方法尤其适用。另外,F和LR检验只适用于检验线性约束条件,而沃尔德检验适用于线性与非线性约束条件的检验。沃尔德检验的原理是测量无约束估计量与约束估计量之间的距离。先举一个简单的例子说明检验原理。比如对如下无约束模型yt=1x1t+2x2t+3x3t+vt检验线性约束条件2=3是否成立。则约束模型表示为yt=1x1t+2(x2t+x3t)+vt其中2也可以用3表示。因为对约束估计量2~和3~来说,必然有2~-3~=0,所以沃尔德检验只需对无约束模型进行估计。如果约束条件成立,则无约束估计量(2ˆ-3ˆ)应该近似为零。如果约束条件不成立,则无约束估计量(2ˆ-3ˆ)应该显著地不为零。关键是要找到一个准则,从而判断什么是显著地不为零。首先需要知道(2ˆ-3ˆ)的抽样分布。依据经典回归的假定条件,(2ˆ-3ˆ)服从均值为(2-3),方差为Var(2ˆ-3ˆ)的正态分布。定义W统计量为,W=)ˆˆ(Var)ˆˆ(3232N(0,1)在约束条件成立条件下,W渐近服从N(0,1)分布。通常Var(2ˆ-3ˆ)是未知的,使用的是Var(2ˆ-3ˆ)的样本估计量。11.5沃尔德(Wald)检验(第3版260页)下面讨论多个约束条件的情形。假定若干约束条件是以联合检验的形式给出,f()=0,其中f()表示由约束条件组成的列向量。用~表示施加约束条件后对参数集合{1,2,…,k}的估计。若把~代入上式,则上式一定成立。当把无约束估计值ˆ代入上式时,通常上式不会成立。W统计量定义如下,)1(1)(')1()ˆ())ˆ(()ˆ(mmmmWffVarf其中f(ˆ)是用ˆ代替后的f()表达式,Var(f(ˆ))是f(ˆ)的估计的方差协方差矩阵。计算公式如下:')()()(ˆ)ˆ()ˆ(ˆ)ˆ())ˆ((mkkkkmfVarffVar其中ˆ)ˆ(f表示f()用无约束估计量ˆ代替后的偏导数矩阵,Var(ˆ)是ˆ的估计的方差协方差矩阵。在约束条件成立条件下,)1(1)(')1()ˆ())ˆ(()ˆ(mmmmWffVarfm)其中m表示被检验的约束条件的个数,在原假设12=3成立条件下,W统计量渐近服从(1)分布。举一个非线性约束的例子如下。假定对模型yt=1xt1+2xt2+3xt3+ut检验约束条件12=3是否成立。用,ˆ12ˆ和3ˆ分别表示,和的非约束估计量。1ˆ,2ˆ和3ˆ既可以是极大似然估计量,也可以是最小二乘估计量。因为对于本例f(ˆ)只含有一个约束条件,所以f(ˆ)变成标量,f(ˆ)=1ˆ2ˆ-3ˆ。ˆ)ˆ(f=(1ˆ)ˆ(f,2ˆ)ˆ(f,3ˆ)ˆ(f)=(2ˆ1ˆ-1),Var(ˆ)=)ˆ(Var)ˆˆ(Cov)ˆˆ(Cov)ˆˆ(Cov)ˆ(Var)ˆˆ(Cov)ˆˆCov)ˆˆ(Cov)ˆ(Var332313222131211')1()()1(ˆ)ˆ()ˆ(ˆ)ˆ())ˆ((kkkkfVarffVar=(2ˆ1ˆ-1)Var()ˆ1ˆˆ12)11(1)11(')11()ˆ())ˆ(()ˆ(ffVarfW1ˆˆ)ˆ()1ˆˆ()ˆˆˆ(12122321Var11.5沃尔德(Wald)检验(第3版262页)例11.3:19581972年台湾制造业生产函数如下,tLny=-8.4010+0.6731Lnxt1+1.1816Lnxt2(-3.1)(4.4)(3.9)R2=0.98,F=335.8,DW=1.3,T=15,(19581972)试检验劳动力和实际资本两个弹性系数的比2/3=0.5是否成立。变换约束条件为2-0.53=0。因为只有一个约束条件,则f(ˆ)=f(ˆ)=2-0.53ˆ)ˆ(f=(1ˆ)ˆ(f2ˆ)ˆ(f3ˆ)ˆ(f)=(01-0.5)Var(ˆ)=