模型的诊断与检验一、系数检验:模型总显著性的F检验、模型单个回归参数显著性的t检验检验若干线性约束条件是否成立的F检验、似然比(LR)检验、沃尔德(Wald)检验、拉格朗日乘子(LM)检验二、残差检验:自相关、异方差三、结构稳定性检验:邹(Chow)突变点检验四、变量:多重共线性、格兰杰(Granger)因果性检验在建立模型过程中,要对模型参数以及模型的各种假定条件作检验。这些检验要通过运用统计量来完成。在第2章和第3章已经介绍过检验单个回归参数显著性的t统计量和检验模型参数总显著性的F统计量。第3章已经简要介绍了检验模型若干线性约束条件是否成立的F检验以及Granger非因果性检验。在第4章介绍了模型误差项是否存在异方差的Durbin-Watson检验、White检验;模型误差项是否存在自相关的DW检验;多重共线性检验。模型的诊断与检验1模型总显著性的F检验以多元线性回归模型,yt=0+1xt1+2xt2+…+kxtk+ut为例,原假设与备择假设分别是H0:1=2=…=k=0;H1:j不全为零在原假设成立条件下,统计量其中SSR指回归平方和;SSE指残差平方和;k+1表示模型中被估参数个数;T表示样本容量。判别规则是,若FF(k,T-k-1),接受H0;若FF(k,T-k-1),拒绝H0。(详见第3章))1,(~)1/()/(kTkFkTSSEkSSRF2模型单个回归参数显著性的t检验对于多元线性回归模型,yt=0+1xt1+2xt2+…+kxtk+ut如果F检验的结论是接受原假设,则检验止。如果F检验的结论是拒绝原假设,则进一步作t检验。检验模型中哪个(或哪些)解释变量是重要解释变量,哪个是可以删除的变量。原假设与备择假设分别是H0:j=0;H1:j0,(j=1,2,…,k)。注意:这是做k个t检验。在原假设成立条件下,统计量t=)ˆ(ˆjjstk-1,(j=1,2,…,k)其中jˆ是对j的估计,)ˆ(js,j=1,2,…,k是jˆ的样本标准差。判别规则是,若ttk-1,接受H0;若ttk-1,拒绝H0。详见第2章。3检验若干线性约束条件是否成立的F检验如H0:10,20,1+0+1=1,1/20.8等是否成立的检验。以k元线性回归模型yt=0+1xt1+2xt2+…+kxtk+ut(无约束模型)为例,比如要检验模型中最后m个回归系数是否为零。模型表达式是yt=0+1xt1+2xt2+…+k-mxtk-m+ut(约束模型)在原假设:k-m+1=…=k=0,成立条件下,统计量)1,(~)1/(/)(kTmFkTSSEmSSESSEFuur其中SSEr表示由估计约束模型得到的残差平方和;SSEu表示由估计无约束模型得到的残差平方和;m表示约束条件个数;T表示样本容量;k+1表示无约束模型中被估回归参数的个数。判别规则是,若FF(m,T–k-1),约束条件成立;若FF(m,T–k-1),约束条件不成立。这里所介绍的F检验与检验模型总显著性的F统计量实际上是一个统计量。注意:F检验只能检验线性约束条件。5沃尔德(Wald)检验沃尔德检验的优点是只需估计无约束一个模型。当约束模型的估计很困难时,此方法尤其适用。另外,F和LR检验只适用于检验线性约束条件,而沃尔德检验适用于线性与非线性约束条件的检验。沃尔德检验的原理是测量无约束估计量与约束估计量之间的距离。先举一个简单的例子说明检验原理。比如对如下无约束模型yt=1x1t+2x2t+3x3t+vt检验线性约束条件2=3是否成立。则约束模型表示为yt=1x1t+2(x2t+x3t)+vt其中2也可以用3表示。因为对约束估计量2~和3~来说,必然有2~-3~=0,所以沃尔德检验只需对无约束模型进行估计。如果约束条件成立,则无约束估计量(2ˆ-3ˆ)应该近似为零。如果约束条件不成立,则无约束估计量(2ˆ-3ˆ)应该显著地不为零。关键是要找到一个准则,从而判断什么是显著地不为零。6拉格朗日乘子(LM)检验拉格朗日(Lagrange)乘子(LM)检验只需估计约束模型。所以当施加约束条件后模型形式变得简单时,更适用于这种检验。LM乘子检验可以检验线性约束也可以检验非线性约束条件的原假设。对于线性回归模型,通常并不是拉格朗日乘子统计量(LM)原理计算统计量的值,而是通过一个辅助回归式计算LM统计量的值。6拉格朗日乘子(LM)检验LM检验的辅助回归式计算步骤如下:(1)确定LM辅助回归式的因变量。用OLS法估计约束模型,计算残差序列,并把作为LM辅助回归式的因变量。(2)确定LM辅助回归式的解释变量。例如非约束模型如下式,yt=0+1x1t+2x2t+…+kxkt+ut把上式改写成如下形式ut=yt-0-1x1t-2x2t-…-kxkt则LM辅助回归式中的解释变量按如下形式确定。-,j=0,1,…,k.对于非约束模型(26),LM辅助回归式中的解释变量是1,x1t,x2t,…,xkt。第一个解释变量1表明常数项应包括在LM辅助回归式中。jtu6拉格朗日乘子(LM)检验(3)建立LM辅助回归式,=+1x1t+2x2t+…+kxkt+vt,其中由第一步得到。(4)用OLS法估计上式并计算可决系数R2。(5)用第四步得到的R2计算LM统计量的值。LM=TR2其中T表示样本容量。在零假设成立前提下,TR2渐近服从m个自由度的2(m)分布,(m)LM=TR22(m)其中m表示约束条件个数。tuˆ6拉格朗日乘子(LM)检验(3)建立LM辅助回归式如下tuˆ=+1Lnx1t+2Lnx2t+vt其中tuˆ由第一步得到。(4)用OLS法估计上式并计算可决系数R2。tuˆ=-10.67-0.67Lnxt1+1.18Lnxt2(-3.9)(-3.7)(3.9)R2=0.89,F=48.45,DW=1.3(5)用第四步得到的R2计算LM统计量的值。LM=TR2=0.8915=13.352(1)=3.8原假设3=0不成立。(第3版267页)二、残差检验•1、异方差性•2、自相关性三、参数的稳定性1、邹氏参数稳定性检验建立模型时往往希望模型的参数是稳定的,即所谓的结构不变,这将提高模型的预测与分析功能。如何检验?假设需要建立的模型为kkXXY110在两个连续的时间序列(1,2,…,n1)与(n1+1,…,n1+n2)中,相应的模型分别为:1110kkXXY2110kkXXY参数稳定性的检验步骤:(1)分别以两连续时间序列作为两个样本进行回归,得到相应的残差平方:RSS1与RSS2(2)将两序列并为一个大样本后进行回归,得到大样本下的残差平方和RSSR(3)计算F统计量的值,与临界值比较:若F值大于临界值,则拒绝原假设,认为发生了结构变化,参数是非稳定的。该检验也被称为邹氏参数稳定性检验(Chowtestforparameterstability)。2、邹氏预测检验上述参数稳定性检验要求n2k。如果出现n2k,则往往进行如下的邹氏预测检验(Chowtestforpredictivefailure)。邹氏预测检验的基本思想:先用前一时间段n1个样本估计原模型,再用估计出的参数进行后一时间段n2个样本的预测。如果预测误差较大,则说明参数发生了变化,否则说明参数是稳定的。第一步,在两时间段的合成大样本下做OLS回归,得受约束模型的残差平方和RSSR;第二步,对前一时间段的n1个子样做OLS回归,得残差平方和RSS1;第三步,计算检验的F统计量,做出判断:邹氏预测检验步骤:给定显著性水平,查F分布表,得临界值F(n2,n1-k-1)如果FF(n2,n1-k-1),则拒绝原假设,认为预测期发生了结构变化。四、变量•1、多重共线性•2、格兰杰(Granger)因果关系2、格兰杰因果关系检验•自回归分布滞后模型旨在揭示:某变量的变化受其自身及其他变量过去行为的影响。•然而,许多经济变量有着相互的影响关系GDP消费问题:当两个变量在时间上有先导——滞后关系时,能否从统计上考察这种关系是单向的还是双向的?即:主要是一个变量过去的行为在影响另一个变量的当前行为呢?还是双方的过去行为在相互影响着对方的当前行为?格兰杰因果关系检验(Grangertestofcausality)对两变量Y与X,格兰杰因果关系检验要求估计:titmiimiititYXY111(*)titmiimiititXYX211(**)可能存在有四种检验结果:(1)X对Y有单向影响,表现为(*)式X各滞后项前的参数整体为零,而Y各滞后项前的参数整体不为零;(2)Y对X有单向影响,表现为(**)式Y各滞后项前的参数整体为零,而X各滞后项前的参数整体不为零;(3)Y与X间存在双向影响,表现为Y与X各滞后项前的参数整体不为零;(4)Y与X间不存在影响,表现为Y与X各滞后项前的参数整体为零。格兰杰检验是通过受约束的F检验完成的。如:titmiimiititYXY111针对中X滞后项前的参数整体为零的假设(X不是Y的格兰杰原因)分别做包含与不包含X滞后项的回归,记前者与后者的残差平方和分别为RSSU、RSSR;再计算F统计量:)/(/)(knRSSmRSSRSSFUURk为无约束回归模型的待估参数的个数。如果:FF(m,n-k),则拒绝原假设,认为X是Y的格兰杰原因。注意:格兰杰因果关系检验对于滞后期长度的选择有时很敏感。不同的滞后期可能会得到完全不同的检验结果。因此,一般而言,常进行不同滞后期长度的检验,以检验模型中随机误差项不存在序列相关的滞后期长度来选取滞后期。•多元模型:首先进行多重共线性检验,然后视情况对模型修正(处理多重共线性);再根据数据类型进行其他检验•时间序列数据对象:主要检验自相关性、结构稳定性、格兰杰因果关系•截面数据对象:主要检验异方差性“正确”模型的解读与应用•模型解释能力•所研究的数量规律•简要结论•政策建议