第7章多元回归模型的应用§7.1自变量与误差项相关§7.2变量的测量误差§7.3确认失误§7.4回归诊断§7.5确认检验第7章多元回归模型的应用在现实经济问题中常常会出现不能完全满足古典线性回归模型六个基本假设的情形,上一章我们分别讨论了误差项的异方差和序列相关,下面再来讨论解释变量与误差项出现相关性的问题。§7.1自变量与误差项相关考虑一元线性回归模型,其参数的LS估计为于是我们有iiixy2iiixyxˆ2iii2iiii2iiixxx)x(xxyxˆ第7章多元回归模型的应用如果,那么参数LS估计就不再具有无偏性和一致性。0)x(EiiXYXˆˆYˆ图7.1X和ε正相关的情形第7章多元回归模型的应用§7.2变量的测量误差由于出现测量误差,变量也就成为随机变量。下面按因变量、自变量出现的测量误差分别讨论。1、因变量Y的测量误差假定真正的一元线性模型为,在测定y时,由于测量误差测成了y*,两者满足其中μ与ε不相关,且。模型可化为此时iiixyii*iyy),0(N~2iiii*ixy2iiiii2iiiii2i*iixxxx)x(xxyxˆ第7章多元回归模型的应用这里xi不是随机的,显然参数的LS估计仍然具有无偏性和一致性。2、解释变量X的测量误差假定真正的一元线性模型为,在测定x时,由于测量误差测成了x*,两者满足其中ν与ε不相关,且,x与ν、ε不相关。记模型可化为此时由及根据大数定律有:iiixyii*ixx),0(N~2i*i*iixy2*i*i*i2*i*i*i*i2*ii*ixxx)x(xxyxˆii*i2iiii*i*iN)])(x([E)x(E第7章多元回归模型的应用所以可见参数的LS估计不再具有无偏性和一致性。而且其绝对值常常低估真正的回归参数。)x2x(N1)xx(N1)x())(x(xx2iii2i2iiiiiii2iiiiii2*i*i*i2222limP)x(Var)x(E2)x(Var)x(E)(E)x(E)x(Var/1xxˆ2ilimP2*i*i*i第7章多元回归模型的应用3、x和y都存在测量误差情形与2类同,结果是一致的。4、保持一致性估计的工具变量⑴概念如果新变量Z满足以下两个条件,称为工具变量。①当样本容量增大时,Z与模型中的ε,μ,以及ν不相关②当样本容量增大时,Z与X之间的相关系数不为0。⑵一致性估计我们构造估计量有i*iii*zxzylimPi*ii*ii*ii*ii*ii*ii*i*zxzzxzzxzxzy第7章多元回归模型的应用§7.3确认失误建模的目的是为了用于实际预测,如果我们选择了不恰当的模型,就会出现较大的偏离,这就面临更大的问题:模型的确认失误。确认失误一方面可能产生于真正模型虽然是线性,但出现了变量缺省或者冗余;另一方面还可能由于它本身的非线性。下面讨论由于模型确认失误所产生的参数LS估计性质的变化。1、变量缺省的情形模型中缺失或省略了某些重要的变量。⑴无偏性和一致性设真正模型为但被错误确认为)1.7(xxyii33i22i)2.7(xy*ii2*2i第7章多元回归模型的应用我们考察参数LS估计间的关系。模型(7.2)中变量x2系数的LS估计:把模型(7.1)代入这一表达式,可以得到所以可见由于模型的错误确认,参数估计通常不再具有无偏性和一致性了。2i2ii2*2xyxˆ2i2ii22i2i3i2322i2ii2i3i232i22*2xxxxxxxxxxˆ2i2i3i232*2xxx)ˆ(E第7章多元回归模型的应用⑵参数估计量的方差由真正模型(7.1)可得记有2i3i22i32i2ii3i3i2ii22i32)xx()x)(x()yx()xx()yx)(x(ˆ2i3332i222i3i223xL,xL,xxL2222333222i323i23322233322ii323i2332*])L(LL[)xLxL()ˆ(D)L(LLy)xLxL(ˆ222233322i3i223332i32232i22332*])L(LL[xxLL2xLxL)ˆ(D222333223322223332233223222332**)L(LLL])L(LL[LLLL)ˆ(D第7章多元回归模型的应用于是两者的方差通常是不等的(除非x2和x3的简单相关系数r等于0),显然在模型被错误确认情况下,参数LS估计的方差小于真正模型参数LS估计的方差。2、变量冗余的情形模型中出现不相干或多余的变量。⑴无偏性和一致性设真正模型为但被错误确认为)ˆ(Dr1)ˆ(D)ˆ(D*22*22)3.7(xyii22i)4.7(xxy*ii3*3i2*2i第7章多元回归模型的应用我们考察参数LS估计间的关系。模型(7.4)中变量x2系数的LS估计:把模型(7.3)代入这一表达式,可以得到所以可见虽然模型因包含冗余变量而被错误确认了,参数估计仍然具有无偏性和一致性。但由于冗余变量增加了参数,从而减少样本自由度导致了参数估计丧失了有效性。2i3i22i32i2ii3i3i2ii22i22*2)xx(xx)x)(xx()x()x(ˆ2limP*22*2ˆ,)ˆ(E2i3i22i32i2ii3i3i2ii22i3*2)xx()x)(x()yx()xx()yx)(x(ˆ第7章多元回归模型的应用⑵参数估计量的方差由类似于缺省变量的情形可得可见,参数LS估计的方差大于真正模型参数LS估计的方差。3、模型的非线性设真正模型为但被错误确认为2i3i22i32i2ii3i3i2ii22i3*2)xx()x)(x()yx()xx()yx)(x(ˆ)ˆ(Dr1)ˆ(D)ˆ(D222*2)5.7(xxxyi3i242i23i22i)6.7(xy*ii2*2i第7章多元回归模型的应用此时相当于变量缺省的情形(视为其特例),模型错误确认后参数估计不再具有无偏性和一致性。由于非线性模型可以用多项式模型来逼近,因此模型(7.5)常常用于检验变量之间的非线性。4、建模时的有效与有偏建模时如果模型缺省了某重要变量,就会出现参数估计的有偏性和非一致性;如果模型包含了冗余变量,参数估计就会丧失有效性。为寻求恰当的模型,我们不得不在偏差和有效之间权衡。最小平均误差平方E()2法则为我们在若干个备择模型中进行选择提供了基本方法,这是因为)ˆ(Var])ˆ(E[)ˆ(E22ˆ第7章多元回归模型的应用由此看来,建模技术和最小平均误差法则是我们建立恰当模型的重要基础。例7.1货币需求量问题模型的错误确认,是经济学建模过程中经常遇到的问题。即使是著名的学者也不能例外。邹至庄先生在上一世纪六十年代关于货币长期需求和短期需求的研究中就曾经因为忽略货币需求的滞后影响,对模型确认失误,导致其得出永久性收入比当前收入更重要的错误结论。即在该问题中真正的模型为但其错误确认为t1t5t4t3pt21tMRYYM*tt*4t*3pt*2*1tRYYM第7章多元回归模型的应用§7.4回归诊断对线性模型缺省重要变量、或者包含多余变量的错误确认,不仅会改变参数LS估计量的性质,而且伴随着残差的变化。实际上还有另外一些原因也可能导致类似的结果,因此关注任何不正常的残差规律,就成为查找、发现线性模型错误确认的一种有效方法。1、回归诊断通过构造与线性回归模型中参数估计的误差相关的统计量,进行统计检验,诊断一个(多个)数据点或一个(多)个自变量对回归参数估计是否存在不正常或过大的影响,这种过程我们称为回归诊断。回归诊断仍属于统计检验的范畴。第7章多元回归模型的应用iiXYˆiiXˆˆYˆ图7.2影响力过大的数据点第7章多元回归模型的应用1、学生氏残差比较大的残差对于回归诊断来说十分有用,它可以帮助我们找到一些对参数估计具有较大影响力的可能异常点。但在通常情况下,我们是把误差(残差)作为一个整体来研究,评价误差分布是否服从正态分布(这是古典线性模型的基本假设之一)的。为了判断某个观测是否就是具有较大影响力的异常点,可以对去悼这个特别观测点后的数据进行回归,分析所得到残差的变化。下面以一元线性回归模型为例,构造学生氏残差统计量:)i(sx)i(yiii*iN,,2,1i第7章多元回归模型的应用其中β(i)是指去掉第i个观测点(xi,yi)后回归模型斜率的LS估计,s(i)表示该回归方程N-1个回归估计值的标准差。第i个观测相应的学生氏残差的绝对值如果大于临界值(按显著性水平确定,查自由度为N-2的t分布),那么就认为第i个观测是异常点;当异常点超出我们期望的比例(如5%),就拒绝误差服从正态分布的假设。这一检验也适用于多元的情形。2、DFBETAS统计量(β差异法)为了检验对一个估计参数值具有特别大影响力的观测点,构造下面的DFBETAS统计量:)i(is)i(DFBETAS第7章多元回归模型的应用其中β指回归模型斜率的LS估计,β(i)含义同前;sβ(i)表示N-1个β(1),…,β(i-1),β(i+1),…,β(N)参数估计值的标准差。第i个观测相应的DFBETAS统计量的绝对值如果大于临界值(按显著性水平确定,查自由度为N-2的t分布),那么就认为第i个观测是β参数估计的异常点;当异常点超出我们期望的比例(如5%),就认为该参数估计不值得信赖。对于DFBETAS统计量的临界值需要说明的是,在实际对比中必须调整为,这是因为任何对参数估计值具有较大影响的观测,影响力可能随样本容量的增大而减小。N/t第7章多元回归模型的应用§7.5确认检验在线性回归模型中,如果缺省了某些重要的变量,参数估计就不再具有无偏性和一致性;如果存在不相干的变量,参数估计的有效性就会丧失。因此检验一个选定的模型是否存在错误确认,显然十分重要。1、检验模型中是否存在多余变量第5章已经介绍了利用t分布进行单参数检验,以及利用F分布进行多参数检验的方法,如果接受参数为0的假设,相应的变量就是多余的。还有一种既不依赖正态分布假设也不用最小二乘估计的检验方法——似然比检验法。第7章多元回归模型的应用2、检验变量是否存在测量误差在一元线性模型中xi存在测量误差,即,令模型化为设z是与x*相关但与ε,ν无关的工具变量。可以通过以下简单的两步法对测量误差进行检验:⑴将x*对工具变量z进行回归计算残差;⑵将y对x*和进行回归,对的系数进行t检验。如果t值小于临界值,则认为不存在变量测量误差。N,,2,1ixyiiiii*ixxii*i*i*iixyii*iwzxiwˆwˆwˆ第7章多元回归模型的应用作业:p125页的7.4、7.6。