1第六章自相关性本章教学要求:本章是违背古典假定情况下线性回归描写的参数估计的又一问题。通过本章的学习应达到:掌握自相关的基本概念,产生自相关的背景;自相关出现对模型影响的后果;诊断自相关存在的方法和修正自相关的方法。能够运用本章的知识独立解决模型中的自相关问题。经过第四、五、六章的学习,要求自行选择一个实际经济问题,建立模型,并判断和解决上述可能存在的问题。第一节自相关性的概念一、一个例子研究中国城镇居民消费函数,其中选取了两个变量,城镇家庭商品性支出(现价)和城镇家庭可支配收入(现价),分别记为CSJTZC和CSJTSR,时间从1978年到1997年,n=20。但为了剔除物价的影响,分别对CSJTZC和CSJTSR除以物价(用CPI表示),这里CPI为城镇居民消费物价指数(以1990年为100%),经过扣除价格因素以后,记CPICSJTSRXCPICSJTZCY即如下表2回归以后得到的残差为DependentVariable:YMethod:LeastSquaresDate:10/27/04Time:09:39Sample:19781997Includedobservations:20VariableCoefficientStd.Errort-StatisticProb.C-103.369278.80739-1.3116690.2061X0.9235510.01603357.603880.0000R-squared0.994605Meandependentvar3939.341AdjustedR-squared0.994305S.D.dependentvar2124.467S.E.ofregression160.3247Akaikeinfocriterion13.08692Sumsquaredresid462671.9Schwarzcriterion13.18649Loglikelihood-128.8692F-statistic3318.207Durbin-Watsonstat1.208037Prob(F-statistic)0.0000003二、什么是自相关性在引出自相关性的概念之前,根据建立中国城镇居民储蓄函数,经用最小二乘法估计出参数后,得到残差序列,由此画出残差图(残差序列自身的关系),从图形上看存在te对1te的线性关系,残差的这种现象说明了什么?下面给出序列自相关的定义。1、如果模型中的随机误差项iu,满足以下关系式stuuCovst,0),(则随机误差项iu之间存在自相关性。2、一阶线性自相关。在stuuCovst,0),(中,如果1st,则,0),(1ttuuCov并且tu与1tu之间为线性关系,即tttuu1,其中t满足古典假定,即,,0)(,)(,0)(22stEEEsttt<1。将tu与1tu的这种线性关系称为一阶线性自相关(或一阶线性自回归),简称一阶自相关(或一阶自回归)。3、一阶线性自回归的数学性质。设一元线性模型为4tttuXY21并且,tttuu1,其中t满足,,0)(,)(,0)(22stEEEsttt<1。设总体一阶序列自相关系数为)var()var(),cov(11ttttuuuu按照样本相关系数计算公式,样本序列自相关系数为1221ˆtttteeee另一方面,对一阶线性自回归tttuu1,求参数的最小二乘估计,即12212ˆntttntteee在大样本下,有ˆˆ。因此,通常可用ˆ表示ˆ。tu的数学特性:(1)0)(tuE事实上,.,,,)1(1211rtrtrtttttttuuuuuu将递推关系逐一代入,并注意当0r时,0rtru,则0332211232122121)()(rrtrtttttttttttttttttuuuuu000()()()()0,(()0)rrrttrtrtrtrrrEuEEEE(2)2221)var(tu52222221112222211222()()()()(2)()()()(()0)()1ttttttttttttttttVaruEuEuEuEuEuuEuEVaruEuVaru在t满足22()0,(),()0,,tttsEEEtst服从正态分布,且<1。有23123231232222322223()()()()()()(1)1tttttttttVaruVarVarVarVarVar(3)2),cov(ssttuu按照协方差的定义,可类似推出上述结果。三、自相关产生的原因1、经济变量大多存在惯性的作用。如经济变量随时间运动往往存在趋势的作用,使得变量在变化中具有惯性特征。2、许多经济变量具有滞后性的表现。3、一些随机偶然因素的干扰或影响。4、设定偏倚。与异方差性情况类似。5、蛛网现象模型。这是农产品与农产品价格所固有的一种关系,即当期农产品的产出量与前期的农产品价格有关,用公式表示为)(1tstpfQ6、时间序列更易产生自相关性。第二节自相关性的后果从统计意义上讲,并参考异方差性的情况,自相关性对模型的影响主要有以下几方面。6一、在自相关存在的前提下,参数估计的统计特性1、参数估计仍是无偏的。设线性回归模型为tttuXY21其样本回归函数中参数的最小二乘估计分别为21ˆ,ˆ,有11)ˆ(E22)ˆ(E其证明可参见在第五章中异方差存在的条件下,参数估计仍是无偏的。2、参数估计不再具有方差最小性。在自相关下,由第五章异方差对参数估计影响的说明,有222222222222222222222222222*2)ˆ()()(2)()(2)()(2ˆ)ˆ(ˆ)ˆ(iijijijiiijijijijiiiijijijijiiiiiiiiixVarxuuExxxxuuExxuExxuuxxuxExuxExuxEEEEVar在无自相关下,有比较上述两式,可以很明显看到,如果随机误差序列存在正的自相关,则)ˆ(*2Var)ˆ(2Var。三、2ˆ严重低估了2。四、参数的显著性检验失效。五、预测精度降低。需要注意的问题,比较多重共线性与异方差、自相关在预测应用中有不同的情况。如果模型中存在多重共线性,但变量符合经济意义,并且线性结构保持不变,则这个时候可以利用模型进行预测;如果模型中存在的是异方差和自相关问题,则不能利用模型进行预测(为什么?)。7第三节自相关的检验一、图示法。1、利用te对1te的散点图进行判断。(1)当散点大部分落在一、三象限时,则表明随机误差存在正自相关。(2)当散点大部分落在二、四象限时,则表明随机误差存在负自相关。2、利用te对时间t的折线图进行判断。(1)当te随t逐次而变动时,te开始为正,随后几个也为正;te出现负值,随后几个也出现负值,则随机误差存在正自相关。(2)当te随t逐次而变动时,te不断地改变符号,则随机误差存在负自相关。二、D-W检验法该方法为DurbinJ和WatsonGS(1951)基于残差序列te与1te之间的相关系数ˆ提出检验的D-W统计量。1、D-W检验的适用条件。(1)解释变量非随机。(2)tu~tttuu1,且t满足基本假定。(3)线性回归模型不存在如下形式ttttuYXY1321如果出现这种情况,应用Durbin-H检验,将在第七章介绍。2、D-W统计量的构成。(1)提出假设:0:;0:10HH(2)构造D-W检验统计量,记为d,即211ˆ),ˆ1(2ttteeed其中。推导过程见教科书。3、运用D-W检验判断一阶自相关的区域。8(1)当0ˆ时,d=2,则tu无一阶自相关。(2)当1ˆ时,d=0,则tu有完全一阶正自相关。(3)当1ˆ时,d=4,则tu有完全一阶负自相关。(4)通常情况下,当ˆ<1时,有0<d<4。当d落在0到4范围内时,有如下判断区域:当0<d<dL时,存在一阶正自相关;当dL<d<dU时,不能判定存在自相关;当dU<d<4-dU时,不存在一阶自相关;当4-dU<d<4-dL时,不能判定存在自相关;当4-dL<d<4时,存在一阶负自相关。4、运用D-W检验应注意的问题。(1)由教科书上的图形可知,在d=2的附近,有一个较大的无自相关区域,所以通常当d在2的左右时,可以不用查表就判断出随机误差不存在自相关。(2)D-W检验存在不能判定区域,这时可以用扩大样本容量或改用其它检验方法(如D-W检验的修正方法,参见教材第167页)。(3)要求样本容量至少为15,否则很难对自相关的存在作出准确判断。(4)D-W检验不能适用对高阶自相关现象进行检验。5、补充检验方法——Breusch-Godfrey(简称BG检验)。设模型为0:10221121ptptpttttttHvuuuuuXY要求tv满足基本假定。检验过程如下:(1)估计参数建立样本回归模型,得残差te。(2)求te对解释变量tX和残差序列滞后值pttteee,,,21得辅助回归,即001122ttttptpteXuuuv(3)计算可决系数2R,并求统计量2nR,使得)(~22pnR,其中p为残9差序列的滞后阶数。(4)给定显著性水平,查卡方分布表,得临界值2()p。如果2nR大于临界值2()p,则拒绝原假设,表明随机误差存在自相关性。BG检验的特点是:可判断高阶自相关,操作简单可靠。6、举例。中国城乡居民储蓄存款与GDP的关系,用Y表示中国城乡居民储蓄存款,X表示GDP指数。第四节自相关的修正修正自相关性方法的基本思想是,通过一定的数学变换,如差分法将模型中序列存在自相关转换不存在无自相关,然后再对模型中的未知参数进行估计。一、已知自相关系数1、广义差分法。设模型为tttttttuuuuXY121~,其中,t满足基本假定。差分过程如下tttttttttttttttXYuuXXYYuXYuXY2`1112111121111211)()()1(由于t满足基本假定,所以对差分后的模型可施用最小二乘法进行参数的估计。上述方法称为广义差分法。注意广义差分以后对缺失值的补充。2、广义差分法的特例(1)一阶差分估计法(=1),由广义差分式12112111(),,ttttttttttttttttYYXXuuYXYYYXXXuu10(2)移动平均回归模型(=-1)。留为作业请大家完成。二、自相关系数未知在这种情况下,需要先求出的估计值ˆ,然后再用上述广义差分法建立模型。1、用D-W统计量求ˆ。在大样本的情况下,利用D-W统计量,有ˆˆ2(1)12dd有了ˆ,则可利用广义差分法对模型的参数进行估计。2、科克兰内-奥克特法(Cochrane-Orcutt,又称迭代估计法)。这种方法是经过反复计算后,以寻找出一个更好的估计值ˆ,直到达到修正自相关为止。1212(1)(1)(1)11(1)(1)