计量经济学—理论·方法·EViews应用郭存芝杜延军李春吉编著电子教案第七章序列相关性◆学习目的通过本章的学习,你可以知道什么是序列相关性,序列相关性产生的原因是什么,序列相关性导致什么样的后果,怎样检验和处理具有序列相关性的模型。◆基本要求1)掌握序列相关性的概念、序列相关性的后果和检验方法;2)了解广义最小二乘法和广义差分法原理;3)能运用广义差分法和广义最小二乘法估计线性回归模型。◆序列相关性及其产生原因◆序列相关性的影响◆序列相关性的检验◆序列相关的补救第七章序列相关性◆案例分析第一节序列相关性及其产生原因—、序列相关性的含义对于多元线性回归模型011221,2,,iiikkiiYXXXin(7-1)在其他假设仍然成立的条件下,随机干扰项序列相关意味着如果仅存在则称为一阶序列相关或自相关(简写为AR(1)),这是常见的一种序列相关问题。1()0,1,2,...,iiEin(7-3)(,)()0CovEijij(7-2)自相关往往可以写成如下形式:(7-4)1,11iii其中称为自协方差系数或一阶自回归系数,i是满足以下标准OLS假定的随机干扰项:2()0,(),(,)0(0)iiiisEVarCovs由于序列相关性经常出现在以时间序列数据为样本的模型中,因此,本节下面将代表不同样本点的下表i用t表示。二、序列相关的原因1.经济数据序列惯性2.模型设定的偏误3.滞后效应4.蛛网现象5.数据的编造1.经济数据序列惯性GDP、价格指数、消费等时间序列数据通常表现为周期循环。当经济衰退的谷底开始复苏时,大多数经济序列开始上升,在上升期间,序列在每一时刻的值都高于前一时刻的值。看来有一种内在的动力驱使这一势头继续下去,直至某些情况出现(如利率或税收提高)才把它拖慢下来。因此,在涉及时间序列的回归中,相继的观测值很可能是相互依赖的。比如:2.模型设定的偏误定义:指所设定的模型“不正确”,主要表现在模型中丢掉了重要的解释变量或模型函数形式有偏误。例1:本来应该估计的模型为0111233tttttYXXX(7-5)但在进行回归时,却把模型设定为如下形式:t011t22ttY=β+βX+βX+ν(7-6)(丢掉了重要的解释变量)2.模型设定的偏误如果(7-5)式是正确的模型,那做(7-6)式的回归就相当于令33tttvX于是误差项v将表现出一种系统性模式,从而形成了自相关。例1:(丢掉了重要的解释变量)2.模型设定的偏误定义:指所设定的模型“不正确”,主要表现在模型中丢掉了重要的解释变量或模型函数形式有偏误。例2:(模型函数形式有偏误)(7-7)在成本—产出研究中,如果真实的边际成本的模型为:0122ttttY=β+βX+βX+μ其中Y代表边际成本,X代表产出。(7-8)01tttYXv但是如果建模时设立了如下回归模型:2.模型设定的偏误例2:(模型函数形式有偏误)因此在(7-8)中,它包含了产出的平方对随机干扰项的系统性影响,随机干扰项呈现序列相关性。tttXv22(7-8)01tttYXv但是如果建模时设立了如下回归模型:3.滞后效应考虑一个消费支出对收入进行回归的时间序列模型,人们常常发现当期的消费支出除了依赖其他当期收入外,还依赖前期的消费支出,即回归模型为:0121ttttCYC(7-9)其中,C是消费,Y是收入。类似(7-9)式的回归模型被称为自回归模型由于心理上、技术上以及制度上的原因,消费者不会轻易改变其消费习惯,如果我们忽视(7-9)式中的滞后消费对当前消费的影响,那所带来的误差项就会体现出一种系统性的模式。注意:4.蛛网现象例如:假定某农产品的供给模型为:01-1tttSP(7-10)假设t时期的价格Pt低于t-1时期的价格Pt-1,农民就很可能决定在时期t+1生产比t时期更少的东西。显然在这种情形中,农民由于在年度t的过量生产很可能在年度t+1消减他们的产量。诸如此类的现象,就不能期望干扰μt是随机,从而出现蛛网式的序列相关。5.数据的编造新生成的数据与原数据间就有了内在的联系,表现出序列相关性。例如:季度数据来自月度数据的简单平均,这种平均的计算减弱了每月数据的波动而引进了数据中的匀滑性,这种匀滑性本身就能使随机干扰项中出现系统性的因素,从而出现序列相关性。利用数据的内插或外推技术构造的数据也会呈现某种系统性的模式。一般经验表明,对于采用时间序列数据做样本的计量经济学模型,由于在不同样本点上解释变量意外的其他因素在时间上的连续性,带来了他们对被解释变量的影响的连续性,所以往往存在序列相关性。第二节序列相关性的影响1.参数估计量非有效2.随机误差项方差估计量是有偏的3.拟合优度检验R2统计量和方程显著性检验F统计量无效4.变量的显著性检验t检验统计量和相应的参数置信区间估计失去意义5.模型的预测失效(,)()0OLSttjttjCovE如果我们在干扰中通过假定引进序列相关,但保留经典模型的全部其他假定,对估计量及其方差来说会出现什么情况呢?1.参数估计量非有效根据OLS估计中关于参数估计量的无偏性和有效性的证明过程可以看出,当计量经济学模型出现序列相关性时,其OLS参数估计量仍然具有线性无偏性,但不具有有效性。因为在有效性证明中我们利用了2()EI(7-11)即同方差和相互独立性条件。而且在大样本情况下,参数估计量虽然具有一致性,但仍然不具有渐近有效性。为了具体说明这一点,我们回到简单的一元回归模型(7-12)01iiiYX为方便我们不妨假定干扰项为(7-4)所示的一阶序列相关:1ttt(7-13)12ˆtttxyx(7-14)对于干扰项为一阶序列相关的一元回归模型采用OLS估计,如以前一样,β1的OLS估计量为:但给定干扰项为一阶序列相关时,1的方差估计量现在为:11ˆ()ARVar1ˆ式中为一阶序列相关时的方差。212ˆ()tVarx(7-16)把该式与没有干扰项自相关情形的通常公式11212212211111222221112ˆ()nnntttttnntttARnnnttttttttxxxxxxVarxxxxx…(7-15)X相比,可以看出前者等于后者加上另一与自相关系数和各期的样本协方差有关的项。2.随机误差项方差估计量是有偏的在存在干扰项序列相关的情况下,随机误差方差的OLS估计量偏离了真实的随机误差项的方差2。以一元回归模型为例,在经典假设情况下,干扰项的OLS方差估计量221ˆ2ntten222ˆ()E是真实的的无偏估计,即有。但若随机误差项存在一阶序列相关则可以证明:22[2/(1)]2ˆ()2nrEn式中1221ntttnttxxxr为X的相继观测值之间的样本相关系数。3.拟合优度检验R2统计量和方程显著性检验F统计量无效由于在序列相关时OLS对随机误差方差估计有偏,结果基于OLS残差平方和计算出来的拟合优度检验统计量R2也失去意义,相应的方程显著性检验统计量F统计量也无效。4.变量的显著性检验t检验统计量和相应的参数置信区间估计失去意义用OLS法估计序列相关的模型得到的随机误差项的方差不仅是有偏的,而且这一偏误也将传递到用OLS方法得到的参数估计量的方差中来,从而使得建立在OLS参数估计量方差基础上的变量显著性检验失去意义。212ˆ()tVarx没有被低估,通常OLS参数估计量的方差式(7-16)2即使随机误差的方差也是存在一阶序列相关时参数估计量方差的偏误估计量。以一元回归模型为例,01iiiYX5.模型的预测失效在存在序列相关时OLS估计的随机误差项方差有偏,参数估计量方差非有效,这样回归模型的被解释变量的预测值及预测区间就不准确,预测精度降低。被解释变量预测值区间与模型参数和随机误差的估计量的方差有关。所以,当模型出现序列相关时,它的预测功能失效。tolsttYYe第三节序列相关性的检验不同的检验方法的共同思路:序列相关性的检验方法有多种,如冯诺曼比检验法、回归检验法、D.W.检验法等。te首先采用普通最小二乘法估计模型,以得到随机干扰项的近似估计量,我们用表示近似估计量:(7-19)然后通过分析这些近似估计量之间的相关性以达到判断随机干扰项是否具有序列相关性的目的。序列相关性的检验方法一、图示法二、回归检验法三、杜宾—沃森检验四、拉格朗日乘子检验一、图示法tttete由于残差可以作为随机误差的估计,因此,如果存在序列相关性,反映出来,因此可以利用的变化来判断随机干扰项的序列必然会由残差项相关性,如图7-1所示。te二、回归检验法,(7-20)(7-21)以te21,ttee等为解释变量,为解释变量,以各种可能的相关变量,诸如建立各种方程:对方程进行估计并进行显著性检验,如果存在某一种函数形式,使得方程显著成立,则说明原模型存在序列相关性。一旦确定了模型存在序列相关性,也就同时知道了相关的形式,而且它适用于任何类型的序列相关性问题的检验。优点:),...,3(,...,221121nteeen)(teettttttt三、杜宾—沃森检验D-W检验是杜宾(J.Durbin)和沃森(G.S.Watson)于1951年提出的一种检验序列自相关的方法。虽然该方法很常用,但它有一些基本假定:(1)回归含有截距项。(2)解释变量X是非随机的,或者在重复抽样中被固定的。t1ttt(3)随机干扰项为一阶自回归形式:。(4)回归模型中不应把滞后应变量作为解释变量之一,即不应出现如下形式模型:011221tttkktttYXXXY(5)没有缺失数据。tntntttteeeDW12212)(0:0H杜宾—沃森针对原假设,即不存在一阶自相关,构造如下统计量:(7-22)2χUdLd检验,它没有唯一的临界值可以导出拒绝或和下限,且这些上下限只与因此D-W检验不同于t、F或接受原假设。但他们成功导出了临界值的上限样本容量n和解释变量的个数有关,而与解释变量的取值无关。杜宾—沃森证明该统计量的分布与出现在给定样本中的X值有复杂的关系,其准确的抽样或概率分布很难得到;又依赖于给定的X的值。因为D.W.值要从中算出,而teteLdUd因此,在运用D-W检验时,只须计算该统计量的值,再根据样本容量n和,然后按下列准则考察和解释变量数目k查D.W.分布表,得到临界值计算得到的D.W.值,以判断模型的自相关状态:若0..LDWd,则存在正自相关;若..LUdDWd,则不确定;若..4UUdDWd,则无自相关;若4..4ULdDWd,则不确定;若4..4LdDW,则存在负自相关。也就是说,当D.W.值在2附近时,模型不存在一阶自相关。例7-1给定一个含有50个观测值的样本和3个解释变量,如果(a)D.W.=1.05,(b)D.W.=1.40,(c)D.W.=2.50,(d)D.W.=3.97你能对自相关的问题说些什么??解:根据D-W检验判断准则可知(b)D.W.=1.40Ld,随机误差项存在一阶正自相关;(d)4Ld=2.58D.W.=3.97,随机误差项存在负一阶自相关。LdUd查D.W.分布表可知,当样本数为n=50,解释变量数k=3时,在5%的为1.42,为1.67。显著性水平下D.W.统计量临界值的下界(a)D.W.=1.05=1.42,因此随机误差项存在正一阶自相关;LdLdUd(c)4=2.58D.W.=2.504=2.33,不能确定随机误差项是否存在一阶自相关;在许多情况下,人们发现上限Ud差不多就是真实的显著性界限,因而,如果D.W.的估计