第十章误差项自相关与异方差第一节误差项自相关及其影响第二节误差项自相关的检验第三节误差项自相关问题的处理第四节时间序列中的异方差*机动目录上页下页返回结束2021年1月28日山东财经大学统计学院计量经济教研室第2页学习本章后,您应该做到:1.理解误差项自相关的概念、产生的原因及其对回归模型的估计产生的影响;2.理解误差项自相关的检验方法和原理,能借助于EViews软件对具体模型进行检验;3.了解误差项自相关问题的补救方法,理解广义差分法的原理,掌握EViews软件的具体应用操作;4.了解时间序列数据中的异方差问题;5.理解ARCH模型的特点,掌握模型中ARCH效应的检验方法。学习重点与难点理解误差项自相关的概念;掌握误差项自相关的检验方法和补救措施;理解时间序列模型的异方差的特殊性。机动目录上页下页返回结束2021年1月28日山东财经大学统计学院计量经济教研室第3页由于时间序列数据按照观测时间的先后排序,而对于变量采集其连续的观测结果很可能表现出内在的相关,当采集频率较高时尤其明显。经常关注股票市场或者外汇市场的人们都知道,短期内接连的上涨或下跌是常见现象。误差项不存在自相关(序列相关)的假定在这种情况下经常被发现是不合理的。在截面数据中,由于通常假定搜集的数据是在相同时间对某一总体中的个体进行随机抽样获得的,所以没有理由认为不同观测值之间存在内在的相关关系。因而误差项自相关问题主要存在于时间序列数据中。截面数据中存在的异方差问题在时间序列数据中也有可能存在,而且还有某些特殊性。机动目录上页下页返回结束2021年1月28日山东财经大学统计学院计量经济教研室第4页第一节误差项自相关及其影响本章我们将研究时间序列数据模型中的自相关问题。为了讨论和理解方便,按照时间序列的习惯做法,我们用t(t=0,1,2…)表示时间序列数据的不同的观测点,称之为“期”,将其作为随机项或其它变量的下标,如ut表示u在第t期所取的值,ut-1表示u在第t-1期所取的值,等等。一、自相关在时间序列中,自相关(Autocorrelation)可以理解为按一定时间顺序排列的观测序列中各观测值之间存在相关性。例如时间序列数据中和相关,则称该序列存在j阶自相关。j=1时,称之存在1阶自相关,j=2时,则为存在2阶自相关。txtjx机动目录上页下页返回结束2021年1月28日山东财经大学统计学院计量经济教研室第5页若违背这个假定,Cov(ut,us)≠0,即u在不同观测点下的取值相关连,则称随机误差项u存在序列相关(SeriesCorrelation)或自相关(Autocorrelation)。在时间序列回归中,经典线性回归模型的假定TS.5和TS.,都假定随机误差项相互之间不存在序列自相关,即Cov(ut,us)=0(ts,t,s=1,2,…,n)6'自相关的程度用自相关系数表示。为了不与自回归系数混淆,本节用符号表示自相关系数。随机误差项与滞后一期的的自相关系数为rtu1tu)var()var(),cov(11ttttuuuu(10.2)机动目录上页下页返回结束2021年1月28日山东财经大学统计学院计量经济教研室第6页(10.2)式定义的自相关系数与普通相关系数的公式形式相同,的取值范围为。由于式中ut-1是ut滞后一期的随机误差项,因此,将上式计算的自相关系数称为一阶自相关系数。r11rr根据自相关系数的符号可以判断自相关的状态,如果0,则ut与ut-1为负相关;如果0,则ut与ut-1为正相关;如果=0,则ut与ut-1为不相关;rrr机动目录上页下页返回结束2021年1月28日山东财经大学统计学院计量经济教研室第7页二、自相关产生的原因(一)解释变量的遗漏或省略自相关问题是利用时间序列数据构建结构模型(因果关系模型)时面临的主要问题。自相关产生的原因很多,主要有:如果模型中省略了某些应该被包含到模型中的重要解释变量,会产生系统误差,这种误差存在于随机误差项中,从而带来了误差项自相关。机动目录上页下页返回结束2021年1月28日山东财经大学统计学院计量经济教研室第8页这种由于设定误差造成的自相关,在计量经济分析中经常可能发生。例如,本来应该用两个解释变量去解释y,即01122ttttyxxv(10.3)而建立模型时,模型设定为011tttyxu(10.4)这样,的影响在便归入到随机误差项ut中,由于x2t在不同观测点上是相关的,就造成了ut是自相关的。2ttxy对在自回归模型中,由于随机变量的动态过程没有被完整设定,也会导致误差项序列相关。例如,“真实”的模型是AR(2):01122ttttyyyu2~...(0,)tuuiid机动目录上页下页返回结束2021年1月28日山东财经大学统计学院计量经济教研室第9页但我们设定的回归方程是AR(1):011tttyyv显然21tttvyu由于时间序列是AR(2)过程,所以,误差项肯定表现为自相关。ty更为普遍的是,在建立回归模型时,总是要略去某些次要的解释变量。如果略去的解释变量有一些存在自相关,它必然在随机项中反映出来,从而使随机项具有自相关性。机动目录上页下页返回结束2021年1月28日山东财经大学统计学院计量经济教研室第10页(二)回归模型函数形式设定错误若回归模型所采用的数学形式与所研究问题的真实关系不一致,随机误差项就可能存在自相关。例如某些商品的销售量受季节的影响。设y代表销售量,t代表时间,则y与t的真实关系是周期函数形式。如果选用了线性函数形式,其周期项就并入了误差项之中,误差项在时间上是相关的。(三)原始数据的处理变换在实证分析中,所用数据有的是由原始数据经过一定的变化处理得到的。例如有些季度数据来自于月度数据的平均,有些年度数据是由季度数据或者月度数据计算得到的,这种处理可能会产生系统性信息使误差项产生自相关;机动目录上页下页返回结束2021年1月28日山东财经大学统计学院计量经济教研室第11页有时数据来源于某种特殊假定前提下的推测,例如想要获得我国第五次人口普查(2000年11月1日)与第六次人口普查(2010年11月1日)之间某年的人口数据,或者第六次人口普查(2010年11月1日)之后某年如2012年的人口数据,就需要运用一些假定与技术进行推测,这些技术会带来原始数据所没有的系统性信息导致自相关。另外,建模过程中有时需要对原序列进行变换,例如由水平形式变为一阶差分形式,原模型中使用原始数据误差项不存在自相关,而差分变换后数据的误差项就可能导致自相关的产生。因为,尽管1cov,)0ttuu(但1cov,)ttuu(1covttuu(,12)ttuu1vartu()0。机动目录上页下页返回结束2021年1月28日山东财经大学统计学院计量经济教研室第12页(四)经济变量的惯性作用大多数的经济时间序列都有一个明显的特点,就是他们的惯性。由于经济变量的惯性,使得许多经济变量前后期总是相互关联的。例如GDP、价格指数、生产、就业和失业等时间序列都呈现循环波动。在经济复苏时,大多数的经济序列数据从经济衰退的最低点逐年开始上升,这是由经济的内在规律驱动造成的。因此,在有关时间序列数据的回归中,连续的观测值很可能是自相关的。如果被解释变量不同时期的取值是相关联的,也就是现期的取值受上期或上几期取值的影响,即存在自相关。由于被解释变量与随机项有相同的分布,被解释变量的自相关必然意味着随机项的自相关。机动目录上页下页返回结束2021年1月28日山东财经大学统计学院计量经济教研室第13页(五)误差项本身存在自相关在许多情况下,随机因素(如洪水、瘟疫、战争、地震等)所产生的影响,常常持续很长时间。例如,严重的偶发事件(比如汶川地震、日本福岛核泄漏等)不仅对当年的生产、生活造成影响,而且也影响会持续到至少3-5年以后,这样自然就导致了随机误差项的自相关,这种由偶发性事件引起的自相关也称为“纯粹自相关”。机动目录上页下页返回结束2021年1月28日山东财经大学统计学院计量经济教研室第14页三、误差项自相关对回归的影响如果模型中的随机项存在自相关,仍然采用普通最小二乘法OLS,会有以下后果:1.斜率系数依然是线性的和无偏的,即。因为参数OLSE的线性和无偏性不需要ut无自相关假定(假定TS.5和TS.)的支持。但OLSE有效性、渐进有效性需要TS.5和TS.的支持,所以自相关情况下,OLSE不具备有效性和渐进有效性,即不具有最小方差性。这说明,当误差项存在自相关时,OLSE不再是最佳线性无偏估计量(BLUE)。一般情况下,参数估计值的真实方差会被低估,即使大样本与于事无补。ˆjˆ()jjE6'6'机动目录上页下页返回结束2021年1月28日山东财经大学统计学院计量经济教研室第15页用来估计随机项的方差会严重低估真实的方差,进而低估回归参数的方差公式和标准差,从而过高估计t统计量的值,夸大所估计参数的显著性,对本来不重要的解释变量可能误认为重要而被保留。这时通常的回归系统显著性的t检验将失去意义。类似地,由于误差项自相关,参数的OLSE是无效的,使得F检验和检验不可靠。22.最小二乘估计量的方差估计是有偏的。机动目录上页下页返回结束2021年1月28日山东财经大学统计学院计量经济教研室第16页模型预测的精度决定于抽样误差和总体误差项的方差。抽样误差来自于对估计量的精度,在自相关情形下,的方差的最小二乘估计变得不可靠,由此必定加大抽样误差。同时,在自相关情形下,对的估计也会不可靠。由此可看出,影响预测精度的两大因素都因自相关的存在而加大不确定性,使预测的置信区间不可靠,从而降低了预测的精度。2ujˆjˆ2u1/ˆ22kTetu3.因变量的预测精度降低。机动目录上页下页返回结束2021年1月28日山东财经大学统计学院计量经济教研室第17页第二节误差项自相关的检验随机误差项自相关问题的实质在于随机误差项序列的前后数据具有相关性。但真实的是无法观测的,与横截面数据的异方差分析类似,由于残差可看作的估计值,我们可以利用从OLS法中得到的样本残差序列来判断误差项是否自相关问题。下面介绍几种常用的自相关检验方法。tututetute一、图示检验法根据给定的样本数据,应用普通最小二乘法回归后,求出残差(t=1,2,…,n)。然后可采用两种绘图方法。te机动目录上页下页返回结束2021年1月28日山东财经大学统计学院计量经济教研室第18页(一)绘制et、et-1的散点图做出的散点图如图10-1。如果大部分散点落在Ⅰ、Ⅲ象限,如图A所示。那么et和et-1就是正相关,这表明随机项存在正的自相关;如果大部分点落在Ⅱ、Ⅳ象限,如图B所示,那么et和et-1就是负相关,这表明随机项存在负的自相关。etet-1etet-1A误差项一阶正自相关B误差项一阶负自相关12231(,),(,),,(,)nneeeeeetutu机动目录上页下页返回结束2021年1月28日山东财经大学统计学院计量经济教研室第19页(二)按照时间顺序绘制残差et的图形做出et(t=1,2,…,n)随时间t变化的图形。如果随t的变化et并不存在明显的规律性,则ut是非自相关的;如果随着t的变化et是几个正的后面跟着几个负的,呈现较长周期的循环,则et(ut)之间存在正的自相关(图A);如果随着t的变化et不断地改变符号,呈现锯齿型,则判定et之间存在负自相关,表明ut存在负自相关(图B)。tetettA误差项一阶正自相关B误差项一阶负自相关机动目录上页下页返回结束2021年1月28日山东财经大学统计学院计量经济教研室第20页二、解释变量严格外生条件下,误差项一阶自相关检验当时间序列回归方程的解释变量严格外生于误差项时(类似的方程显然不符合要求),如果总体回归模型(PRF)的随机误差项之间存在一阶自相关形式,可以写成如下的误差项一阶自回归方程,记为AR(1):01122ttttyyyu