时间序列数据的各种问题的处理

khufu
0 ℃
2020-09-21

整理文档很辛苦，赏杯茶钱您下走！

还剩 ... 页未读，继续阅读 >>

免费阅读已结束，点击下载阅读编辑剩下 ... 页

阅读已结束，您可以下载文档离线阅读编辑

资源描述

1要点平稳性的定义平稳性的检验方法（ADF检验）伪回归的定义协整的定义及检验方法（AEG方法）误差修正模型的含义及表示形式2第一节随机过程和平稳性原理一、随机过程一般称依赖于参数时间t的随机变量集合{}为随机过程。例如，假设样本观察值y1，y2…,yt是来自无穷随机变量序列…y-2,y-1,y0,y1,y2…的一部分，则这个无穷随机序列称为随机过程。ty3随机过程中有一特殊情况叫白噪音，其定义如下：如果随机过程服从的分布不随时间改变，且()0tEy（对所有t）22yvar()()ttyEy常数（对所有t）cov(,)(*)0tstsyyEyy（）ts那么，这一随机过程称为白噪声。4二、平稳性原理如果一个随机过程的均值和方差在时间过程上都是常数，并且在任何两时期的协方差值仅依赖于该两时期间的距离或滞后，而不依赖于计算这个协方差的实际时间，就称它为平稳的。5平稳随机过程的性质：均值（对所有t）方差（对所有t）协方差（对所有t）其中即滞后k的协方差[或自(身)协方差]，是和，也就是相隔k期的两值之间的协方差。()tEy22var()()ttyEy[()()]kttkEyyktytky6三、伪回归现象将一个随机游走变量（即非平稳数据）对另一个随机游走变量进行回归可能导致荒谬的结果，传统的显著性检验将告知我们变量之间的关系是不存在的。有时候时间序列的高度相关仅仅是因为二者同时随时间有向上或向下变动的趋势，并没有真正的联系。这种情况就称为“伪回归”（SpuriousRegression）。7第二节平稳性检验的具体方法一、单位根检验（一）单位根检验的基本原理DavidDickey和WayneFuller的单位根检验（unitroottest）即迪基——富勒（DF）检验，是在对数据进行平稳性检验中比较经常用到的一种方法。8DF检验的基本思想：从考虑如下模型开始：1tttYYu（5.1）其中即前面提到的白噪音（零均值、恒定方差、非自相关）的随机误差项。tu9由式(5.1),我们可以得到：121tttYYu(5.2)232tttYYu(5.3)…TT-1TtttYYu(5.4)10依次将式(5.4)…(5.3)、(5.2)代入相邻的上式，并整理，可得：T2TtT12T...tttttYYuuuu（5.5）根据值的不同，可以分三种情况考虑：（1）若＜1，则当T→∞时，→0，即对序列的冲击将随着时间的推移其影响逐渐减弱，此时序列是稳定的。T11（2）若＞1，则当T→∞时，→∞，即对序列的冲击随着时间的推移其影响反而是逐渐增大的，很显然，此时序列是不稳定的。（3）若=1，则当T→∞时，=1，即对序列的冲击随着时间的推移其影响是不变的，很显然，序列也是不稳定的。TT12对于式（5.1），DF检验相当于对其系数的显著性检验，所建立的零假设是：H0：如果拒绝零假设，则称Yt没有单位根，此时Yt是平稳的；如果不能拒绝零假设，我们就说Yt具有单位根，此时Yt被称为随机游走序列（randomwalkseries）是不稳定的。113方程（5.1）也可以表达成：11(1)tttttYYuYu（5.6）其中=-，△是一阶差分运算因子。此时的零假设变为：H0：=0。注意到如果不能拒绝H0，则=是一个平稳序列，即一阶差分后是一个平稳序列，此时我们称一阶单整过程（integratedoforder1）序列，记为I(1)。tYtY1tYtYtutY14I(1)过程在金融、经济时间序列数据中是最普遍的，而I(0)则表示平稳时间序列。从理论与应用的角度，DF检验的检验模型有如下的三个：11(1)ttttttYYuYYu即（5.7）1111(1)ttttttYYuYYu即（5.8）121121(1)ttttttYtYuYtYu即（5.9）15其中t是时间或趋势变量，在每一种形式中，建立的零假设都是：H0：或H0：，即存在一单位根。（5.7）和另外两个回归模型的差别在于是否包含有常数（截距）和趋势项。如果误差项是自相关的，就把（5.9）修改如下：101211mttititiYtYY（5.10）16式（5.10）中增加了的滞后项，建立在式（5.10）基础上的DF检验又被称为增广的DF检验（augmentedDickey-Fuller，简记ADF）。ADF检验统计量和DF统计量有同样的渐近分布，使用相同的临界值。tY17（二）ADF检验模型的确定首先，我们来看如何判断检验模型是否应该包含常数项和时间趋势项。解决这一问题的经验做法是：考察数据图形其次，我们来看如何判断滞后项数m。在实证中，常用的方法有两种：18（1）渐进t检验。该种方法是首先选择一个较大的m值，然后用t检验确定系数是否显著，如果是显著的，则选择滞后项数为m;如果不显著，则减少m直到对应的系数值是显著的。（2）信息准则。常用的信息准则有AIC信息准则、SC信息准则，一般而言，我们选择给出了最小信息准则值的m值19二、非平稳性数据的处理一般是通过差分处理来消除数据的不平稳性。即对时间序列进行差分，然后对差分序列进行回归。对于金融数据做一阶差分后，即由总量数据变为增长率，一般会平稳。但这样会让我们丢失总量数据的长期信息，而这些信息对分析问题来说又是必要的。这就是通常我们所说的时间序列检验的两难问题。20第三节协整的概念和检验一、协整的概念和原理有时虽然两个变量都是随机游走的，但它们的某个线形组合却可能是平稳的。在这种情况下，我们称这两个变量是协整的。比如：变量Xt和Yt是随机游走的，但变量Zt=Xt+Yt可能是平稳的。在这种情况下，我们称Xt和Yt是协整的，其中称为协整参数（cointegratingparameter）。21为什么会有协整关系存在呢？这是因为虽然很多金融、经济时间序列数据都是不平稳的，但它们可能受某些共同因素的影响，从而在时间上表现出共同的趋势，即变量之间存在一种稳定的关系，它们的变化受到这种关系的制约，因此它们的某种线性组合可能是平稳的，即存在协整关系。22假如有序列Xt和Yt，一般有如下性质存在：(1)如果Xt~I(0)，即Xt是平稳序列，则a+bXt也是I(0)；(2)如果Xt~I(1)，这表示Xt只需经过一次差分就可变成平稳序列。那么a+bXt也是I(1)；(3)如果Xt和Yt都是I(0)，则aXt+bYt是I(0)；23（4）如果Xt~I(0)，Yt~I(1)，则aXt+bYt是I(1)，即I(1)具有占优势的性质。（5）如果Xt和Yt都是I(1)，则aXt+bYt一般情况下是I(1)，但不保证一定是I(1)。如果该线性组合是I(0)，Xt和Yt就是协整的，a、b就是协整参数。24二、协整检验的具体方法（一）EG检验和CRDW检验假如Xt和Yt都是I(1)，如何检验它们之间是否存在协整关系，我们可以遵循以下思路：首先用OLS对协整回归方程进行估计。然后，检验残差是否是平稳的。因为如果Xt和Yt没有协整关系，那么它们的任一线性组合都是非平稳的，残差也将是非平稳的。tetetttyx25检验是否平稳可以采用前文提到的单位根检验，但需要注意的是，此时的临界值不能再用(A)DF检验的临界值，而是要用恩格尔和格兰杰（EngleandGranger）提供的临界值，故这种协整检验又称为（扩展的）恩格尔格兰杰检验(简记(A)EG检验）。te26此外，也可以用协整回归的Durbin-Watson统计检验（CointegrationregressionDurbin-Watsontest,简记CRDW）进行。CRDW检验构造的统计量是：212()()ttteeDWe对应的零假设是：DW=027若是随机游走的，则的数学期望为0，所以Durbin-Watson统计量应接近于0，即不能拒绝零假设；如果拒绝零假设，我们就可以认为变量间存在协整关系。上述两种方法存在如下的缺点：（1）CRDW检验对于带常数项或时间趋势加上常数项的随机游走是不适合的，因此这一检验一般仅作为大致判断是否存在协整的标准。（2）对于EG检验，它主要有如下的缺点：te1()ttee28①当一个系统中有两个以上的变量时，除非我们知道该系统中存在的协整关系的个数，否则是很难用EG法来估计和检验的。因此，一般而言，EG检验仅适用于包含两个变量、即存在单一协整关系的系统。②仿真试验结果表明，即使在样本长度为100时，协整向量的OLS估计仍然是有偏的，这将会导致犯第二类错误的可能性增加，因此在小样本下EG检验结论是不可靠的。29（二）Johansen协整检验。（1）Johansen协整检验的基本思想其基本思想是基于VAR模型将一个求极大似然函数的问题转化为一个求特征根和对应的特征向量的问题。下面我们简要介绍一下Johansen协整检验的基本思想和内容：30对于如下的包含g个变量，k阶滞后项的VAR模型：t1t-12t-2kt-ktyy+y+...y+u（5.11）假定所有的g个变量都是I(1)即一阶单整过程。其中，yt、yt-1…yt-k为g×1列向量，β1β2…βk为g×g系数矩阵，为白噪音过程的随机误差项组成的g×1列向量。tu31对式5.11做适当的变换，可以得到如下的以VECM形式表示的模型：tt-k1t-12t-2k-1t-(k-1)tyy+y+y+...y+u（5.12）其中，Ig为g阶单位矩阵，kigj1()Iiijgj1()I32我们所感兴趣的是系数矩阵，它可以看作是一个代表变量间长期关系的系数矩阵。因为在长期达到均衡时，式5.12所有的差分变量都是零向量，中随机误差项的期望值为零，因此我们有=0，表示的是长期均衡时变量间的关系。tut-ky33对变量之间协整关系的检验可以通过计算系数矩阵的秩及特征值来判断。将系数矩阵的特征值按照从大到小的顺序排列，即：。如果变量间不存在协整关系（即长期关系），则的秩就为零。12g...34Johansen协整检验有两个检验统计量：①迹检验统计量：，其中r为假设的协整关系的个数，为的第i个特征值的估计值（下同）。对应的零假设是：H0：协整关系个数小于等于r；被择假设：H1：协整关系个数大于r。②最大特征值检验统计量：对应的零假设：H0：协整关系个数等于r；相应的被择假设：H1:协整关系个数为r+1。tracegtraceii=r+1ˆ=-Tln(1-)iˆmaxmaxr+1ˆ(r,r+1)=-Tln(1-)35首先看，迹检验实际上是一个联合检验：，因为当时，也为零，且在范围内，越大，越小，越大。如果大于临界值，则拒绝零假设，说明存在的协整个数大于r，这时应继续检验新的零假设：协整关系个数小于等于r+1…直至小于临界值。tracer+1r+2g===0...=i=0iln(1-)i01iiln(1-)tracetracetrace36再来看。当大于临界值时，我们拒绝协整关系个数等于r的原假设，然后继续检验新的假设：协整关系个数为r+1，…，直到小于临界值。maxmaxmaxJohansen协整检验的临界值已由Johansen给出。在实际应用中，上述两个检验可以同时使用，一般而言，两种检验给出的结果是相同的，但也可能会给出不同的结论。37（2）Johansen协整检验模型形式的确定。Johansen协整检验方程形式的确定包括两部分：一是确定VECM模型和是否应包含常数项和时间趋势项；二是确定滞后项数（即k值）。对于前者，