时间序列分析word版

整理文档很辛苦,赏杯茶钱您下走!

免费阅读已结束,点击下载阅读编辑剩下 ...

阅读已结束,您可以下载文档离线阅读编辑

资源描述

第2章时间序列的预处理拿到一个观察值序列之后,首先要对它的平稳性和纯随机性进行检验,这两个重要的检验称为序列的预处理。根据检验的结果可以将序列分为不同的类型,对不同类型的序列我们会采用不同的分析方法。2.1平稳性检验2.1.1特征统计量平稳性是某些时间序列具有的一种统计特征。要描述清楚这个特征,我们必须借助如下统计工具。一、概率分布数理统计的基础知识告诉我们分布函数或密度函数能够完整地描述一个随机变量的统计特征。同样,一个随机变量族的统计特性也完全由它们的联合分布函数或联合密度函数决定。对于时间序列{tX,t∈T},这样来定义它的概率分布:任取正整数m,任取mttt,,,21∈T,则m维随机向量(mtttXXX,,,21)’的联合概率分布记为),,,(mtttxxxFm21,,,21,由这些有限维分布函数构成的全体。{),,,(mtttxxxFm21,,,21,∀m∈正整数,∀mttt,,,21∈T}就称为序列{tX}的概率分布族。概率分布族是极其重要的统计特征描述工具,因为序列的所有统计性质理论上都可以通过概率分布推测出来,但是概率分布族的重要性也就停留在这样的理论意义上。在实际应用中,要得到序列的联合概率分布几乎是不可能的,而且联合概率分布通常涉及非常复杂的数学运算,这些原因使我们很少直接使用联合概率分布进行时间序列分析。二、特征统计量一个更简单、更实用的描述时间序列统计特征的方法是研究该序列的低阶矩,特别是均值、方差、自协方差和自相关系数,它们也被称为特征统计量。尽管这些特征统计量不能描述随机序列全部的统计性质,但由于它们概率意义明显,易于计算,而且往往能代表随机序列的主要概率特征,所以我们对时间序列进行分析,主要就是通过分析这些统计量的统计特性,推断出随机序列的性质。1.均值对时间序列{tX,t∈T}而言,任意时刻的序列值tX都是一个随机变量,都有它自己的概率分布,不妨记为)(xFt。只要满足条件)(-xxdFt就一定存在着某个常数t,使得随机变量tX总是围绕在常数值t附近做随机波动。我们称t为序列{tX}在t时刻的均值函数。t=tEX=)(-xxdFt当t取遍所有的观察时刻时,就得到一个均值函数序列{t,t∈T}。它反映的是时间序列{tX,t∈T}每时每刻的平均水平。2.方差当)(-xxdFt时,可以定义时间序列的方差函数用以描述序列值围绕其均值做随机波动时的平均波动程度。)()()(22t2txdFxXEDXtttt同样,当t取遍所有的观察时刻时,我们得到一个方差函数序列{Ttt,2}。3.自协方差函数和自相关系数类似于协方差函数和相关系数的定义,在时间序列分析中我们定义自协方差函数(autocovariancefunction)和自相关系数(autocorrelationcoefficient)的概念。对于时间序列{tX,t∈T},任取t,s∈T,定义γ(t,s)为序列{tX}的自协方差函数:))(()st(ststXXE,定义),(st为时间序列{tX}的自相关系数,简记为ACF。stDXDXstst),(),(之所以称它们为自协方差函数和自相关系数,是因为通常的协方差函数和相关系数度量的是两个不同事件彼此之间的相互影响程度,而自协方差函数和自相关系数度量的是同一事件在两个不同时期之间的相关程度,形象地讲就是度量自己过去的行为对自己现在的影响。2.1.2平稳时间序列的定义平稳时间序列有两种定义,根据限制条件的严格程度,分为严平稳时间序列和宽平稳时间序列。一、严平稳所谓严平稳(strictlystationary)就是一种条件比较苛刻的平稳性定义,它认为只有当序列所有的统计性质不会随时间的推移而发生变化时,该序列才能被认为平稳。而我们知道,随机变量族的统计性质完全由它们的联合概率分布族决定。所以严平稳时间序列的定义如下:定义2.1设{tX}为一时间序列,对任意正整数m,任取mttt,,,21∈T,对任意整数,有),,,(mtttxxxFm21,,,21=),,,(mtttxxxFm21,,,21则称时间序列{tX}为严平稳时间序列。前面说过,在实践中要获得随机序列的联合分布是一件非常困难的事,而且即使知道随机序列的联合分布,计算和应用也非常不便。所以严平稳时间序列通常只具有理论意义,在实践中用得更多的是条件比较宽松的宽平稳时间序列。二、宽平稳宽平稳(weakstationary)是使用序列的特征统计量来定义的一种平稳性。它认为序列的统计性质主要由它的低阶矩决定,所以只要保证效率低阶矩平稳(二阶),就能保证序列的主要性质近似稳定。定义2.2如果{tX}满足如下三个条件:(1)任取t∈T,有2TEX(2)任取t∈T,有,tEX为常数;(3)任取t,s,k∈T,且k+s-t∈T,有γ(t,s)=γ(k,k+s-t)则称{tX}为宽平稳时间序列。宽平稳也称为弱平稳或二阶平稳(second-orderstationary)。显然,严平稳比宽平稳的条件严格。严平稳是对序列联合分布的要求,以保证序列所有的统计特征都相同;而宽平稳只要求序列二阶平稳,对于高于二阶的矩没有任何要求。所以通常情况下,严平稳序列也满足宽平稳条件,而宽平稳序列不能反推严平稳成立。但这不是绝对的,两种情况都有特例。比如服从柯西分布的严平稳序列就不是宽平稳序列,因为它不存在一、二阶矩,所以无法验证它二阶平稳。严格地讲,只要存在二阶矩的严平稳序列才能保证它一定也是宽平稳序列。宽平稳一般推不出严平稳,但当序列服从多元正态分布时,则二阶平稳可以推出严平稳。定义2.3时间序列{tX}称为正态时间序列,如果任取正整数n,任取n21ttt,,,∈T,相对应的有限维随机变量n21...XXX,,,服从n维正态分布,密度函数为:)]~~()'~~(21exp[||)2()~(1212,...,,21nnnnnnnntttXXXfn其中,'~21),,,(nnXXXX;'~21),,,(nnEXEXEX;n为协方差阵:),(...),(),(............),(...),(),(),(...),(),(112121211111nnnnnnntttttttttttttttttt从正态随机序列的密度函数可以看出,它的n维分布仅由均值向量和协方差阵决定,即对正态随机序列而言,只要二阶矩平稳了,就等于分布平稳了,所以宽平稳的正态序列一定是严平稳时间序列。对于非正态过程,就没有这个性质了在实际应用中,研究最多的是宽平稳随机序列,以后见到平稳随机序列,如果不加特别注明,指的都是宽平稳随机序列。如果序列不满足平稳条件,就称为非平稳序列。2.1.3平稳时间序列的统计性质根据平稳时间序列的定义,可以推断出它一定具有如下两个重要的统计性质。一、常数均值TtEXt,二、自协方差函数和自相关系数只依赖于时间的平移长度而与时间的起止点无关Tksttskkst,,),,(),(根据这个性质,可以将自协方差函数由二维函数),(st简化为一维函数)(ts:Tststts,),,()(由此引出延迟k自协方差函数的概念。定义2.4对于平稳时间序列{tX,t∈T},任取t(t+k∈T),定义γ(k)为时间序列{tX}的延迟k自协方差函数:),()(kttk根据平稳序列的这个性质,容易推断出平稳随机序列一定具有常数方差:TtttDXt),0(),(由延迟k自协方差函数的概念可以等价得到延迟k自相关系数的概念:)0()(),(kDXDXkttkttk容易验证和相关系数一样,自相关系数具有如下三个性质:(1)规范性10且k1k,(2)对称性kk(3)非负定性对任意正整数m,相关阵m为对称非负定阵。021201110mmmmm值得注意的是,k除了具有上述三个性质外,还具有一个特别的性质:对应模型的非唯一性。一个平稳时间序列一定唯一决定了它的自相关函数,但它的自相关函数未必唯一对应着一个平稳的时间序列。我们在后面的章节中将证明这一点。这个性质就给我们根据样本的自相关系数的特点来确定模型增加了一定的难度。2.1.4平稳时间序列的意义时间序列分析方法作为数理统计学的一个分支,遵循数理统计学的基本原理,都是利用样本信息来推测总体信息。传统的统计分析通常都拥有如下数据结构,见表2-1。表2-1随机变量样本1X...mX111x...1mx212x...2mx.........nn1x...nmx根据数理统计学常识,显然要分析的随机变量越少越好(m越小越好),而每个变量获得的样本信息越多越好(n越大越好)。因为随机变量越少,分析的过程越简单,而样本容量越大,分析的结果就会越可靠。但是时间序列分析的数据结构有它的特殊性。对随机序列...}X...XX{...t21,,,,,而言,它在任意时刻t的序列值tX都是一个随机变量,而且由于时间的不可重复性,该变量在任意一个时刻只能获得唯一的样本观察值。因为时间序列分析的数据结构如下,见表2-2。表2-2随机变量样本...1X...tX...1...1x...tx...由于样本信息太少,如果没有其他的辅助信息,通常这种数据结构是没有办法进行分析的。而序列平稳性概念的提出可以有效地解决这个问题。在平稳序列场合,序列的均值等于常数意味着原本含有可列多个随机变量的均值数列Ttt,变成了一个常数序列Tt,原本每个随机变量的均值)(Ttt只能依靠唯一的一个样本观察值tx去估计ttxˆ现在由于)(Ttt,于是每一个样本观察值)(Ttxt,都变成了常数均值的样本观察值nxxnii1ˆ这极大地减少了随机变量的个数,并增加了待估参数的样本容量。换句话说,这大大降低了时序分析的难度,同时也提高了对均值函数的估计精度。同理,根据平稳序列二阶矩平稳的性质,可以得到基于全体观察样本计算出来的延迟k自协方差函数的估计值nkknxxxxkkntktt0))(()(ˆ1,并进一步推导出总体方差的估计值1)(ˆ120nxxntt和延迟k自相关系数的估计值nkkk0)0(ˆ)(ˆˆ,当延迟阶数k远远小于样本容量n时,nkxxxxxxnttkntkttk0,)())((ˆ1212.1.5平稳性的检验对序列的平稳性有两种检验方法,一种是根据时序图和自相关图显示的特征做出判断的图检验方法;一种是构造检验统计量进行假设检验的方法。图检验方法是一种操作简便、运用广泛的平稳性判别方法,它的缺点是判别结论带有很强的主观色彩。所以最好能用统计检验方法加以辅助判断。目前最常用的平稳性统计检验方法是单位根检验(unitroottest)。由于目前知识的局限性,本章将主要介绍平稳性的图检验方法,单位根检验将在第6章详细介绍。一、时序图检验所谓时序图就是一个平面二维坐标图,通常横轴表示时间,纵轴表示序列取值。时序图可以直观地帮助我们掌握时间序列的一些基本分布特征。根据平稳时间序列均值、方差为常数的性质,平稳序列的时序图应该显示出该序列始终在一个常数值附近随机波动,而且波动的范围有界的特点。如果观察序列的时序图,显示出该序列有明显的趋势性或周期性,那它通常不是平稳序列。根据这个性质,对于很多非平稳序列,可以通过查看它的时序图将其识别出来。例2-1绘制1964-1999年中国纱年产量序列时序图(数据见表A1-4)。时序图如图2-1所示。图2-1中国纱年产量时序图时序图给我们提供的信息非常明确,中国纱年产量序列有明显的递增趋势,所以它不一定不是平稳序列。例2-2绘制1962年1月至1975年12月平均每头奶牛月产奶量序列时序图(数据见

1 / 21
下载文档,编辑使用

©2015-2020 m.777doc.com 三七文档.

备案号:鲁ICP备2024069028号-1 客服联系 QQ:2149211541

×
保存成功