时间序列分析�直观的讲,时间序列是指随时间变化的,具有随机性的,且前后相互关联的动态数据序列,它是以特定时间间隔而记录的指定变量的一系列取值。�大量的统计指标都是按照年、季、月或日来统计的,随着时间的推移,就形成了这些统计指标的时间序列。�时间系列的分类�时域分析�频域分析中科信软高级技术培训中心-时间序列的平稳化�时间序列数据可以看做是随机过程的一个样本,根据以下三项判断是否平稳。�均值�方差不随时间变化�自相关系数只能与时间间隔有关,而与所处的具体时刻无关中科信软高级技术培训中心-非平稳时间序列建模�非平稳的确定性因素分析�非平稳的随机因素分析中科信软高级技术培训中心-均值非平稳过程�均值非平稳过程指随机过程的均值随均值函数的变化而变化。�我们可以引进两种非常有用的均值非平稳过程:确定趋势模型和随机趋势模型。�(一)确定趋势模型�当非平稳过程均值函数可由一个特定的时间趋势表示时,一个标准的回归模型曲线可用来描述这种现象。.,::,,1010模型来描述前面介绍的可以用程是一个零均值的平稳过其中趋势模型表示如下则原序列可用确定的有服从线性趋势若均值例如ARMAyytxtttttt++=+=ααααµµtttyttxtt+++=++=22102210:,ααααααµ原序列可用下式表示对二次均值函数此外,均值函数还可能是指数函数、正弦————余弦波函数等,这些模型都可以通过标准的回归分析处理。处理方法是先拟合出μμμμtttt的具体形式,然后对残差序列yyyytttt={x={x={x={xtttt-μμμμtttt}}}}按平稳过程进行分析和建模。�(二)随机趋势模型�随机趋势模型又称齐次非平稳ARMA模型。非平稳序列的确定性分析时间序列的分解�Wold分解定理�Cramer分解定理WoldWoldWoldWold分解定理(1938193819381938)�对于任何一个离散平稳过程它都可以分解为两个不相关的平稳序列之和,其中一个为确定性的,另一个为随机性的,不妨记作其中:为确定性序列,为随机序列,它们需要满足如下条件(1)(2)(3)}{txtttVxξ+=}{tV{}tξ∑∞=−=0jjtjtεϕξ∞=∑∞=020,1jjϕϕ{}),0(~2εσεWNtstVEst≠∀=,0),(ε确定性序列与随机序列的定义�对任意序列而言,令关于q期之前的序列值作线性回归其中为回归残差序列,。�确定性序列,若�随机序列,若{}tytytqtqttyyyυααα++++=−−−L1210}{tυ2)(qtVarτυ=2lim0qqτ→∞=)(lim2tqqyVar=∞→τARMAARMAARMAARMA模型分解ttBBxεµ)()(ΦΘ+=确定性序列随机序列CramerCramerCramerCramer分解定理(1961196119611961)�任何一个时间序列都可以分解为两部分的叠加:其中一部分是由多项式决定的确定性趋势成分,另一部分是平稳的零均值误差成分,即}{txtttxεµ+=确定性影响随机性影响taB)(Ψ∑=djjjt0β对两个分解定理的理解�Wold分解定理说明任何平稳序列都可以分解为确定性序列和随机序列之和。它是现代时间序列分析理论的灵魂,是构造ARMA模型拟合平稳序列的理论基础。�Cramer分解定理是Wold分解定理的理论推广,它说明任何一个序列的波动都可以视为同时受到了确定性影响和随机性影响的综合作用。平稳序列要求这两方面的影响都是稳定的,而非平稳序列产生的机理就在于它所受到的这两方面的影响至少有一方面是不稳定的。用非参数检验方法判断序列的平稳性�(一)什么是参数检验和非参数检验?�参数检验:参数检验是这样一种检验,它的模型对抽出研究样本的总体的分布作了限制性假定。。�如果对总体的分布不知道或了解很少,则参数检验方法就不可靠,甚至会发生较大偏差。�非参数检验:非参数检验是一种不依赖于总体分布知识的检验方法。�由于非参数检验不对总体分布加以限制性假定,所以它也称为自由分布检验。�非参数检验与参数检验相比有如下优点:�a.检验条件比较宽松,适应性强。�b.参数检验对样本容量的要求极低。�c.检验方法灵活,用途更广泛。�非参数检验主要用顺序统计量进行检验,因此它既可检验定距数据和定比数据,又可以检验定类数据和定序数据;而参数检验只能处理定距数据和定比数据。因为这些优点,非参数检验比参数检验应用更广泛。�d.非参数检验计算相对简单,易于理解。�非参数检验的缺点:�如果参数统计模型的所有假设在数据中事实上都能满足,而且测量达到了所要求的水平(定距数据或定比数据),那么用非参数检验就浪费了数据中的信息。也就是说此时非参数检验的功效不如参数检验高。非参数检验方法在检验序列平稳性中的应用�1.游程检验方法�(1)什么是游程�一个游程定义为一个具有相同符号的连续串,在它前后相接的是与其不同的符号或完全无符号。�例如,观察的结果用加、减标志表示,得到一组这样的记录顺序:�++---+----++-+�这个样本的观察结果共有7个游程。�(2)用游程检验方法检验时间序列平稳性的基本思想..,,,},{程数并可求出这个序列的游序列这样就形成了一个符号号的观察值记为大比号小的观察值记为对序列中比设其样本均值为对于一个时间序列+−xxxxt如果符号序列是随机的,那么““““++++””””和““““----””””将随机出现,因此它的游程数既不会太多,又不会太少;反过来说如果符号序列的游程总数太少或太多,我们就可以认为时间序列存在某种趋势性或周期性。.)1,0()()(:)15()1()12(2)(12)(::,,212212121212121服布渐近服从有大于或在大样本情况下的期望和方差分别如下数游程总明,对于随机序列可以证总数为出现的次数,游程与为记号序列中分别和设序列长度为NrDrErZNNNNNNNNrDNNNNrErrNNNNNN−=−−=++=−++=�(3)检验方法�a.小样本情况�零假设:H0:加号和减号以随机的方式出现�检验方法:取显著性水平α(一般取0.05),查单样本游程检验表,得出抽样分布的临界值rL、rU�判定:若rLrrU则不能拒绝零假设,即不能拒绝序列是平稳的;若rrL或rrU则拒绝零假设,序列是非平稳的。�b.大样本情况�零假设:H0:加号和减号以随机的方式出现�检验方法:给定显著性水平α(一般取0.05)查标准正态分布表,得出抽样分布的临界值-zα,+zα。并计算统计量:)()(rDrErZ−=判定:若-zαz+zα,则不能拒绝零假设,即不能拒绝序列是平稳的;否则拒绝零假设,序列是非平稳的。非参数检验可以很方便的通过SPSS软件进行,游程检验可见操作。实例:用游程检验S&T数据的平稳性;步骤如下:1.打开SPSS输入数据2.依次单击Analyze—NonparmetricTests—Runs;打开Runs对话框。3.在源变量对话框中选择“stpoor”进入“TestVariablelist”栏内4.选中“cutpoint”栏中“mean”选项5.单击“OK”按纽,开始进行统计分析。RunsTest288.9746102921944-13.532.000TestValueaCasesTestValueCases=TestValueTotalCasesNumberofRunsZAsymp.Sig.(2-tailed)STPOORMeana.输出结果分析:因为PPPP值(sig.sig.sig.sig.)极小,所以拒绝零假设,故原序列是非平稳的。也可以通过其它的非参数检验方法来判断序列是否平稳,如Spearman等级相关系数,Kendallτ相关系数等。4.24.24.24.2确定性因素分解�传统的因素分解�长期趋势�循环波动�季节性变化�随机波动�现在的因素分解�长期趋势波动�季节性变化�随机波动确定性时序分析的目的�克服其它因素的影响,单纯测度出某一个确定性因素对序列的影响�推断出各种确定性因素彼此之间的相互作用关系及它们对序列的综合影响趋势分析�目的�有些时间序列具有非常显著的趋势,我们分析的目的就是要找到序列中的这种趋势,并利用这种趋势对序列的发展作出合理的预测�常用方法�趋势拟合法�平滑法趋势拟合法�趋势拟合法就是把时间作为自变量,相应的序列观察值作为因变量,建立序列值随时间变化的回归模型的方法�分类�线性拟合�非线性拟合线性拟合�使用场合�长期趋势呈现出线形特征�模型结构⎩⎨⎧=++=)(,0)(ttttIVarIEIbtax拟合澳大利亚政府1981198119811981————————1990199019901990年每季度的消费支出序列线性拟合�模型�参数估计方法�最小二乘估计�参数估计值⎩⎨⎧===++=2)(,0)(40,2,1,σttttIVarIEtIbtaxL12.89ˆ,69.8498ˆ==ba拟合效果图非线性拟合�使用场合�长期趋势呈现出非线形特征�参数估计指导思想�能转换成线性模型的都转换成线性模型,用线性最小二乘法进行参数估计�实在不能转换成线性的,就用迭代法进行参数估计常用非线性模型模型变换变换后模型参数估计方法线性最小二乘估计线性最小二乘估计--迭代法--迭代法--迭代法2ctbtaTt++=ttabT=ttbcaT+=tbcateT+=ttbcaT+=122tt=ttTTln=′aaln=′bbln=′2ctbtaTt++=tbaTt′+′=′例4.24.24.24.2:对上海证券交易所每月末上证指数序列进行模型拟合非线性拟合�模型�变换�参数估计方法�线性最小二乘估计�拟合模型口径2ctbtaTt++=22tt=20952.02517.502tTt+=拟合效果图平滑法�平滑法是进行趋势分析和预测时常用的一种方法。它是利用修匀技术,削弱短期随机波动对序列的影响,使序列平滑化,从而显示出长期趋势变化的规律�常用平滑方法�移动平均法�指数平滑法移动平均法�基本思想�假定在一个比较短的时间间隔里,序列值之间的差异主要是由随机波动造成的。根据这种假定,我们可以用一定时间间隔内的平均值作为某一期的估计值�分类�n期中心移动平均�n期移动平均nnnn期中心移动平均⎪⎪⎩⎪⎪⎨⎧++++++++++++=+−++−−−+−−++−−−−为偶数,为奇数,nxxxxxnnxxxxxnxntnttntntntnttntntt)2121(1)(1~2121222112112121LLLLtx2+tx1+tx1−tx2−tx5~2112++−−++++=ttttttxxxxxx5555期中心移动平均nnnn期移动平均tx1−tx2−tx3−tx4−tx5~1234ttttttxxxxxx++++=−−−−)(1~11+−−+++=nttttxxxnxL5555期移动平均移动平均期数确定的原则�事件的发展有无周期性�以周期长度作为移动平均的间隔长度,以消除周期效应的影响�对趋势平滑的要求�移动平均的期数越多,拟合趋势越平滑�对趋势反映近期变化敏感程度的要求�移动平均的期数越少,拟合趋势越敏感移动平均预测)(1ˆ21nlTlTlTlTxxxnx−+−+−++′++′+′=L⎩⎨⎧≤=′−+−+−+ilxilxxilTilTilT,,ˆ例4.34.34.34.3�某一观察值序列最后4期的观察值为:5,5.5,5.8,6.2(1)使用4期移动平均法预测。(2)求在二期预测值中前面的系数等于多少?2ˆ+Tx2ˆ+TxTx解(1)(2)在二期预测值中前面的系数等于()()45.548.54.556.5ˆ41ˆ6.542.68.54.5541ˆ21123211=+++=+++==+++=+++=−−++−−−+TTTTTTTTTTxxxxxxxxxx()()()3212122121121611654141ˆ41ˆ−−−−−−−−−−+++++=⎥⎦⎤⎢⎣⎡++++++=+++=T