1预测理论与方法授课教师:杨小宝副教授北京交通大学2012.1226.1时间序列分析概述6.2数据准备6.3时间序列的图形化观察及检验6.4时间序列的预处理(重点)6.5简单回归分析法和趋势外推法(自学)6.6指数平滑法(重点)6.7ARIMA模型分析(重点)6.8季节调整法(重点)时间序列分析36.1时间序列分析概述•6.1.1时间序列的相关概念•6.1.2时间序列分析的一般步骤•6.1.3SPSS时间序列分析的特点4•时间序列分析是研究事件发展变化规律的一种量化分析方法。一般情况下,那些依时间先后顺序排列起来的一系列有相同内涵的数据通信都可以称为时间序列。•时间序列与一般的统计数据的不同之处在于:这是一些有严格先后顺序的数据。大多数情况下它们往往存在某种前后相承的关系,而非互相独立的。时间序列分析就是包含了针对这种独特数据特点而形成和发展起来的一系列统计分析方法的一个完整的体系。56.1.1时间序列分析概述12,,,.,ttyyytyttTty通常将时间序列描述成一个有序的数列其中下标表示时间对上述数列可以有以下几种理解:第一,可理解为一个有先后顺序且时间间隔均匀的数列.第二,可理解为随机变量族或随机过程的一个实现.即在一个固定的时间点上,将现象看做是一个具有多种可能事实的随机变量.612,,,tttyyyyy每一个只是随机变量由于种种原因而表现出来的一个结果,而在所有被关注时间点上,就是一系列随机变量所表现出来的一个结果,通常称做一个实现或一个现实,也可以称做一个轨道.使时间序列得以产生的随机有什么样的性质?它们之间的关系如何?随着时间的推移这些性质和关系会有什么样的变化?所有这些都是时间序列分析中必须关注的问题.7•研究时间序列问题时常会涉及到以下概念:1.指标集T指标集T可理解为时间t的取值范围。2.采样间隔△t采样间隔△t可理解为时间序列中相邻两个数的时间间隔。3.平稳随机过程和平稳时间序列时间序列的平稳性是指时间序列的统计规律不会随着时间的推移而发生变化。8•直观上,一个平稳的时间序列可以看作是一条围绕其均值上下波动的曲线。从理论上,有两种意义的平稳性,一个是严平稳或完全平稳,一个是宽平稳或广义平稳。•严平稳:如果对t1,t2,…,tn,h∈T和任意整数n,都使(yt1,yt2…,ytn)与(yt1+h,yt2+h,…,ytn+h)同分布,则概率空间(W,F,P)上随机过程{y(t),t∈T}称为平稳过程。具有时间上的平稳不变性。实践当中是非常困难甚至是不可能的。9•直观上,一个平稳的时间序列可以看作是一条围绕其均值上下波动的曲线。从理论上,有两种意义的平稳性,一个是严平稳或完全平稳,一个是宽平稳或广义平稳。•严平稳:如果对t1,t2,…,tn,h∈T和任意整数n,都使(yt1,yt2…,ytn)与(yt1+h,yt2+h,…,ytn+h)同分布,则概率空间(W,F,P)上随机过程{y(t),t∈T}称为平稳过程。具有时间上的平稳不变性。实践当中是非常困难甚至是不可能的。10•宽平稳:宽平稳是指随机过程的均值函数、方差函数均为常数,自协方差函数仅是时间间隔的函数。如二阶宽平稳随机过程定义为:E(yt)=E(yt+h)为常数,且对t,t+h∈T都使协方差E{[yt–E(yt)][yt+h–E(yt+h)]}存在且与t无关,只依赖于时间间隔h。114.白噪声序列:若随机序列{yt}由互不相关的随机变量构成,即对所有s≠t,Cov(ys,yt)=0,则称其为白噪声序列。•白噪声序列是一种特殊的平稳序列,在不同时点上的随机变量的协方差为0。该特性通常被称为“无记忆性”,意味着无法根据其过去的特点推测其未来的走向,其变化没有规律可循。•当模型的残差序列成为白噪声序列时,可认为模型达到了较好的效果,剩余残差中已经没有可以识别的信息。因此,白噪声序列对模型检验也是很有用处的。125.时点序列和时期序列•人们研究的那些按时间先后顺序排列的一系列时间序列数据往往由两部分组成:一是观测值;二是观测值对应的时间点或时间段。•指标集T中的每个元素表示的是一段时间,这种数据被称为时期数据;•指标集T中的每个元素表示的是一个时间点,这种数据被称为时点数据。136.1.2时间序列分析的一般步骤数据的准备阶段;数据的观察及检验阶段:总体把握时间序列发展变化的特征,以便选择恰当的模型进行分析,包括图形方法和统计检验方法;数据的预处理阶段:一方面能够使序列的特征体现得更加明显,利于分析模型的选择;另一方面使数据满足于模型的要求;14数据分析和建模阶段:根据时间序列的特征和分析的要求,选择恰当的模型进行数据建模和分析;模型的评价阶段:与模型分析的目标相结合评价是否达到了分析的目的以及效果如何;模型的实施应用阶段。15•可分为时域分析和频域分析两类,具体有:简单回归分析法适合序列间结构分析和较的预测;趋势外推法适用于精度要求不很高的中长期趋势预测;自回归移动平均(ARMA)模型常用于对随机性波动较频繁序列的短期预测,对于非平稳的序列可用ARIMA模型;谱分析方法适用于那些高频波动数据。166.1.3时间序列分析的特点•SPSS的时间序列分析是分散在Data、Transform、Analyze、Graph四个功能菜单当中。•在Data和Transform中实现对时间序列数据的定义和必要处理,以适应各种分析方法的要求;17•在分析预测中主要提供了几种时间序列的分析方法,包括指数平滑法、ARIMA模型和季节调整方法;•在分析预测中提供了时间序列分析的图形工具,包括序列图(Sequence)、自相关函数和偏自相关函数图等。•另外,也可利用分析预测频谱分析模块进行简单的谱分析。186.2数据准备•SPSS的数据准备包括数据文件的建立、时间定义和数据期间的指定。其中数据文件的建立与一般SPSS数据文件的建立方法相同,每一个变量将对应一个时间序列数据,且不必建立标志时间的变量。具体操作这里不再赘述,仅重点讨论时间定义的操作步骤。19•SPSS的时间定义功能用来将数据编辑窗口中的一个或多个变量指定为时间序列变量,并给它们赋予相应的时间标志,具体操作步骤是:1)选择菜单:DataDefineDates,出现窗口:202)个案为(CasesAre)框提供了多种时间形式,可根据数据的实际情况选择与其匹配的时间格式和参数。并在第一个个案为框中输入起初日期。•至此,完成了SPSS的时间定义操作。SPSS将在当前数据编辑窗口中自动生成标志时间的变量。同时,在输出窗口中将输出一个简要的日志,说明时间标志变量及其格式和包含的周期等。•数据期间的选取可通过SPSS的数据选择个案(SelectCases)功能实现。216.3时间序列的图形化观察及检验•6.3.1图形化观察及检验目的•6.3.2图形化观察工具•6.3.3时间序列的检验方法•6.3.4图形化观察和检验的基本操作•6.3.5图形化观察的应用举例226.4.1图形化及检验目的•时间序列分析的第一步是对其发展变化的特征有一个初步的总体把握。通过图形化观察和检验能够把握时间序列的诸多特征,如时间序列的发展趋势是上升还是下降,还是没有规律的上下波动;时间序列的变化的周期性特点;时间序列波动幅度的变化规律;时间序列中是否存在异常点,时间序列不同时间点上数据的关系等。23•通过图形化观察和检验应把握以下几点:时间序列的正态性,考察数据是否符合正态分布;时间序列的平稳性,是要了解时间序列数据适合于什么样的模型,能否直接用来建立模型等;时间序列的周期性,是指随着时间的推移序列呈现出有规律的周期性波动;时间序列的其他特性,如异常值、簇集性等。246.3.2图形化观察工具•序列图(Sequence)一个平稳的时间序列在水平方向平稳发展,在垂直方向的波动性保持稳定,非平稳性的表现形式多种多样,主要特征有:趋势性、异方差性、波动性、周期性、季节性、以及这些特征的交错混杂等。25•序列图还可用于对序列异常值的探索,以及体现序列的“簇集性”。异常值是那些由于外界因素的干扰而导致的与序列的正常数值范围偏差巨大的数据点。“簇集性”是指数据在一段时间内具有相似的水平,在不同的水平间跳跃性变化,而非平缓性变化。26•直方图(Histogram)直方图是体现序列数据分布特征的一种图形,通过直方图可以了解序列的平稳性、正态性等特征。•自相关函数图和偏自相关函数图(ACF&PACF)所谓自相关是指序列与其自身经过某些阶数滞后形成的序列之间存在某种程度的相关性。对自相关的测度往往采用自协方差函数和自相关函数。偏自相关函数是在其他序列给定情况下的两序列条件相关性的度量函数。27•自相关函数图和偏自相关函数图对识别时间序列的各种非平稳性和确定时序模型中的参数有非常重要的作用。•各种时间序列的自相关函数图和偏自相关函数图通常有一定的特征和规律:1)白噪声序列的各阶自相关函数和偏自相关函数值在理论上均为0。但实际当中序列多少会有一些相关性,但一般会落在置信区间内,同时没有明显的变化规律。282)具有趋势性的非平稳时间序列,序列的各阶自相关函数值显著不为零,同时随着阶数的增大,函数值呈缓慢下降的趋势;偏自相关函数值则呈明显的下降趋势,很快落入置信区间。3)异方差的非平稳时间序列,其各阶自相关函数显著不为零,且呈现出正负交错,缓慢下降的趋势;偏自相关函数值也呈正负交错的形式,且下降趋势明显。294)具有周期性的非平稳时间序列,其自相关函数呈明显的周期性波动,且以周期长度及其整数倍数为阶数的自相关和偏自相关函数值均显著不为零。5)非周期的波动性时间序列,自相关函数值会在一定的阶数之后较快的趋于零,而偏自相关函数则会很快的落入到置信区间内。30•谱密度图(Spectral)谱密度图用于序列周期性的检验,它是时间序列频域分析中识别序列隐含周期性的有效方法。谱分析法重在对序列当中的周期成分进行识别,从而达到对序列进行认识和分解的目的。•互相关图(Crosscorrelations)对两个互相对应的时间序列进行相关性分析的实用图形工具。互相关图是依据互相关函数绘制出来的。是不同时间序列间不同时期滞后序列的相关性。316.3.3时间序列的检验方法•通常序列的非平稳性可通过序列图、自相关函数图和偏自相关函数图大致分辨出来。但有时还需要一些定量的检验方法。•参数检验法。基本思路是,将序列分成若干子序列,并分别计算子序列的均值、方差、相关函数。根据平稳性假设,当子序列中数据足够多时,各统计量在不同序列之间不应有显著差异。如果差值大于检验值,则认为序列具有非平稳性。32•游程检验法。游程检验是一个非参数检验方法,其基本思路是,将序列的数值按一定规则重新分组形成两类。游程则为时间序列中同类数据连在一起的子序列个数。一般认为,平稳性的或随机性的序列中不应出现许多同类数据连续出现的情况,也不应出现两类数据反复交替出现的情形。也就是说游程不能太多,也不能太少。关于游程检验的详细内容可参见本书有关非参数检验的章节。336.3.4图形化观察和检验的基本操作1.绘制序列图的基本操作1)分析预测序列图。342)将需绘图的序列变量选入变量Variables框。3)在时间轴标签TimeAxisLabels框中指定横轴(时间轴)标志变量。该标志变量默认的是日期型变量。4)在转换Transform框中指定对变量进行怎样的变化处理。其中Naturallogtransform表示对数据取自然对数,Difference表示对数据进行n阶(默认1阶)差分,Seasonallydifference表示对数据进行季节差分。355)单击时间线TimeLines按钮定义序列图中需要特别标注的时间点,给出了无参考线(NoreferenceLines)、每一个更改的线(Lineateachchangeof)、在日期上的线(Lineatdate)三项供选择。6)单击格式Format按钮定义图形的格式,可选择横向或纵向序列图;对于单变量序列图,可选择绘制线图