第13章SPSS的时间序列分析13.1时间序列分析概述13.2指数平滑13.3建立自回归序列的新变量13.4自回归13.5季节分解法13.6案例分析一13.7案例分析二13.8案例分析三时间序列分析(TimeSeriesAnalysis)是研究事物发展变化规律的一种量化分析方法,隶属于统计学但又有不同于其他统计分析方法的特殊特点。近年来,时间序列分析的理论和应用研究一直是人们关注的热点,也取得了很大的进步。对于时间序列一词可以有不同层次的理解。一般情况下,那些依时间先后顺序排列起来的一系列有相同内涵的数据都可以称为时间序列。在这个意义上来看,时间序列在日常生活中时无处不在的。从国家社会等宏观角度看,我们常常听到的GDP、物价指数、股票指数等可以构成时间序列;从微观角度看,一个13.1时间序列分析概述家庭每天的开支、一个工人的每天的工作量、一个学生每天的伙食费,等等,也可以构成时间序列。事实上,万事万物的变化发展所表现出来的各种特征,只要能够被持续的观察和度量,同时被记录,就能够得到所谓的时间序列。时间序列与一般的统计数据的不同之处在于:这是一些有严格先后顺序的数据。不同时间点或时间段对应的数据之间可能是没有关联互相独立的,但大多数情况下它们之间往往存在着某种前后相承的关系,而非互相独立。因此,对这类数据的分析和研究需要一些特殊的方法。时间序列分析就是包含了针对这种独特数据特点而形成和发展起来的一系列统计分析方法的一个完整的体系。13.1.1时间序列的相关概念通常,将时间序列描述成一个有序的数列:,其中下标表示时间序号。对上述数列可以有以下几种理解:第一,为一个有先后顺序且时间间隔均匀的数列。第二,为随机变量族或随机过程的一个“实现”。即在每一个固定的时间点t上,将现象看做是一个具有多种可能事实的随机变量。每一个只是随机变量由于种种原因而表现出来的一个结果,而在所有被关注时间点上,就是一系列随机变量所表现出来的一个结果,通常称做一个实现或一个现实,也可以称做一个轨道。12,,,tyyy,yttTty12,,,tyyy●指标集T指标集T可直观理解为时间t的取值范围。对一般的随机过程来说它是一个连续的变化范围,如可取,此时上述随机过程可相应地记为。时间序列分析一般只涉及离散的时间点,如t可取,此时的随机过程记为,又由于0点的相对性,一般的t可取。,,,ytt0,1,2,,0,1,2,ytt0,1,2,●采样间隔采样间隔可直观理解为时间序列中相邻两个数的时间间隔。在实际研究中。在整个数据期间一般都取一致的时间间隔,这样会使分析结果更具直观意义,更易使人信服。如在实际当中T为时,若取个时间点,则采样间隔为。tt,abbatN●平稳随机过程和平稳时间序列在一些时间序列分析方法当中要求时间序列具有平稳性,即要求时间序列对应的随机过程是一个平稳的随机过程。平稳随机过程定义如下:如果对和任意整数n,都使与同分布,则概率空间(W,F,P)上的随机过程称为平稳过程。从这个定义可以看出平稳性实质上是要求随机过程包含的任意有限维随机变量族的统计特性具有时间上的平移不变性。这是一种非常严格的平稳性要求,而要刻画和度量这种平稳性,需要掌握个随机变量或随机变量族的分布或联合分布,这在实践当中是非常困难甚至是不可能的。因此这种平稳性一般被称为“严平稳”或者“完全平稳”。12,,,nttthT12,,ntttyyy12,,nthththyyy,yttT21n●白噪声序列白噪声序列是一种特殊的平稳序列。它定义为:若随机序列{yt}由互不相关的随机变量构成,即对所有,则称其为白噪声序列。可以看出,白噪声序列是一种平稳序列,在不同时点上的随机变量的协方差为0。该特性通常被称为“无记忆性”,意味着人们无法根据其过去的特点推测其未来的走向,其变化没有规律可循。虽然有这个特点,但白噪声序列却是其他时间序列得以产生的基石,这在时间序列的ARIMA模型分析中体现得相当明显。另外,时间序列分析当中,当模型的残差序列成为白噪声序列时,可认为模型达到了较好的效果,剩余残差中已经没有可以识别的信息。因此,白噪声数列对模型检验也是很有用处的。,,0ststCovyy●时点序列和时期序列实际当中,人们研究的时间序列是前面提到的随机过程的一个“实现”,也就是那些按时间先后顺序排列的一系列数据。这些数据往往由两部分组成:一是观测值;二是观察值对应的时间点或时间段。一般情况下,时期数据和时点数据之间可以通过将时期数据累加、或者将时点数据后项减前项或后项比前项的处理方式互相转换。不过随着这种转换,序列包含的实际意义也会有所变化,相应变量的统计性质也会有很大的变化,对应的分析处理方法也会有很大的不同。13.1.2时间序列分析的一般步骤时间序列分析一般需经过数据的准备、数据的观察及检验、数据的预处理、数据的分析和建模、模型的评价、模型的实施应用等几个阶段。●数据的准备阶段●数据的观察及检验阶段●数据的预处理阶段●数据的分析和建模阶段●模型的评价阶段●模型的实施应用阶段13.1.3SPSS时间序列分析的特点SPSS的时间序列分析没有自成一体的单独模块,而是分散在Data、Transform、Analyze、Graph四个功能菜单当中。在Data和Transform中实现对时间序列数据的定义和必要处理,以适应各种分析方法的要求;在Analyze和TimeSeries中主要提供了四种时间序列分析方法,包括指数平滑法、自回归法、ARIMA模型和季节调整方法;在Graph中提供了时间序列分析的图形工具,包括序列图(Sequence)、自相关函数和偏自相关函数图等。另外,也可利用SPSS的谱分析图等模块进行简单的谱分析。13.2数据准备数据准备是利用SPSS进行时间序列分析的一个首要任务,它对以后的分析起着举足轻重的作用,是数据分析的基础。通过前面的讨论可知,时间序列最显著的特点就是数据有着严格的先后顺序,并且与一定时间点或时间段相对应。因此,要把一系列SPSS变量数据当做时间序列数据来分析,就必须首先指明每个数据对应的时间点或时间段,以及整个数据所对应的期间。SPSS的数据准备正是用来完成这些任务的。数据期间的选取也是时间序列分析中经常遇到的问题。所谓数据期间的选取是指,如果分析过程中只希望选取全部样本期中的部分时段数据进行分析,则应首先指定该时间段的起止时间。对此可通过SPSS的样本选取(SelectCases)功能实现。13.3指数平滑法13.3.1指数平滑法的基本思想为掌握指数平滑法的基本思想应首先了解移动平均的思想。研究时间序列的一个重要目的是预测。现实当中事物的发展都是有连续性的,事物过去的表现与现在的状态有关,现在的状态又与将来的可能表现有一定的联系。因此,可以从现有数据入手通过构造某种计算方法实现对未来的预测。基于这种思想可以构造出丰富多彩的预测模型。移动平均法正是这样一种利用已知值的某种平均值进行预测的方法。移动平均包括简单移动平均法和加权移动平均法。简单移动平均法是利用一定时间跨度t下数据的简单平均实现对下一期值的预测,即可见,简单移动平均认为,时间跨度内的所有数据对未来的预测贡献全部相同。然而,众所周知,事物的当前状态与其在过去时间所有点上的表现之间联系的紧密程度并不完全一致,因此这样的预测有时可能出现很大的偏差。通常,序列数据在近期的表现比远期的表现与现实状态的联系更加紧密。因此,预测时对过去的数据应给予不同的重视程度。12111tttiiyyyfytt加权移动平均法是对简单移动平均法的改进,通过不同的权数体现对过去状态的不同重视程度。重视程度越高、与现实联系密切的时间点对应较大的权数,而重视程度低、与现实联系松散的时间点则对应较小的权数。即不同事物的发展规律是不同的,同一种事物随时间的推移其变化规律也会发生变化。所以,权数应随不同的问题、不同的时间变换而变化。通常,权数确定没有一定之规,一般可参照几种典型的具有代表性的方法来设计权数。'''11221122'1ttttttiiyyyfyyy1212,1.tt13.3.2指数平滑法的模型指数平滑法因权数选择和平滑方法的不同而分成多种模型形式。虽然他们都基于上述基本思想,但在具体实现上还有所差别,也有不同的适用场合。下面介绍常用的几种模型。一次指数平滑法(简单指数平滑法)一次指数平滑法是简单移动平均法的变形,模型为11ttttffyfn其中,是t时刻的一次指数平滑值,n为移动步长,整理后得:。tf1111tttfyfnn如果令,则。其中为一次平滑模型中的平滑常数,且显然。由1n11tttfyf0111111ttttttfyffyf则11121112111111111ttttttttttttktkkfyyfyyfyyfy可见,指数平滑法是以前t+1期的平滑值作为当期的预测值。二次指数平滑法(线性指数平滑法)二次指数平滑也称双重指数平滑,是对一次指数平滑值再进行一次平滑。一次指数平滑法是直接利用平滑值作为预测值,而二次指数平滑则是利用平滑值对时间序列的线性趋势进行修正,进而建立线性平滑模型进行预测。二次指数平滑法包括布朗(Brown)单一参数线性指数平滑、霍特(Holt)双参数指数平滑等。布朗单一参数线性指数平滑布朗单一参数线性指数平滑的一次平滑公式为1111tttfyf布朗单一参数线性指数平滑的二次平滑公式为式中,为一次指数平滑值,为二次指数平滑值。21211tttfff1tf2tf由两个平滑值计算线性平滑模型的两个参数:,,从而得到线性指数平滑模型式中,m为超前期数。当t=1时,由于和是平滑初始值,需事先给定。布朗单一参数线性指数平滑适用于有线性趋势的时间序列。122tttff121tttbfftmttfbm11tf21tf三次指数平滑法三次指数平滑法也称三重指数平滑,与二次指数平滑类似,也不直接将平滑值作为预测值,而是服务于模型建立。三次指数平滑包括布朗三次指数平滑、温特(Winter)线性和季节性指数平滑。布朗三次指数平滑布朗三次指数平滑是对二次指数平滑值再进行一次平滑,并用以估计二次多项式参数。其一般模型为212tmtttfbmcm由上式可知,布朗三次指数模型并非一个线性模型,而是类似于二次多项式的曲线模型,可表现时间序列的曲线变化趋势。其中12333ttttSSS1232651084321ttttbSSS2123221ttttcSSS各次平滑形式分别为1111tttSyS21211tttSSS32311tttSSS布朗三次指数平滑模型适用于有非线性趋势存在的序列。温特线性和季节指数平滑温特线性和季节指数平滑模型的一般形式为上式中包含三种成分,它们分别是平稳性、趋势性和季节性。为季节周期长度,为季节调整因子,分别为模型的三个初始参数。其中1tmtttmfSbmItStbtIlI、、1111tttttySSbI111ttttbSSb11ttttyIIs温特线性和季节性指数平滑模型适用于同时具有趋势性和季节性的时间序列,且只适用于短期预测。13.4自回归法13.4.1自回归法的基本思想和模型