1第八章时间序列分析(TimeSeriesAnalysis)2最早的时间序列分析可以追溯到7000年前的古埃及。古埃及人把尼罗河涨落的情况逐天记录下来,就构成所谓的时间序列。对这个时间序列长期的观察使他们发现尼罗河的涨落非常有规律。由于掌握了尼罗河泛滥的规律,使得古埃及的农业迅速发展,从而创建了埃及灿烂的史前文明。按照时间的顺序把随机事件变化发展的过程记录下来就构成了一个时间序列。对时间序列进行观察、研究,找寻它变化发展的规律,预测它将来的走势就是时间序列分析。3第一节时间序列分析的基本概念一、随机过程由随机变量组成的一个有序序列称为随机过程,记为{x(s,t),sS,tT},简记为{xt}或xt。其中S表示样本空间,T表示序数集。对于每一个t,tT,x(·,t)是样本空间S中的一个随机变量。对于每一个s,sS,x(s,·)是随机过程在序数集T中的一次实现。4时间序列随机过程的一次实现称为时间序列,可用{xt}或xt表示。随机过程与时间序列的关系图示如下:样本空间5比如某河流一年的水位值,{x1,x2,…,xT-1,xT,},可以看做一个随机过程,每一年的水位记录则是一个时间序列,如{x11,x21,…,xT-11,xT1}。而在每年中同一时刻(如t=2时)的水位记录是不同的,{x21,x22,…,x2n,}构成了x2取值的样本空间。6时间序列xt通常包含四个成分:趋势因素(trend),季节因素(seasonality),循环因素(cycle)和不规则因素(irregular)。时间序列的分解通常有加法分解法则和乘法分解法则,有兴趣的读者可以参阅其他文献。7描述性时序分析统计时序分析二、时间序列分析方法8描述性时序分析通过直观的数据比较或绘图观测,寻找序列中蕴含的发展规律,这种分析方法就称为描述性时序分析描述性时序分析方法具有操作简单、直观有效的特点,它通常是人们进行统计时序分析的第一步。9描述性时序分析案例德国业余天文学家施瓦尔发现太阳黑子的活动具有11年左右的周期10统计时序分析频域分析方法时域分析方法11频域分析方法原理假设任何一种无趋势的时间序列都可以分解成若干不同频率的周期波动发展过程早期的频域分析方法借助富里埃分析从频率的角度揭示时间序列的规律后来借助了傅里叶变换,用正弦、余弦项之和来逼近某个函数20世纪60年代,引入最大熵谱估计理论,进入现代谱分析阶段特点非常有用的动态数据分析方法,但是由于分析方法复杂,结果抽象,有一定的使用局限性12时域分析方法原理事件的发展通常都具有一定的惯性,这种惯性用统计的语言来描述就是序列值之间存在着一定的相关关系,这种相关关系通常具有某种统计规律。目的寻找出序列值之间相关关系的统计规律,并拟合出适当的数学模型来描述这种规律,进而利用这个拟合模型预测序列未来的走势特点理论基础扎实,操作步骤规范,分析结果易于解释,是时间序列分析的主流方法13时域分析方法的分析步骤考察观察值序列的特征根据序列的特征选择适当的拟合模型根据序列的观察数据确定模型的口径检验模型,优化模型利用拟合好的模型来推断序列其它的统计性质或预测序列将来的发展14时域分析方法的发展过程基础阶段核心阶段完善阶段15基础阶段G.U.Yule1927年,AR模型G.T.Walker1931年,MA模型,ARMA模型16核心阶段G.E.P.Box和G.M.Jenkins1970年,出版《TimeSeriesAnalysisForecastingandControl》提出ARIMA模型(Box—Jenkins模型)Box—Jenkins模型实际上是主要运用于单变量、同方差场合的线性模型17完善阶段异方差场合RobertF.Engle,1982年,ARCH模型Bollerslov,1985年GARCH模型多变量场合C.Granger,1987年,提出了协整(co-integration)理论非线性场合汤家豪等,1980年,门限自回归模型18时间序列分析软件常用软件S-plus,Matlab,Gauss,TSP,Eviews和SAS推荐软件——SAS在SAS系统中有一个专门进行计量经济与时间序列分析的模块:SAS/ETS。SAS/ETS编程语言简洁,输出功能强大,分析结果精确,是进行时间序列分析与预测的理想的软件由于SAS系统具有全球一流的数据仓库功能,因此在进行海量数据的时间序列分析时它具有其它统计软件无可比拟的优势19三、平稳性(Stationarity)1.严平稳如果一个时间序列xt的联合概率分布不随时间而变,即对于任何n和k,x1,x2,…,xn的联合概率分布与x1+k,x2+k,…xn+k的联合分布相同,则称该时间序列是严格平稳的。202.弱平稳由于在实践中上述联合概率分布很难确定,我们用随机变量xt(t=1,2,…)的均值、方差和协方差代替之。一个时间序列是“弱平稳的”,如果:21实际中,假定我们有N个观察数据点,弱平稳性意味着数据的时间显示出N个值在一个常数水平上下以相同幅度波动。kttxxCovxxCovxxCovxxCovkxktttkttktkttkktk111)()(),(),(),(),(其中这是因为。的自协方差,有的间隔为称为协方差22四、五种经典的时间序列类型1.白噪声(Whitenoise)最简单的随机平稳时间序列是一具有零均值同方差的独立分布序列:xt=εt,εt~N(0,2)该序列常被称为白噪声。Cov(xt,xt+k)=σ2,k=00,k023编程:workfilerandom1u11000seriesY1=@rnorm'生成标准正态分布seriesY2=@nrnd'生成标准白噪声序列lineY2激活序列Y2窗口,点击View选择One-WayTabulation…,得到频数等分布图。24标准正态白噪声序列时序图-4-3-2-1012342505007501000Y225TabulationofY1Date:11/23/10Time:11:47Sample:11000Includedobservations:1000Numberofcategories:4CumulativeCumulativeValueCountPercentCountPercent[-4,-2)171.70171.70[-2,0)45945.9047647.60[0,2)49749.7097397.30[2,4)272.701000100.00Total1000100.001000100.00262.随机游走(Randomwalk)如果一个序列由如下随机过程生成:xt=xt-1+εt,其中εt是一个白噪声,则该列序被称为随机游走。容易证得E(xt)=E(xt-1),Var(xt)=t2,xt的方差与时间t有关而非常数,因此随机游走序列是一非平稳序列。随机游走序列可以通过差分变换使其变为平稳序列(ΔXt=εt)。27E(Xt)=E(Xt-1+εt)=E(Xt-1)+E(εt)=E(Xt-1)这表明Xt的均值不随时间而变。Xt的方差:Xt=Xt-1+εt=Xt-2+εt-1+εt=Xt-3+εt-2+εt-1+εt=……=X0+ε1+ε2+……+εt=X0+∑εtVar(Xt)=Var{X0+}==tttVar1)(ttt12t28workfileu11000seriesu=@nrnd'生成白噪声序列u~N(0,1)u(1)=0'u序列初始值为0'生成随机漫步序列x1=x1(-1)+useriesx1'定义序列x1x1(1)=0smpl21000x1=x1(-1)+u'生成随机漫步序列linex129-20-100102030402505007501000X1随机游走时序图30-40-30-20-10010202505007501000X1-30-20-10010202505007501000X1-10-505101520252505007501000X1-10-505101520252505007501000X1313.带漂移项的随机漫步(Randomwalkwithdrift)首先考虑如下随机过程:xt=+t+xt-1+εt(*)其中:εt是白噪声,t为时间趋势。如果=1,=0,则上式为一带漂移项的随机游走过程:xt=+xt-1+εt(1)根据的正负,xt表现出明显的上升或下降趋势,这种趋势称为随机性趋势(stochastictrend)。对于(1)式我们同样可通过差分的方法使其变为平稳的序列,因此(1)式也被称为差分平稳过程(differencestationaryprocess),或称随机趋势非平稳过程。32workfileu11000seriesu=@nrnd'生成白噪声序列u~N(0,1)u(1)=0'u序列初始值为0'生成随机漫步序列x1=x1(-1)+useriesx1'定义序列x1x1(1)=0scalara=0.1'定义a为标量smpl21000x1=a+x1(-1)+u'生成随机漫步序列linex133-200204060802505007501000X1带漂移项随机游走时序图a=0.134-200204060802505007501000X1带漂移项随机游走时序图a=-0.1-80-60-40-200202505007501000X1354.趋势平稳过程(trendstationaryprocess)同样考虑(*)的随机过程,若=0,0,则xt=+t+εt根据的正负,xt会表现出明显的上升或下降趋势,这种趋势称为确定性趋势(deterministictrend)。36对于确定性趋势,我们无法通过差分的方法消除,而只能通过除去趋势项来消除,使该序列变为平稳,这样的序列我们称为趋势平稳过程,或称退势平稳过程。其规范表述如下:xt=0+1t+εt,εt=εt-1+vt,(1,vtIID(0,2))37workfilem1950.12010.12seriesu=@nrnd'生成白噪声序列u~N(0,1)u(1)=0'u序列初始值为0'生成随机漫步序列x1=x1(-1)+useriesx1'定义序列x1x1(1)=0scalara=0.1'定义a为标量scalarb=0.05seriest=@trend(1949.12)smpl1950.12010.12x1=a+b*t+u'生成随机漫步序列linex138-1001020304050556065707580859095000510X139-40-30-20-1001050556065707580859095000510X1b=-0.05405.确定性趋势非平稳过程(non-stationaryprocesswithdeterministictrend)xt既包含有确定性趋势又包含有随机性趋势,其表述如下:xt=+t+xt-1+εt(其中εt为白噪声)我们称上式所表示的序列为确定性趋势非平稳过程。41workfileu11000seriesu=@nrnd'生成白噪声序列u~N(0,1)u(1)=0'u序列初始值为0'生成序列x1=a+bt+x1(-1)+useriesx1'定义序列x1x1(1)=0scalara=10'定义a为标量scalarb=-0.02seriest=@trend(0)smpl21000x1=a+b*t+x1(-1)+u'生成随机漫步序列linex142-50005001,0001,5002,0002,5003,0002505007501000X1确定性趋势非平稳过程a=10,b=-0.0243-6,000-5,000-4,000-3,000-2,000-1,00001,0002505007501000X1a=5,b=-0.024401,0002,0003,0004,0005,0006,0002505007501000X1a=1