时间序列分析讲义第一章时间序列分析概念第二章时间序列的预处理第三章平稳时间序列建模第四章时间序列分析实例-SAS应用目录第一章时间序列分析基本概念•随机序列:按时间顺序排列的一组随机变量•观察值序列:随机序列的个有序观察值,称之为序列长度为的观察值序列•随机序列和观察值序列的关系–观察值序列是随机序列的一个实现–我们研究的目的是想揭示随机时序的性质–实现的手段都是通过观察值序列的性质进行推断12,,,,,nXXX12,,,NxxxNN1.1时间序列的定义第一章时间序列分析基本概念时序图1.1下面是几个常见的时间序列观察值序列的点图:时序图1.2•德国业余天文学家施瓦尔发现太阳黑子的活动具有11年左右的周期时序图1.3时序图1.4时序图1.1,该时序有明显的增长趋势,不是平稳变化的;时序图1.2,该时序变化平稳,但有明显的周期特征;时序图1.3,该时序变化平稳,无明显的周期特征;但显示各时刻序列值显然毫无关联,显示白噪声特点时序图1.4,该时序变化平稳,无明显的周期特征;无明显白噪声特点时间序列数字特征就可以用量化的方法识别时间序列。时间序列分析方法,是根据时间序的不同特点,建立不同的模型。所以时间序列特征的识别很重要。用图形一定程度上可以识别时间序列的特征,且很直观;但是图形识别不是量化的标准,往往不够准确。因此一个量化的识别时间序列的特征的方法是必要的。1.2时间序列的数字特征•均值函数•方差函数•自协方差函数•自相关函数()nnnEXxdFx22()()()nnnnnDXEXxdFx(,)()()nnnknknnkEXX(,)(,)nnknnknnkDXDX时间序列的数字特征包含了时间序列的重要信息,时间序列分析方法正是通过对分析时间序列的数字特征,来分析时序的特性,并由此确定对于该序列建立什么样的模型.我们根据时间序列的数字特征可以将时间序列分类:1.3随机序列的几种类型满足如下条件的序列称为平稳时间序列:1),2)(,)(),nEXnnTnnkkknkT(与无关)(仅与时间间隔有关)注1:平稳时间序列的均值是常数,序列没有有明显的趋势时序图1.2、1.3、1.4都符合是平稳序列特征时序图1.1是非平稳序列注2:没有周期性的平稳时间序列,一般有:lim0kk即间隔时间很长时,则相关性趋弱。满足下列条件的随机序列称为白噪声序列,也称为纯随机序列:注1:白噪声序列也是平稳时间序列中的特例.1)0,002)(,)10nEXnTknnkk,注2:由于白噪声序列不同时刻的值相互独立,那么这样的序列数值不能对于将来进行推断与预测,所以白噪声是不能建立模型的。时序图1.3符合白噪声序列特征若满足时间序列满足:称该时间序列是周期为T的时间序列.,nTnXXnT注1:若时间序列是周期为T的时间序列,则其均值函数和自相关函数都是周期的,T为其周期。时序图1.2符合周期序列特征实际中我们得不到一个时间序列的完整性信息,因此不能计算理论均值和自相关函数。但我们能获取时间序列的一个样本,因此我们需要根据样本来计算样本的均值和样本自相关函数。1.4时间序列的样本均值与样本自相关函数1,,...,NxxxNˆk11,0,1,2,,1NkttktxxxxkNNˆkˆk0ˆ/,0,1,2,,1kN假设已经得到了时间序列的一段样本观察值,其中称为样本长度。时间序列的样本均值:样本自相关函数:11NttxxN其中:后面,我们是通过样本的数字特征对于时间序列进行识别和建模的。•时间序列分析常用软件–S-plus,Matlab,Gauss,TSP,Eviews和SAS•推荐软件——SAS–在SAS系统中有一个专门进行计量经济与时间序列分析的模块:SAS/ETS。SAS/ETS编程语言简洁,输出功能强大,分析结果精确,是进行时间序列分析与预测的理想的软件–由于SAS系统具有全球一流的数据仓库功能,因此在进行海量数据的时间序列分析时它具有其它统计软件无可比拟的优势1.5时间序列分析软件时间序列分析方法,是对非白噪声且无周期性的的平稳时间序列直接建立模型的。1、做纯随机性检验,3、进行周期识别。若有周期,消除周期性。因此在建模之前需要做的预处理:若是纯随机性序列,终止建模。---得到非纯随机的无周期平稳时间序列数据,用于建模。2、对时间序列做平稳性检验,若非平稳,需做平稳化处理。第二章时间序列的预处理原假设:延迟期数不超过期的序列值之间相互独立1,0210mHm:m检验统计量,则拒绝原假设,认为该序列为非出随机序列,可以建模。2()mLBQ认为序列为纯随机序列,,则接受原假设LBQ2()m=61218m一般,取,,221ˆ(2)()~()mkLBkQnnmnk2.1纯随机性检验终止建模例2.1:对于下面序列进行纯随机性检验样本自相关图检验结果LBQLBQ延迟统计量检验统计量值P值延迟6期2.360.8838延迟12期5.350.9454由于P值显著大于显著性水平,所以不能拒绝该序列纯随机的原假设。0.05一般取认为该序列是纯随机的,建模终止。例2.2对1950年——1998年北京市城乡居民定期储蓄所占比例的纯随机性进行检验例2.2时序图例2.2白噪声检验结果延迟阶数LB统计量检验LB检验统计量的值P值675.460.00011282.570.0001由于P值显著小于显著性水平,所以拒绝该序列为纯随机性的原假设。认为该序列不是纯随机的序列,可以建摸。0.05一般取2.4周期性检验时序图形或值,观察有无周期特征。ˆk如果一个时间序列周期为T,则做T步差分,{}nX1TttttTyBxxx周期性的消除办法:可消除周期性。tTtttTyxxx2.2平稳性的检验时序图检验根据平稳时间序列均值、方差为常数的性质,平稳序列的时序图应该显示出该序列始终在一个常数值附近随机波动,而且波动的范围有界、无明显趋势也可以通过值序列是否平稳有无趋势,事实上,当不趋于0或不能很快地趋于0时,即可判断非平稳(参看第3章,平稳的性质)。ˆkˆk例题•例2.3检验1964年—1999年中国纱年产量序列的平稳性•例2.4检验1962年1月—1975年12月平均每头奶牛月产奶量序列的平稳性•例2.5检验1949年—1998年北京市每年最高气温序列的平稳性(以上原始数据略)例2.3时序图例2.3自相关图例2.4时序图例2.4自相关图例2.5时序图例2.5自相关图•例2.3时序为非平稳的,有趋势;•例2.4时序非平稳性,有趋势•例2.5时序是一个平稳的1tttxxx非平稳性序列的平稳化对于一个非平稳时间序列,若存在一阶趋势,则用一阶差分可变平稳:{}nX若存在二阶趋势,则用二阶差分可变平稳:•一阶差分•二阶差分2ttxx若引入延迟算子B,定义:,1pttpBxxp这样差分运算可以用延迟算子表示:11ttttxBxxx222121122ttttttxBxBBxxxx注:1ppttxBx1B,1kkB延迟算子B具有线性运算。P阶差分:K步差分算子:1kkttttkxBxxx一阶差分算子:第三章平稳时间序列建模3.1平稳时间序列的模型一个无周期,非白噪声的平稳时间序列的一般可以建立如下模型:01111200()ttptpttqtqpqttxxxCVar,为白噪声序列,这个模型称为P阶自回归q阶移动平均的模型,也称ARMA模型,简记),(qpARMA特别:01120()ttptptpttxxxCVar,为白噪声序列,称为P阶自回归模型,也称AR模型,简记0,(,0)qARMAp()ARp1120()tttqtqqttxCVar为白噪声序列,称为q阶移动平均模型,也称MA模型,简记()MAq0,(0,)pARMAq利用延迟算子B:,1pttpBxxp),(qpARMA模型可以简记为:1111PqptqtBBxBBC1111PqpqBBBBBB、其中为均值,且有分别称为P阶自回归因子和q阶移动平均因子或简记为:1111PqptqtBBxBB11pC•偏自相关函数定义对于平稳AR(p)序列,所谓滞后k偏自相关函数就是指在给定中间k-1个随机变量的条件下,或者说,在剔除了中间k-1个随机变量的干扰之后,对影响的相关度量,121,,,ktttxxxkk记•滞后k偏自相关函数实际上就等于k阶自回归模型第个k回归系数的值。3.2三种模型的性质为了进一步识别模型,还需要引入另外一个重要数字特征—偏相关函数。•滞后k偏自相关函数可由下式计算:11021121120211220kkkkkkkkkkkkkkkkk𝜑𝑘𝑘•样本偏自相关函数可由11021121120211220ˆˆˆˆˆˆˆˆˆˆˆˆkkkkkkkkkkkkkkkkkˆkk得到ARMA模型相关性特征模型自相关系数偏自相关系数AR(P)拖尾P阶截尾MA(q)q阶截尾拖尾ARMA(p,q)拖尾拖尾kkk3.3ARMA模型的识别、定阶•因为由于样本的随机性,样本的相关系数不会呈现出理论截尾的完美情况,本应截尾的或仍会呈现出小值振荡的情况•由于平稳时间序列通常都具有短期相关性,随着延迟阶数,与都会衰减至零值附近作小值波动•当或在延迟若干阶之后衰减为小值波动时,什么情况下该看作为相关系数截尾,什么情况下该看作为相关系数在延迟若干阶之后正常衰减到零值附近作拖尾波动呢?kkˆkkˆkˆkkˆkˆkkˆ•定理,对于MA(q)模型,211ˆ(0,12),qkllNkqn近似服从•定理,对于AR(p)模型,1ˆ(0,),kkNkpn近似服从•模型定阶的经验方法–如果样本(偏)自相关系数在最初的d阶明显大于两倍标准差范围,而后几乎95%的自相关系数都落在2倍标准差的范围以内,而且通常由非零自相关系数衰减为小值波动的过程非常突然。这时,通常视为(偏)自相关系数截尾。截尾阶数为d。2ˆkkn截尾的临界值是212ˆ12qklln截尾的临界值是序列自相关图例3.1(例2.2续)选择合适的模型ARMA拟合1950年——1998年北京市城乡居民定期储蓄比例序列。序列偏自相关图拟合模型识别:•自相关图显示延迟3阶之后,自相关系数全部衰减到2倍标准差范围内波动,这表明序列明显地短期相关。但序列由显著非零的相关系数衰减为小值波动的过程相当连续,相当缓慢,该自相关系数可视为不截尾•偏自相关图显示除了延迟1阶的偏自相关系数显著大于2倍标准差之外,其它的偏自相关系数都在2倍标准差范围内作小值随机波动,而且由非零相关系数衰减为小值波动的过程非常突然,所以该偏自相关系数可视为一阶截尾•所以可以考虑拟合模型为AR(1)例3.2美国科罗拉多州某一加油站连续57天的OVERSHORT序列序列图序列自相关图序列偏自相关图拟合模型识别:•自相关图显示除了延迟1阶的自相关系数在2倍标准差范围之外,其它阶数的自相关系数都在2倍标准差范围内波动。根据这个特点可以判断该序列具有短期相关性,进一步确定序列平稳。同时,可以认为该序列自相关系数1阶截尾•偏自相关系数显示出典型非截尾的性质。•综合