第三章平稳时间序列模型的建立第三章平稳时间序列模型的建立第一节时间序列的采集、直观分析和特征分析第二节时间序列的相关分析第三节平稳时间序列的零均值处理第四节平稳时间序列的模型识别第五节平稳时间序列模型参数的矩估计第六节平稳时间序列模型的定阶第七节平稳时间序列模型的检验第八节平稳时间序列模型的建模方法第一节采集、直观分析和特征分析时间序列的建模流程数据的采集直观分析特征分析相关分析随机分析确定性分析时间序列的预处理数据的采集方法:直接采样累计采样特征采样阈值采样原理:采样间隔越小,采样值越多,信息损失就越小,数据处理量越大,处理时间、人力、财力消耗越大.采样间隔越大,采样值越少,信息损失就越多,数据处理的时间、人力、财力消耗越小.时间序列数据的预处理预处理:直观分析特征分析相关分析直观分析直观分析包括:离群点的检验和处理,缺损值的补足,指标计算范围的统一等等.离群点(outlier):指一个时间序列中远离序列一般水平的极端大值和极端小值。通常是由于系统外部干扰而形成的,可以根据序列值与平滑值两者间的差异来判断.缺损值(missingvalue):指在采集时间序列时,由于仪器故障、操作失误、观察问题等种种原因引起在某些观测点上未能记录的观察值.特征分析定义:特征分析就是在对数据序列进行建模之前,通过从时间序列中计算出一些有代表性的特征参数,用以浓缩、简化数据信息,以利于数据的深入处理,或通过概率直方图和正态性检验分析数据的统计特征.特征参数包括:位置特征参数,散度特征参数,分布特征参数位置特征参数样本均值:极小值:极大值:11111minmaxNiiiiNiNiNXXNXXXX散度特征参数极差:样本方差:样本标准差:12222112*222112*1111111111NNNNiiiiNNNiiiiNiiLXXSXXXXNNNSXXXXNNNSXXN分布特征参数偏度:峰度:标准偏度系数:标准峰度系数:3*14*131*142*111161324NikiNiiNiiNiiXXSNSXXKNSXXgNSXXNgNS第二节时间序列的相关分析时间序列的相关分析相关分析:纯随机性检验平稳性检验正态性检验纯随机性检验定义:纯随机性检验,又称白噪声检验,是检验时间序列观察值之间是否具有相关性.Bartlett定理:如果一个时间序列是纯随机的,得到一个观察期数为n的观察序列,那么该序列的延迟非零期的样本自相关系数若,则自相关系数为零的可能性是95%,可认为数据是不相关的.1ˆ~0,,0kNknˆ1.962,0knnk检验统计量:Q统计量:Box和Pierce共同推导出原假设:延迟期数小于或等于m的序列值之间相互独立结论:当Qχ21-α(k)时,接受原假设,认为序列{Xt}是独立的,不用进行建模了。当统计量的相伴概率p0.05时,接受原假设;当p0.05时,拒绝原假设,{Xt}是平稳非白噪声序列,尝试建立ARMA模型。一般取k≈N/10221ˆkiiQNk1,0210mHm:纯随机性检验纯随机性检验纯随机性检验时间序列的平稳性是时间序列建模的重要前提。目的:检验相关序列值{Xt}之间是否是平稳的检验的对象:序列是否具有常数均值和常数方差?序列的自相关函数是否仅与时间间隔有关,而与时间的起止点无关?平稳性检验常用的检验方法:数据图检验法自相关和偏相关系数图检验法特征根检验法参数检验法逆序检验法游程检验法平稳性检验数据图检验法以时间为横轴,变量Xt的取值为纵轴平稳的特点无明显的趋势性或周期性在一直线附近做小幅波动1990年12月19日-2008年11月6日上证A股指数日数据(除去节假日,共4386个数据)1994年-1995年香港环境数据序列(a)表示因循环和呼吸问题前往医院就诊的人数;(b)表示二氧化硫的日平均水平;(c)表示二氧化氮的日平均水平;(d)表示可吸入的悬浮颗粒物的日平均水平数据图检验法数据图检验法优点:简单,方便,直观缺点:主观性强模型模型方程自相关系数偏相关系数AR(p)φ(B)Xt=εt拖尾p步截尾MA(q)Xt=θ(B)εtq步截尾拖尾ARMA(p,q)φ(B)Xt=θ(B)εt拖尾拖尾检验原理:若序列Xt的样本自相关系数和偏相关系数既不截尾,又不拖尾,则可以肯定该序列是非平稳的。自相关和偏相关系数图检验法自相关和偏相关系数图检验法尝试拟合AR(1)模型尝试拟合MA(1)模型自相关和偏相关系数图检验法尝试拟合AR(1),MA(1),ARMA(1,1)模型自相关和偏相关系数图检验法自相关和偏相关系数图检验法特征根检验法原理:自回归部分特征方程的特征根在复平面的单位圆内检验步骤:先拟合适应性模型;求出该模型自回归部分特征方程的特征根;若特征根|λi|1,则该序列平稳.特征根检验法特征根检验法游程检验法平稳性的非参数检验法-----游程检验法可用SPSS软件计算Analyze→NonparametricTests→Runs∣Z∣≤1.96,则该时间序列平稳。常用的检验方法:数据图检验法自相关和偏相关系数图检验法特征根检验法参数检验法逆序检验法游程检验法平稳性检验第三节平稳时间序列的零均值处理ARMA模型:自回归移动平均模型中心化ARMA(p,q)模型非中心化ARMA(p,q)模型1122112220,00,var,0,0,tttptptttqtqpqttststXXXXEEstEXst011221122tttptptttqtqXXXXARMA模型:自回归移动平均模型中心化ARMA(p,q)模型非中心化ARMA(p,q)模型1122112221221211tttptptttqtqqqttppXXXXBBBXBBB0112211222120212121,11tttptptttqtqqqttpppXXXXBBBXccEXBBB第四节平稳时间序列的模式识别模型模型方程自相关系数偏相关系数AR(p)φ(B)Xt=εt拖尾p步截尾MA(q)Xt=θ(B)εtq步截尾拖尾ARMA(p,q)φ(B)Xt=θ(B)εt拖尾拖尾对ARMA模型的初步识别模型识别的基本原则模型定阶的困难由于样本的随机性,样本的相关系数不会呈现出理论截尾的完美情况,本应截尾的或会呈现出小值振荡的情况。由于平稳时间序列通常都具有短期相关性,随着延迟阶数k→∞,与都会衰减至零值附近作小值波动。当或在延迟若干阶之后衰减为小值波动时,什么情况下该看作为相关系数截尾,什么情况下该看作拖尾呢?ˆkkkˆkˆˆkkkˆˆkkBartlett定理:零均值的平稳时间序列Xt:若自相关系数q步截尾,则若偏相关系数p步截尾,则95%的置信区间:模型定阶的经验方法:利用2倍标准差辅助判断1ˆ~0,,1ˆ~0,,kkkNkqNNkpN模型识别22ˆ95.5%22ˆ95.5%kkkPNNPNN模型定阶经验方法如果样本自(偏)相关系数在最初的d阶明显大于2倍标准差范围,而后几乎95%的自(偏)相关系数都落在2倍标准差的范围以内,而且由非零自相关系数衰减为在零附近小值波动的过程非常突然。这时通常视为自(偏)相关系数截尾,截尾阶数为d。如果有超过5%的样本自(偏)相关系数都落入2倍标准差的范围之外,或者是由显著非零的自(偏)相关系数衰减为小值波动的过程比较缓慢或者非常连续,这时通常视为自(偏)相关系数拖尾。1950年-1998年北京城乡居民定期储蓄比例尝试拟合AR(1)模型模型识别模型识别连续读取70个化学反应数据尝试拟合AR(1),MA(1),ARMA(1,1)模型第五节平稳序列模型参数的矩估计第六节平稳时间序列模型的定阶问题:如何ARMA(p,q)的中p和q?定阶的方法:残差方差图定阶法F-检验定阶法最佳准则函数法AIC准则BIC准则模型的定阶在回归分析中,F检验法常被用来考察两个回归模型是否具有显著差异。原理:检验后面s个回归因子对因变量的影响是否显著设样本容量为N,上述两个模型的残差平方和分别是Q0与Q1,则检验统计量为F检验定阶法112211221:2:rrrsrsMyXXXMyXXX012:0rsrsrH100,QQsFFsNrQNr结论:对于给定的显著性水平α若FFα(s,N-r),则拒绝原假设,认为后面s个回归因子对因变量的影响是显著的,表明M1合适;若FFα(s,N-r),则接受原假设,认为这s个回归因子对因变量的影响是不显著的,表明M2合适。112211220121:2::0rrrsrsrsrsrMyXXXMyXXXH100,QQsFFsNrQNrF检验定阶法1967年,瑞典控制论专家K.J.Aström教授将F检验准则用于对时间序列模型的定阶。原理(模型阶数简约原则parsimonyprinciple):设Xt(1≤t≤N)是零均值平稳序列,用模型AR模型拟合检验统计量:结论若FFα,则拒绝原假设,认为AR(p)合适;若FFα,则接受原假设,认为AR(p-1)合适。AR(p)模型定阶的F准则1122011221110:1::0tttptpttttptptpARpXXXXQARpXXXXQH残差平方和残差平方和10011,QQFFNpQNp检验统计量:结论若FFα,则拒绝原假设,模型阶数仍有上升的可能;若FFα,则接受原假设,认为ARMA(p-1,q-1)合适。ARMA(p,q)模型定阶的F准则010,;1,1:0,0pqARMApqQARMApqQH残差平方和残差平方和10022,QQFFNpqQNpq由于自相关函数(ACF)和偏相关函数(PACF)定阶法具有很强的主观性,是一种较为粗略的方法,而最佳准则函数定阶法则可以帮助我们在一些所选的模型中选择相对最优的模型。最佳准则函数法,即确定出一个准则函数。建模时按照信息准则函数的取值确定模型的优劣,以决定取舍,使准则函数达到极小的是最佳模型。分类:AIC准则法BIC准则法最佳准则函数法AIC准则背景:AIC准则是日本统计学家赤池Akaike于1973年提出的,全称为最小信息量准则,或AIC准则(Akaikeinformationcriterion)。该准则确定出一个准则函数,既考虑拟合模型对原始数据的拟合程度,也考虑模型中所含待定参数的个数,适用于ARMA模型的检验。AIC准则函数:AIC=-2ln(模型的极大似然度)+2(模型的独立参数个数)AIC准则用于ARMA模型的定阶对于中心化的ARMA(p,q)模型:N为样本容量对于非中心化的ARMA(p,q)模型:211112,0,ˆln21ttptpttqtqtXXXWNAICNpq