中国人民大学出版社中国人民大学音像出版社目录第一章时间序列分析简介第二章时间序列的预处理第三章平稳时间序列分析第四章非平稳序列的确定性分析第五章非平稳序列的随机分析第六章多元时间序列分析《应用时间序列分析》第一章时间序列分析简介本章结构引言时间序列的定义时间序列分析方法简介时间序列分析软件1.1引言最早的时间序列分析可以追溯到7000年前的古埃及。古埃及人把尼罗河涨落的情况逐天记录下来,就构成所谓的时间序列。对这个时间序列长期的观察使他们发现尼罗河的涨落非常有规律。由于掌握了尼罗河泛滥的规律,使得古埃及的农业迅速发展,从而创建了埃及灿烂的史前文明。按照时间的顺序把随机事件变化发展的过程记录下来就构成了一个时间序列。对时间序列进行观察、研究,找寻它变化发展的规律,预测它将来的走势就是时间序列分析。1.2时间序列的定义随机序列:按时间顺序排列的一组随机变量观察值序列:随机序列的个有序观察值,称之为序列长度为的观察值序列随机序列和观察值序列的关系观察值序列是随机序列的一个实现我们研究的目的是想揭示随机时序的性质实现的手段都是通过观察值序列的性质进行推断,,,,,21tXXXtxxx,,,21nn1.3时间序列分析方法描述性时序分析统计时序分析描述性时序分析通过直观的数据比较或绘图观测,寻找序列中蕴含的发展规律,这种分析方法就称为描述性时序分析描述性时序分析方法具有操作简单、直观有效的特点,它通常是人们进行统计时序分析的第一步。描述性时序分析案例德国业余天文学家施瓦尔发现太阳黑子的活动具有11年左右的周期统计时序分析频域分析方法时域分析方法频域分析方法原理假设任何一种无趋势的时间序列都可以分解成若干不同频率的周期波动发展过程早期的频域分析方法借助富里埃分析从频率的角度揭示时间序列的规律后来借助了傅里叶变换,用正弦、余弦项之和来逼近某个函数20世纪60年代,引入最大熵谱估计理论,进入现代谱分析阶段特点非常有用的动态数据分析方法,但是由于分析方法复杂,结果抽象,有一定的使用局限性时域分析方法原理事件的发展通常都具有一定的惯性,这种惯性用统计的语言来描述就是序列值之间存在着一定的相关关系,这种相关关系通常具有某种统计规律。目的寻找出序列值之间相关关系的统计规律,并拟合出适当的数学模型来描述这种规律,进而利用这个拟合模型预测序列未来的走势特点理论基础扎实,操作步骤规范,分析结果易于解释,是时间序列分析的主流方法时域分析方法的分析步骤考察观察值序列的特征根据序列的特征选择适当的拟合模型根据序列的观察数据确定模型的口径检验模型,优化模型利用拟合好的模型来推断序列其它的统计性质或预测序列将来的发展时域分析方法的发展过程基础阶段核心阶段完善阶段基础阶段G.U.Yule1927年,AR模型G.T.Walker1931年,MA模型,ARMA模型核心阶段G.E.P.Box和G.M.Jenkins1970年,出版《TimeSeriesAnalysisForecastingandControl》提出ARIMA模型(Box—Jenkins模型)Box—Jenkins模型实际上是主要运用于单变量、同方差场合的线性模型完善阶段异方差场合RobertF.Engle,1982年,ARCH模型Bollerslov,1985年GARCH模型多变量场合C.Granger,1987年,提出了协整(co-integration)理论非线性场合汤家豪等,1980年,门限自回归模型1.4时间序列分析软件常用软件S-plus,Matlab,Gauss,TSP,Eviews和SAS推荐软件——SAS在SAS系统中有一个专门进行计量经济与时间序列分析的模块:SAS/ETS。SAS/ETS编程语言简洁,输出功能强大,分析结果精确,是进行时间序列分析与预测的理想的软件由于SAS系统具有全球一流的数据仓库功能,因此在进行海量数据的时间序列分析时它具有其它统计软件无可比拟的优势第二章时间序列的预处理本章结构平稳性检验纯随机性检验2.1平稳性检验特征统计量平稳时间序列的定义平稳时间序列的统计性质平稳时间序列的意义平稳性的检验概率分布概率分布的意义随机变量族的统计特性完全由它们的联合分布函数或联合密度函数决定时间序列概率分布族的定义实际应用的局限性TtttmmxxxFmmtttm,,,),,,2,1()},,,({2121,,,21特征统计量均值方差自协方差自相关系数)(xxdFEXttt)()()(22xdFxXEDXttttt))((),(ssttXXEststDXDXstst),(),(平稳时间序列的定义严平稳严平稳是一种条件比较苛刻的平稳性定义,它认为只有当序列所有的统计性质都不会随着时间的推移而发生变化时,该序列才能被认为平稳。宽平稳宽平稳是使用序列的特征统计量来定义的一种平稳性。它认为序列的统计性质主要由它的低阶矩决定,所以只要保证序列低阶矩平稳(二阶),就能保证序列的主要性质近似稳定。平稳时间序列的统计定义满足如下条件的序列称为严平稳序列满足如下条件的序列称为宽平稳序列),,,(),,,(21,21,2121mtttmtttxxxFxxxFmm有,正整数,正整数Ttttmm,,,,21TtskksttskkstTtEXTtEXtt且,为常数,,,),(),()3,)2,)12严平稳与宽平稳的关系一般关系严平稳条件比宽平稳条件苛刻,通常情况下,严平稳(低阶矩存在)能推出宽平稳成立,而宽平稳序列不能反推严平稳成立特例不存在低阶矩的严平稳序列不满足宽平稳条件,例如服从柯西分布的严平稳序列就不是宽平稳序列当序列服从多元正态分布时,宽平稳可以推出严平稳平稳时间序列的统计性质常数均值自协方差函数和自相关函数只依赖于时间的平移长度而与时间的起止点无关延迟k自协方差函数延迟k自相关系数)0()(kk为整数kkttk),,()(自相关系数的性质规范性对称性非负定性非唯一性平稳时间序列的意义时间序列数据结构的特殊性可列多个随机变量,而每个变量只有一个样本观察值平稳性的重大意义极大地减少了随机变量的个数,并增加了待估变量的样本容量极大地简化了时序分析的难度,同时也提高了对特征统计量的估计精度平稳性的检验(图检验方法)时序图检验根据平稳时间序列均值、方差为常数的性质,平稳序列的时序图应该显示出该序列始终在一个常数值附近随机波动,而且波动的范围有界、无明显趋势及周期特征自相关图检验平稳序列通常具有短期相关性。该性质用自相关系数来描述就是随着延迟期数的增加,平稳序列的自相关系数会很快地衰减向零例题例2.1检验1964年——1999年中国纱年产量序列的平稳性例2.2检验1962年1月——1975年12月平均每头奶牛月产奶量序列的平稳性例2.3检验1949年——1998年北京市每年最高气温序列的平稳性例2.1时序图例2.1自相关图例2.2时序图例2.2自相关图例2.3时序图例2.3自相关图2.2纯随机性检验纯随机序列的定义纯随机性的性质纯随机性检验纯随机序列的定义纯随机序列也称为白噪声序列,它满足如下两条性质TststststTtEXt,,,0,),()2(,)1(2标准正态白噪声序列时序图白噪声序列的性质纯随机性各序列值之间没有任何相关关系,即为“没有记忆”的序列方差齐性根据马尔可夫定理,只有方差齐性假定成立时,用最小二乘法得到的未知参数估计值才是准确的、有效的00k(k),)0(2tDX纯随机性检验检验原理假设条件检验统计量判别原则Barlett定理如果一个时间序列是纯随机的,得到一个观察期数为的观察序列,那么该序列的延迟非零期的样本自相关系数将近似服从均值为零,方差为序列观察期数倒数的正态分布0,)1,0(~ˆknNkn假设条件原假设:延迟期数小于或等于期的序列值之间相互独立备择假设:延迟期数小于或等于期的序列值之间有相关性1,0210mHm:mkmHk,:至少存在某个1,01mm检验统计量Q统计量LB统计量)(~ˆ212mnQmkk)(~)ˆ()2(212mknnnLBmkk判别原则拒绝原假设当检验统计量大于分位点,或该统计量的P值小于时,则可以以的置信水平拒绝原假设,认为该序列为非白噪声序列接受原假设当检验统计量小于分位点,或该统计量的P值大于时,则认为在的置信水平下无法拒绝原假设,即不能显著拒绝序列为纯随机序列的假定21()m121()m1例2.4:标准正态白噪声序列纯随机性检验样本自相关图检验结果LBQLBQ延迟统计量检验统计量值P值延迟6期2.360.8838延迟12期5.350.9454由于P值显著大于显著性水平,所以该序列不能拒绝纯随机的原假设。例2.5对1950年——1998年北京市城乡居民定期储蓄所占比例序列的平稳性与纯随机性进行检验例2.5时序图例2.5自相关图例2.5白噪声检验结果延迟阶数LB统计量检验LB检验统计量的值P值675.460.00011282.570.0001第三章平稳时间序列分析本章结构方法性工具ARMA模型平稳序列建模序列预测3.1方法性工具差分运算延迟算子线性差分方程差分运算一阶差分阶差分步差分pk1tttxxx111tptptpxxxkttkxx延迟算子延迟算子类似于一个时间指针,当前序列值乘以一个延迟算子,就相当于把当前序列值的时间向过去拨了一个时刻记B为延迟算子,有1,pxBxtppt延迟算子的性质,其中10B为任意常数cxcxBcxcBttt,)()(111)(ttttyxyxBnttnxxBiniinnnBCB0)1()1()!(!!ininCin用延迟算子表示差分运算阶差分步差分pkitpiipptptpxCxBx0)1()1(tkkttkxBxx)1(线性差分方程线性差分方程齐次线性差分方程)(2211thzazazazptpttt02211ptptttzazazaz齐次线性差分方程的解特征方程特征方程的根称为特征根,记作齐次线性差分方程的通解不相等实数根场合有相等实根场合复根场合02211ppppaaap,,,21tpptttcccz2211tpptddtddtcctctccz111121)(tpptititttccececrz3321)(非齐次线性差分方程的解非齐次线性差分方程的特解使得非齐次线性差分方程成立的任意一个解非齐次线性差分方程的通解齐次线性差分方程的通解和非齐次线性差分方程的特解之和tttzzztz)(2211thzazazazptpttttz3.2ARMA模型的性质AR模型(AutoRegressionModel)MA模型(MovingAverageModel)ARMA模型(AutoRegressionMovingAveragemodel)AR模型的定义具有如下结构的模型称为阶自回归模型,简记为特别当时,称为中心化模型tsExtsEVarExxxxtsstttptptpttt,0,0)(,)(0)(0222110,p)(