第二章时间序列的预处理时间序列无规律可寻分析结束(随机性分析)随机性变化即由许多不确定因素引起的序列变化。它所使用的分析方法就是我们要讲的时间序列分析。平稳性检验平稳时间序列非平稳时间序列纯随机性检验白噪声序列(纯随机序列)确定性分析随机性分析平稳非白噪声序列ARMA模型趋势变化分析周期变化分析循环变化分析ARIMA模型总括:本章结构平稳性检验纯随机性检验2.1平稳性检验特征统计量平稳时间序列的定义平稳时间序列的统计性质平稳时间序列的意义平稳性的检验概率分布概率分布的意义随机变量族的统计特性完全由它们的联合分布函数或联合密度函数决定时间序列概率分布族的定义(1)一维分布函数:随机序列中每个随机变量的分布函数.F1(x),F2(x),…,Ft-1(x),Ft(x)(2)二维分布函数:随机序列中任意两个随机变量的联合分布函数Fi,j(xi,xj).i,j=…,-2,-1,0,1,2,…时间序列概率分布族的定义实际应用的局限性TtttmmxxxFmmtttm,,,),,,2,1()},,,({2121,,,21特征统计量(1)均值函数对时间序列中的任一随机变量取期望。当t取遍所有可能整数时,就形成了离散时间的函数ut称ut为时间序列的均值函数。dxxfxxdFxExutttttt)()()()()(22xdFxXEDXttttt(2)方差函数),())(()])([(),(,ststssttssttxxdFuxuxuxuxEstr)()(),()()(),(22ssstttxDuxEssrxDuxEttr(3)自协方差函数(4)自相关函数:),(),(),(),(ssrttrstrst平稳时间序列的定义严平稳严平稳是一种条件比较苛刻的平稳性定义,它认为只有当序列所有的统计性质都不会随着时间的推移而发生变化时,该序列才能被认为平稳。宽平稳宽平稳是使用序列的特征统计量来定义的一种平稳性。它认为序列的统计性质主要由它的低阶矩决定,所以只要保证序列低阶矩平稳(二阶),就能保证序列的主要性质近似稳定。平稳时间序列的统计定义满足如下条件的序列称为严平稳序列从而确定了所有统计性质都不会随着时间的推移而改变。),,,(),,,(21,21,2121mtttmtttxxxFxxxFmm有,正整数,正整数Ttttmm,,,,21满足如下条件的序列称为宽平稳序(也称为弱平稳或二阶平稳)TtskksttskkstTtEXTtEXtt且,为常数,,,),(),()3,)2,)12含义:a有穷二阶矩意味着期望和自协方差存在;b平稳时间序列任意时刻所对应的随机变量的均值相等;c自协方差函数只与时间间隔有关,而与时间起点无关。1)均值E(Xt)=是与时间t无关的常数;2)方差Var(Xt)=2是与时间t无关的常数;3)协方差Cov(Xt,Xt+k)=k是只与时期间隔k有关,与时间t(起始点)无关的常数;或严平稳与宽平稳的区别和联系一般关系严平稳条件比宽平稳条件苛刻,通常情况下,严平稳(低阶矩存在)能推出宽平稳成立,而宽平稳序列不能反推严平稳成立特例不存在低阶矩的严平稳序列不满足宽平稳条件,例如服从柯西分布的严平稳序列就不是宽平稳序列当序列服从多元正态分布时,宽平稳可以推出严平稳平稳时间序列的统计性质(1)常数均值(2)常数方差(3)自协方差函数和自相关函数只依赖于时间的平移长度而与时间的起止点无关延迟k自协方差函数延迟k自相关系数)0()(kk为整数kkttk),,()((1)平稳时间序列的均值均值函数:平稳时间序列均值为常数.为分析方便,假定EXt=0,当均值不为零时,给每个值减去均值后再求均值,即等于0。平稳时间序列的统计性质(2)常数方差tttttkttktktttkDXEXEXXErEXXEXEXXEXXEr220)()0()])([((3)自协方差函数:平稳时间序列的自协方差仅与时间间隔有关,而与具体时刻无关,所以,自协方差函数仅表明时间间隔即可。(4)自相关函数ρkkkkrrrrrssrttrstrst000),(),(),(),(平稳时间序列自协方差仅与时间隔有关,当间隔为零时,自协方差应相等.I)rk=r-kρk=ρ-kk、-k仅是时间先后顺序上的差异,它们代表的间隔是相同的。II)001,1rrrrkk自协方差与自相关系数的性质自相关系数的性质规范性对称性非负定性非唯一性(1)样本均值cznzntt11(2)样本自协方差函数kttkttktktttkktktttknttktknttkktknttkdzdzzzEzzEzzrEzzEzzErzznrzzzzknrzzzznr)())(())(()(1))((1))((121011或样本统计序列描述指标(3)样本自相关函数20)())((zzzzzzrrtkttkk例1、设动态数据16,12,15,10,9,17,11,16,10,14,求样本均值、样本自相关函数(SACF)(前三项)222103302221011)1314()1312()1316()1314)(1310()1315)(1312()1312)(1316(218.024.053.0)(1))((1)2(13101)1(rrrrzznzzzznrrzztttt平稳时间序列的意义时间序列数据结构的特殊性可列多个随机变量,而每个变量只有一个样本观察值平稳性的重大意义极大地减少了随机变量的个数,并增加了待估变量的样本容量极大地简化了时序分析的难度,同时也提高了对特征统计量的估计精度平稳性的检验(图检验方法)时序图检验根据平稳时间序列均值、方差为常数的性质,平稳序列的时序图应该显示出该序列始终在一个常数值附近随机波动,而且波动的范围有界、无明显趋势及周期特征自相关图检验平稳序列通常具有短期相关性。该性质用自相关系数来描述就是随着延迟期数的增加,平稳序列的自相关系数会很快地衰减向零例题例2.1检验1964年——1999年中国纱年产量序列的平稳性例2.2检验1962年1月——1975年12月平均每头奶牛月产奶量序列的平稳性例2.3检验1949年——1998年北京市每年最高气温序列的平稳性例2.1时序图例2.1自相关图例2.2时序图例2.2自相关图例2.3时序图例2.3自相关图2.2纯随机性检验纯随机序列的定义纯随机性的性质纯随机性检验纯随机序列的定义纯随机序列也称为白噪声序列,它满足如下两条性质TststststTtEXt,,,0,),()2(,)1(2标准正态白噪声序列时序图白噪声序列的性质纯随机性各序列值之间没有任何相关关系,即为“没有记忆”的序列方差齐性根据马尔可夫定理,只有方差齐性假定成立时,用最小二乘法得到的未知参数估计值才是准确的、有效的00k(k),)0(2tDX纯随机性检验检验原理假设条件检验统计量判别原则Barlett定理如果一个时间序列是纯随机的,得到一个观察期数为的观察序列,那么该序列的延迟非零期的样本自相关系数将近似服从均值为零,方差为序列观察期数倒数的正态分布0,)1,0(~ˆknNkn假设条件原假设:延迟期数小于或等于期的序列值之间相互独立备择假设:延迟期数小于或等于期的序列值之间有相关性1,0210mHm:mkmHk,:至少存在某个1,01mm检验统计量Q统计量LB统计量)(~ˆ212mnQmkk)(~)ˆ()2(212mknnnLBmkk判别原则拒绝原假设当检验统计量大于分位点,或该统计量的P值小于时,则可以以的置信水平拒绝原假设,认为该序列为非白噪声序列接受原假设当检验统计量小于分位点,或该统计量的P值大于时,则认为在的置信水平下无法拒绝原假设,即不能显著拒绝序列为纯随机序列的假定21()m121()m1例2.4:标准正态白噪声序列纯随机性检验样本自相关图检验结果LBQLBQ延迟统计量检验统计量值P值延迟6期2.360.8838延迟12期5.350.9454由于P值显著大于显著性水平,所以该序列不能拒绝纯随机的原假设。例2.5对1950年——1998年北京市城乡居民定期储蓄所占比例序列的平稳性与纯随机性进行检验例2.5时序图例2.5自相关图例2.5白噪声检验结果延迟阶数LB统计量检验LB检验统计量的值P值675.460.00011282.570.0001