6第二章:时间序列的预处理时间序列的预处理:对序列进行的平稳性与纯随机性的检验称为序列的预处理.目的:根据检验的结果将序列分为不同的类型,从而采用不同的方法去分析.§2.1平稳性检验平稳性是某些时间序列具有的一种统计特征,其具体定义如下:一、平稳性:若序列达到统计平衡状态,其统计特性不随时间变化,则称该序列具有平稳性.二、预备知识1.时间序列的概率分布族:任取指标集T中的m个不同的指标mttt,,,21,称),,,(),,,(2121,,,2121mtttmtttxxxxxxPxxxFmm为时间序列}{tx的一个有限维(m维)分布,变动m及mttt,,,21,称由这些有限维分布函数的全体},,,),,2,1(),,,,({2121,,,21TtttmxxxFmmtttm为时间序列}{tx的概率分布族.注:由于在实际应用中,很难得到序列的联合概率分布,所以在时间序列分析中很少直接使用.2.时间序列的特征统计量:对时间序列Ttxt},{,随机变量)(~xFxtt,(1).均值:若)(xxdFt,则有均值函数)(xxdFExttt,以及均值函数列},{Ttt.(2).方差:若)(2xdFxt,则有方差函数)()()(22xdFxExxEDxttttttt,以及方差函数序列},{TtDxt.(3).自协方差函数:Tst,,自协方差函数)])([(),(ssttxxEst.(4).自相关系数:Tst,,自相关系数stDxDxstst),(),(.三、平稳时间序列的统计定义1.严平稳时间序列:若时间序列}{tx的任意有限维分布满足),,,(),,,(21,,,21,,,2121mtttmtttxxxFxxxFmm其中,m为任意正整数,Ttttm,,,21,则称时间序列}{tx为严平稳(完全平稳)时间序列.注:严平稳时间序列的概率结构对时间原点的平移保持不变,即Tttmxx),,(1和Tttmxx),,(17具有完全相同的联合概率分布,即序列的所有统计性质都不随时间的推移而发生改变.2.宽平稳时间序列:若时间序列}{tx满足(1).Tt,有2tEx;(2).Tt,有,tEx为常数;(3).Tkst,,,且Ttsk,有),(),(tskkst.则称}{tx为宽平稳(弱平稳,二阶平稳)时间序列.注:①.宽平稳时间序列具有常数均值序列和方差序列,这说明平稳序列的观测值应在某一定值附近作有界波动.②.自协方差函数和自相关系数具有对时间的平移不变性.3.两种平稳时间序列的区别与联系(1).区别:严平稳的条件严格,要求序列的所有统计特性都相同;宽平稳只要求序列的二阶矩函数相同.(2).联系:一般情况下,严平稳序列一定是宽平稳序列,但反之未必.因宽平稳序列对二阶以上的矩未做要求.(3).特例:服从柯西分布的严平稳序列因其一、二阶矩不存在,无法验证它的二阶平稳性;服从正态分布的宽平稳序列因其联合分布完全由均值和协方差决定,从而一定是严平稳序列.注:①.二阶矩存在的严平稳时间序列一定是宽平稳时间序列.②.宽平稳正态时间序列一定是严平稳时间序列.在实际应用中多研究宽平稳随机序列,若无特殊说明,平稳随机序列都指的宽平稳.四、平稳时间序列自相关系数的性质1.延迟k自协方差函数(k阶自协方差函数):Tkttkttk,),,(;延迟k自相关系数(k阶自相关系数):Tkttkttk,),,(.注:①.0),(ttDxt.②.0),(),(kkttkDxDxkttktt.82.k阶自相关系数的性质(1).规范性:10且Zkk,1;(2).对称性:kk;(3).非负定性:Zm,相关阵m为对称非负定矩阵,即021201110mmmmm为对称非负正定阵;注:m的计算:依此用随机变量mxxx,,,21与mxxx,,,21计算相关系数作为矩阵的每一行.(4).非惟一性:}{tx对应唯一一个k;k未必对应唯一一个}{tx.注:一个平稳时间序列惟一决定它的自相关系数,但一个自相关系数未必惟一对应一个平稳时间序列.这将在后面具体说明.五、平稳时间序列的意义1.极大地减少了随机变量的个数,如将可列个随机变量的均值序列},{Ttt变成了一个变量的均值序列},{Tt.2.增加了待估变量的样本容量,化简了时间序列分析的难度,提高了对总体特征统计量的估计精度:(即用样本特征统计量对它们进行估计.)niitxnxx11ˆ;nkknxxxxkntkttk0,))((ˆ1;nxxntt120)(ˆ;nkkk0,ˆˆˆ0;nkxxxxxxnttkntkttk0,)())((~ˆ121.注:上述样本特征统计量仍和样本一样具有二重性,作为随机变量它们有自己的分布.六、平稳性的检验:图检验法;统计检验法.1.图检验法时序图检验:平稳序列波动的范围有界、无明显趋势及周期特征(因为平稳序列的均值和方差都为常数);非平稳序列通常有明显趋势或周期特征.自相关图检验:平稳序列的自相关系数kˆ随着k的增加会很快衰减到零(因为平稳序列通常具有短期的相关性);非平稳序列的自相关系数kˆ衰减到零的速度通常较慢.9优缺点:操作简单,运用广泛;判断结论主观色彩强.2.统计检验法—单位根检验法.注:时间序列一般具有趋势性,周期性,随机性.§2.2纯随机性检验一、纯随机序列(一).定义:若时间序列}{tx满足1.Tt,有tEx;2.Tst,,有ststst,0,),(2,则称序列}{tx为纯随机序列,也称为白噪声序列,记为),(~2WNxt.注:白噪声序列是平稳序列.(二).性质及其应用1.纯随机性:0,0kk,(这说明白噪声序列的各项之间没有任何相关关系,即无记忆性.)注:①.对时间序列}{tx,若0,0kk,说明该序列间隔k期序列值之间存在着一定程度的相互影响关系,即相关信息,从而该序列不是纯随机序列.②.判断相关信息是否提取充分.2.方差齐性:2)0(tDx.即序列中每一个变量的方差都相等.注:①.若序列}{tx中的变量的方差不全相等,则称其具有异方差性.②.提高参数估计的准确性,有效性:由马尔可夫定理知,只有在方差齐性成立时,用最小二乘法得到的未知参数的估计值才是准确的,有效的.③.模型拟合的检验内容之一:检验拟合模型的残差是否满足方差齐性.二、纯随机性检验若一序列是纯随机序列,则它的序列值之间应该没有任何关系,即有0,0kk,从而也有序列的样本自相关系数0,0kk,因此给出如下检验条件:(一).假设条件原假设:1,0:210mHm.即延迟小于或等于m期的序列值不相关.10备则假设:1H:至少存在某个mkmk,1,0.即延迟小于或等于m期的序列值相关.但由于观测值序列都是有限的,导致纯随机序列的样本自相关系数不会绝对为零,所以假设条件应该相应的修改为单边假设检验:原假设:1,:0mHm.即延迟小于或等于m期的序列值不相关.备则假设:1H:至少存在某个mkmk,1,.即延迟小于或等于m期的序列值相关.(二).检验原理Barlett定理:若时间序列}{tx是纯随机的,得到一个观测期数为n的观察序列},,2,1,{ntxt,则该序列的延迟非零期的样本自相关系数将近似服从均值为零,方差为序列观测期数倒数的正态分布,即0,/1,0~ˆknNk.(三).检验统计量1.Q统计量:)(~ˆ212mnQmkk(在原假设成立时),其中n为序列观测期数;m为指定延迟期数.2.LB统计量:)(~ˆ)2(212mknnnLBmkk(在原假设成立时),其中n为序列观测期数;m为指定延迟期数.注:①.Q统计量也称为BPQ统计量,适合于大样本场合;②.LB统计量也称为LBQ统计量,是对LBQ统计量的修正,适用于小样本场合.在各种场合普遍采用的统计量通常都是指LBQ统计量.(四).检验原则:(单边假设)拒绝原假设:当检验统计量的大于)(21m分位点(上分位数),或该统计量的P值小于时,则可以以1的置信水平拒绝原假设,认为该序列为非白噪声序列.接受原假设:当检验统计量小于)(21m分位点或该统计量的P值大于时,则认为在1的置信水平下无法拒绝原假设,即不能显著地拒绝序列为纯随机序列的假定.