5时间序列模型5.1时间序列数字化技术的应用和发展使得随机序列的分析变得日益广泛和重要,并由平稳随机过程在时间轴上的取样引出平稳离散随机信号或时间序列的概念。对于这类随机序列,主要采用相关函数和功率谱进行分析。对于平稳离散时间信号,还常用时间序列描述方法进行研究,由此提出时间序列模型法。它是采用各种随机差分方程表示时间序列信号的模型。在许多情况下,一个平稳离散随机信号可以视为白噪声序列通过某一离散时间线性系统所产生的。在时间序列信号模型分析中,AR(自回归)模型、MA(滑动平均)模型和ARMA(自回归滑动平均)模型是三种最常见的标准线性模型,它们均由白噪声序列通过离散时间线性系统而产生。而实际应用中许多平稳时间序列往往可由这些模型近似表示,使得有关的分析变得更为简单,也为平稳随机序列的分析和产生提供了有效方法。另外,这些线性模型都具有连续功率谱形状,在参数谱估计方面显示出极大的优点。除非特别说明,本章只讨论具有连续谱特性的平稳时间序列。5.2自回归(AR)模型设)(n为具有零均值,方差为2n的平稳白噪声序列,随机序列)(nx由如下随机差分方程表示:pkknknxanx1)()()(式中p为一正整数,),,1,0(pkak为实常数,不失一般性,设10a,并设0pa。上式表示的信号称为p阶自回归模型。显然,)(nx是它的p个过去值和白噪声)(n的线性组合。用)(pAR表示上式的模型。对于上式,从统计观点讲,称)(nx以随机误差)(n线性回归于它的p个过去值。为使分析方便,首先研究一阶和二阶AR模型,然后根据p阶AR模型的分析,研究AR模型的自相关函数及功率谱密度。1.一阶AR模型根据随机序列的差分表达式,当1p时,可得一阶AR模型)()1()(nnaxnx式中a为不等于零的实常数。上式为一阶随机差分方程。若设0)0(x,可得:)2()1()()1()()(2nxanannaxnnx)1()1()(1nanan容易得到一阶矩)]([)1()]([1nEaanxEn1)]([1)]([11annEanEaan如果0)]([nE,由上式可以看出,)(nx的均值有可能不满足平稳性,即可能不满足一阶平稳。然而,如果系数1a,当n较大时,则有)]([11)]([limnEanxEn在此情况下,)(nx是一阶渐进平稳的。通常,0)]([nE,可得时间序列)(nx的自相关函数(二阶矩)为:)]()([),(mnxnxEmnnRx)]1()1()({[1nananE)]}1()1()([1mnamnamn1,1,11][2222)1(222anaaaaaaanmnnnmmmn显然,当1a时,)(nx并不满足自相关平稳性,但是,当1a并且n足够大时,有221)(),(limaamRmnnRmnxxn对于实随机序列,由于m对于)(mR对称分布,有221)(aamRmnx对于1a,不难推得,当a为正数时,)(mRx恒为正,且呈指数衰减。当a为负数时,)(mRx正负相间指数衰减。根据)(mRx可得)(nx的方差为:2221)0(aRnxx说明平稳随机序列)(nx的方差2x比白噪声方差2n大。最后讨论AR(1)模型的功率谱。对)(mRx式两边取z变换,可得其传递函数为:azzazzH111)()(nx的功率谱为)1)(()()()(221azazzzHzHzSnnx令jez,有,1cos21)(2222jnnxaeaaS2.二阶AR模型定义随机序列)(nx的二阶AR模型为:)()2()1()(21nnxanxanx式中1a和2a均为实常数,02a。上式二阶差分方程的特征多项式为:212azaz定义后移算子D为后移一步的运算,即)1()(nxnDx于是,二阶AR模型成为:)()1)(1()()()1(21221nxDzDznnxDaDa式中1z和2z为二阶AR模型特征多项式的根,即22112,1421aaaz所以,有特解为:)()1()1(1)1)(1()()(22112121nDzzDzzzzDzDznnx02112110121121)()(1kkkkkkkknzzzznDzzzz根据模型差分方程,零输入下得齐次方程0)2()1()(21nxanxanx其解为:nnzAzAnx2211)(式中1A和2A是待定系数,由初始条件确定。模型特解和上式之和即为模型的解:02112112211)()(kkknnknzzzzzAzAnx当12,1z时,上式右边齐次解随n的增大而趋于零,而特解部分具有有限方差,在均方意义下收敛,随n的增大而渐近收敛于特解公式的平稳结果。实际上,二阶模型的平稳条件与其系数1a和2a是有关的,这可通过1a和2a平面表示。设12,1z,并设121azz和221azz,根据11z,在其两边同乘)1(2z,有12121zzzz或121aa其次,根据不等式11z,两边同乘)1(2z,有12121zzzz或121aa根据上式分析,得到以下三个条件:,12a121aa以及121aa这就是保证二阶AR模型平稳的条件,可用系数分布图说明。图中示出了二阶系数欠阻尼、过阻尼和临界阻尼三种情况的系数区域分布,分别对应于以下三种情况:(1)欠阻尼:出现1z和2z一对共轭复根。(2)过阻尼:出现1z和2z不同的实根。(3)临界阻尼:出现1z和2z相同的实根。-3-2-10123-2-1.5-1-0.500.511.522.53a2=-a1-10a1a2a2=0.25*a1*a1112-1-2过阻尼欠阻尼临界阻尼对于平稳的情况,考察二阶AR模型的自相关函数,对模型方差方程两边同乘)(mnx并作集平均,可得:)()][2()1()({[21mnxnxanxanx)]}2()1(21mnxamnxa)]()([nmnE考虑到0,00,)]()([2mmnmnEn可得:0,)2()1()0(221mRaRaRnxxx0,0)2()1()(21mmRamRamRxxx以及0)0()1()2(0)1()0()1()2()1()0(2121221xxxxxxnxxxRaRaRRaRaRRaRaR由此解得:])1)[(1()1()0(122222aaaaRnx)0(1)1(21xxRaaR)0()1()2(2221xxRaaaR最后,分析AR(2)模型的功率谱密度。容易知道,其传递函数为:221111)(zazazH于是,)(nx的功率谱为:222111)(jeznxzazaS,122212jjneaea3.p阶AR模型定义如下随机差分方程为p阶AR模型)()()1()(1npnxanxanxp式中),,2,1(pkak为实常数,且0pa。对上式两边取z变换,可得:)1(),()(00azWzzXapkkk于是,以上AP(p)模型的传递函数为:pkkkzazWzXzH111)()()(根据它的特征多项式可解出p个)(zH的极点pzzz,,,21。于是,该模型的传递函数可写为:)1()1)(1(1)(11211zzzzzzzHp所以,AR模型的传递函数只有极点,除原点外没有任何零点,属于全极点模型,对应于全极点滤波器,具有无限冲激响应(IIR)。因此,模型传递函数的性质完全取决于p个极点在z平面上的分布情况。可以证明,如果所有p个极点均满足),,2,1(1pizi,那么,AR模型信号满足渐近平稳性。条件),,2,1(1pizi意味着有界输入通过线性系统导致有界输出,系统)(zH是稳定的,这说明模型传递函数的稳定性与模型的平稳性是等价的。根据AR模型的传递函数,p阶AR模型的功率谱密度为:212221)()(pkkjknnxeaHS,)(212pikjnze可见AR模型的功率谱由各模型系数),,2,1(pkak确定。最后讨论AR(p)模型参数与相关函数的关系。根据自相关函数的定义,有)()]()([mRmnxnxEx)]()([)(]})()()[({11mnnxEkmRamnkmnxanxEpkxkpkk由于0,00,)]()([2mmmnnxEn于是,有:0,)(0,)()(121mkmRamkmRamRpkxknpkxkx将上式分别以pm,,2,1代入,可得以下矩阵方程形式:0001)0()2()1()()2()0()1()2()1()1()0()1()()2()1()0(221npxxxxxxxxxxxxxxxxaaaRpRpRpRpRRRRpRRRRpRRRR由于)()(mRmRxx,可得0001)0()2()1()()2()0()1()2()1()1()0()1()()2()1()0(221npxxxxxxxxxxxxxxxxaaaRpRpRpRpRRRRpRRRRpRRRR上式称为尤里-沃克(Yule-Walker)方程。所以,如果选择了AR(p)模型,并可选定或根据观测数据估计模型的自相关函数,则可由尤里-沃克方程解出p个模型参数ka,由此确定该模型,估计模型的功率谱密度函数。关于其他AR(p)参数谱估计法还有很多,请有兴趣的同学自行查阅相关文献。5.3滑动平均(MA)模型滑动平均模型(MA模型)是时间序列模型另一种主要形式,通常用MA(q)记q阶MA模型。定义为:qkkknbnx0)()(式中),,2,1(qkbk为实常数,且0qb,称为MA(q)模型的参数,通常有10b,)(n仍为零均值、方差为2n的白噪声序列。由于q是有限的,所以MA(q)模型也是平稳的。1.一阶MA模型定义MA(1)模型为:)1()()(nbnnx容易求得2221)0()]([bRnxEnxbRx)1(1,0)(mmRx显然,MA(1)模型是一阶相关的,其相关系数在±0.5之间取值。2.q阶MA模型对于MA(q)模型qkkknbnx1)()(上式两边取z变换,可得该模型的传递函数为:qqzbzbzbzH22111)(可知)(zH有q个零点),,2,1(qkk,于是)1()1)(1()(11211zzzzHq这是一个全零点模型,具有有限冲激响应(FIR)。由MA(q)的定义式,可见)(nx是白噪声序列)(n的当前值和)1(q个过去值的线性组合,所以,当)(nx中的n大于q时,其白噪声序列的线性组合将全部为更新后的值,由此可以推断,相隔长度大于q的)(nx其自相关函数为零,即)(kx与),3,2,1)((iiqkx互不相关。因此,MA(q)模型自相关函数的相关长度为q。MA(q)的自相关函数为:])()([)]()