1Wold分解定理:任何协方差平稳过程xt,都可以被表示为xt--dt=ut+1ut-1+2ut-2+…+=0jjtju其中表示xt的期望。dt表示xt的线性确定性成分,如周期性成分、时间t的多项式和指数形式等,可以直接用xt的滞后值预测。0=1,02jj∞。ut为白噪声过程。ut表示用xt的滞后项预测xt时的误差。ut=xt-E(xtxt-1,xt-2,…)0jjtju称为xt的线性非确定性成分。当dt=0时,称xt为纯线性非确定性过程。Wold分解定理由Wold在1938年提出。Wold分解定理只要求过程2阶平稳即可。从原理上讲,要得到过程的Wold分解,就必须知道无限个j参数,这对于一个有限样本来说是不可能的。实际中可以对j做另一种假定,即可以把(L)看作是2个有限特征多项式的比,(L)=0jjjL=)()(LL=ppqqLLLLLL...1...1221221注意,无论原序列中含有何种确定性成分,在前面介绍的模型种类中,还是后面介绍的自相关函数、偏自相关函数中都假设在原序列中已经剔除了所有确定性成分,是一个纯的随机过程(过程中不含有任何确定性成分)。如果一个序列如上式,xt=+dt+ut+1ut-1+2ut-2+…+则所有研究都是在yt=xt--dt的基础上进行。例如前面给出的各类模型中都不含有均值项、时间趋势项就是这个道理。2.3自相关函数以上介绍了随机过程的几种模型。实际中单凭对时间序列的观察很难确定其属于哪一种模型,而自相关函数和偏自相关函数是分析随机过程和识别模型的有力工具。1.自相关函数定义在给出自相关函数定义之前先介绍自协方差函数概念。由第一节知随机过程{xt}中的每一个元素xt,t=1,2,…都是随机变量。对于平稳的随机过程,其期望为常数,用表示,即E(xt)=,t=1,2,…(2.25)随机过程的取值将以为中心上下变动。平稳随机过程的方差也是一个常量Var(xt)=E[(xt-E(xt))2]=E[(xt-)2]=x2,t=1,2,…(2.26)x2用来度量随机过程取值对其均值的离散程度。相隔k期的两个随机变量xt与xt-k的协方差即滞后k期的自协方差,定义为k=Cov(xt,xt-k)=E[(xt-)(xt-k-)](2.27)自协方差序列k,k=0,1,…,K,称为随机过程{xt}的自协方差函数。当k=0时0=Var(xt)=x2自相关系数定义2k=)()(),(kttkttxVarxarVxxCov(2.28)因为对于一个平稳过程有Var(xt)=Var(xt-k)=x2(2.29)所以(2.28)可以改写为k=2),(xkttxxCov=2xk=0k(2.30)当k=0时,有0=1。以滞后期k为变量的自相关系数列k,k=0,1,…,K(2.31)称为自相关函数。因为k=-k即Cov(xt-k,xt)=Cov(xt,xt+k),自相关函数是零对称的,所以实际研究中只给出自相关函数的正半部分即可。2.自回归过程的自相关函数(1)平稳AR(1)过程的自相关函数AR(1)过程如下xt=xt-1+ut,1用xt-k同乘上式两侧xtxt-k=xt-1xt-k+utxt-k两侧同取期望,k=1k-1其中E(xt-kut)=0(ut与其t-k期及以前各项都不相关)。两侧同除0得,k=1k-1=11k-2=…=1k0因为o=1。所以有k=1k,(k0)对于平稳序列有。所以当1为正时,自相关函数按指数衰减至零(过阻尼情形),当1为负时,自相关函数正负交错地指数衰减至零。见图2.6。因为对于经济时间序列,1一般为正,所以第一种情形常见。指数衰减至零的表现形式说明随着时间间隔的加长,变量之间的关系变得越来越弱。-0.8-0.6-0.4-0.20.00.20.40.60.82468101214-0.8-0.6-0.4-0.20.00.20.40.60.824681012140(经济问题中常见)0(经济问题中少见)图2.6AR(1)过程的自相关函数(2)AR(p)过程的自相关函数用xt-k,(k同乘平稳的p阶自回归过程3xt=1xt-1+2xt-2+…+pxt-p+ut(2.32)的两侧,得xt-kxt=1xt-kxt-1+2xt-kxt-2+…+pxt-kxt-p+xt-kut(2.33)对上式两侧分别求期望得k=1k-1+2k-2+…+pk-p,k0(2.34)上式中对于k0,有E(xt-kut)=0。因为当k0时,xt-k发生在ut之前,所以xt-k与ut不相关。用0分别除(2.34)式的两侧得k=1k-1+2k-2+…+pk-p,k0(2.35)令(L)=(1-1L-2L2-…-pLp)其中L为k的滞后算子,则上式可表达为(L)k=0因(L)可因式分解为,(L)=piiLG1)-(1,则(2.35)式的通解(证明见附录)是k=A1G1k+A2G2k+…+ApGpk.(2.36)其中Ai,i=1,…p为待定常数。这里Gi-1,i=1,2,…,p是特征方程(L)=(1-1L-2L2-…-pLp)=0的根。为保证随机过程的平稳性,要求|Gi|1,i=1,2,…,p。这会遇到如下两种情形。①当Gi为实数时,(2.36)式中的AiGik将随着k的增加而几何衰减至零,称为指数衰减(过阻尼情形)。②当Gi和Gj表示一对共轭复根时,设Gi=a+bi,Gj=a–bi,22ba=R,则Gi,Gj的极座标形式是Gi=R(Cos+iSin),Gj=R(Cos-iSin)。若AR(p)过程平稳,则Gi1,所以必有R1。那么随着k的增加,Gik=Rk(Cosk+iSink),Gjk=Rk(Cosk-iSink),自相关函数(2.36)式中的相应项Gik,Gjk将按正弦振荡形式衰减(欠阻尼情形)。实际中的平稳自回归过程的自相关函数常是由指数衰减和正弦衰减两部分混合而成。③从(2.36)式可以看出,当特征方程的根取值远离单位圆时,k不必很大,自相关函数就会衰减至零。④有一个实数根接近1时,自相关函数将衰减的很慢,近似于线性衰减。当有两个以4上的根取值接近1时,自相关函数同样会衰减的很慢。-0.8-0.6-0.4-0.20.00.20.40.60.82468101214-0.8-0.6-0.4-0.20.00.20.40.60.82468101214a.两个特征根为实根b.两个特征根为共轭复根图2.6AR(2)过程的自相关函数3.移动平均过程的自相关函数(1)MA(1)过程的自相关函数。对于MA(1)过程xt=ut+1ut-1有k=E(xtxt-k)=E[(ut+1ut-1)(ut-k+1ut-k-1)]当k=0时,0=E(xtxt)=E[(ut+1ut-1)(ut+1ut-1)]=E(ut2+1utut-1+1utut-1+12ut-12)=(1+12)2当k=1时1=E(xtxt-1)=E[(ut+1ut-1)(ut–1+1ut–2)]=E(utut-1+1ut-12+1utut-2+12ut-1ut-2)=1E(ut-1)2=12当k1时,k=E[(ut+1ut-1)(ut–k+1ut–k-1)]=0综合以上三种情形,MA(1)过程自相关函数为k=0k=2111,k=10,k1,见图2.7。-0.8-0.6-0.4-0.20.00.20.40.60.82468101214-0.8-0.6-0.4-0.20.00.20.40.60.824681012141010图2.7MA(1)过程的自相关函数可见MA(1)过程的自相关函数具有截尾特征。当k1时,k=0。(2)MA(q)过程的自相关函数MA(q)过程的自相关函数是k=222212211...1...qqkqkkk,k=1,2,…,q,0kq,当kq时,k=0,说明k,k=0,1,…具有截尾特征。5(注意:模型移动平均项的符号以及这里k的符号正好与Box-Jenkins书中的符号相反,这样表示的好处是保持与计算机输出结果一致。)4.ARMA(1,1)过程的自相关函数ARMA(1,1)过程的自相关函数k从1开始指数衰减。1的大小取决于1和1,1的符号取决于(1-1)。若10,指数衰减是平滑的,或正或负。若10,相关函数为正负交替式指数衰减。对于ARMA(p,q)过程,p,q2时,自相关函数是指数衰减或正弦衰减的。5.相关图(correlogram)对于一个有限时间序列(x1,x2,…,xT)用样本平均数x=T1Tttx1估计总体均值,用样本方差s2=21)(1TttxxT估计总体方差x2。当用样本矩估计随机过程的自相关函数,则称其为相关图或估计的自相关函数,记为rk=0CCk,k=0,1,2,…,K,(KT).(2.41)rk是对k的估计。其中Ck=T1kTtkttxxxx1),)((k=0,1,2,…,K,(2.42)是对k的估计C0=21)(1TttxxT(2.43)是对0的估计,T是时间序列数据的样本容量。实际中T不应太小,最好能大于60。注意:(2.42)式分母为T,不是T-k。Ck为有偏估计量。但在小样本条件下更有效。注:2个标准差=2T-1/2=2(1/7)=0.286。图中虚线表示到中心线2个标准差宽度。6相关图是对自相关函数的估计。由于MA过程和ARMA过程中的MA分量的自相关函数具有截尾特性,所以通过相关图可以估计MA过程的阶数q。相关图是识别MA过程阶数和ARMA过程中MA分量阶数的一个重要方法。实际应用中相关图一般取k=15就足够了。rk的方差近似为T-1。所以在观察相关图时,若rk的绝对值超过2T-1/2(2个标准差),就被认为是显著地不为零。当T充分大时,近似有(rk-0)/T-1/2=rkT1/2~N(0,1)2.4偏自相关函数偏自相关函数是描述随机过程结构特征的另一种方法。用kj表示k阶自回归式中第j个回归系数,则k阶自回归模型表示为xt=k1xt-1+k2xt-2+…+kkxt-k+ut其中kk是最后一个回归系数。若把k=1,2…的一系列回归式kk看作是滞后期k的函数,则称kk,k=1,2…(2.45)为偏自相关函数。它由下式中的红项组成。xt=11xt-1+utxt=21xt-1+22xt-2+ut。。。xt=k1xt-1+k2xt-2+…+kkxt-k+ut因偏自相关函数中每一个回归系数kk恰好表示xt与xt-k在排除了其中间变量xt-1,xt-2,…,xt-k+1影响之后的相关系数,xt-k1xt-1-k2xt-2-…-kk-1xt-k+1=kkxt-k+ut所以偏自相关函数由此得名。对于AR(1)过程,xt=11xt-1+ut,当k=1时,110,当k1时,kk=0,所以AR(1)过程的偏自相关函数特征是在k=1出现峰值(11=1)然后截尾。-0.8-0.6-0.4-0.20.00.20.40.60.82468101214-0.8-0.6-0.4-0.20.00.20.40.60.82468101214110110AR(1)过程的偏相关图对于AR(2)过程,当k2时,kk0,当k2时,kk=0。偏自相关函数在滞后期2以后有截尾特性。对于AR(p)过程,当kp时,kk0,当kp时,kk=0。偏自相关函数在滞后期p以后有截尾特性,因此可用此特征识别AR(p)过程的阶数。MA(1)过程的偏自相关函数呈指数衰减特征。若10,偏自相关函