1第2章时间序列模型时间序列分析方法由Box-Jenkins(1976)年提出。它适用于各种领域的时间序列分析。时间序列模型不同于经济计量模型的两个特点是:⑴这种建模方法不以经济理论为依据,而是依据变量自身的变化规律,利用外推机制描述时间序列的变化。⑵明确考虑时间序列的非平稳性。如果时间序列非平稳,建立模型之前应先通过差分把它变换成平稳的时间序列,再考虑建模问题。1.随机过程、时间序列定义2.时间序列模型的分类3.自相关函数与偏自相关函数4.建模步骤(识别、参数估计、诊断检验)5.乘积季节模型(略)6.案例分析2.1随机过程、时间序列为什么在研究时间序列之前先要介绍随机过程?就是要把时间序列的研究提高到理论高度来认识。时间序列不是无源之水。它是由相应随机过程产生的。只有从随机过程的高度认识了它的一般规律。对时间序列的研究才会有指导意义。对时间序列的认识才会更深刻。自然界中事物变化的过程可以分成两类。一类是确定型过程,一类是非确定型过程。确定型过程即可以用关于时间t的函数描述的过程。例如,真空中的自由落体运动过程,电容器通过电阻的放电过程,行星的运动过程等。非确定型过程即不能用一个(或几个)关于时间t的确定性函数描述的过程。换句话说,对同一事物的变化过程独立、重复地进行多次观测而得到的结果是不相同的。例如,对河流水位的测量。其中每一时刻的水位值都是一个随机变量。如果以一年的水位纪录作为实验结果,便得到一个水位关于时间的函数xt。这个水位函数是预先不可确知的。只有通过测量才能得到。而在每年中同一时刻的水位纪录是不相同的。随机过程:由随机变量组成的一个有序序列称为随机过程,记为{x(s,t),sS,tT}。其中S表示样本空间,T表示序数集。对于每一个t,tT,x(·,t)是样本空间S中的一个随机变量。对于每一个s,sS,x(s,·)是随机过程在序数集T中的一次实现。{x11,x21,…,xT-11,xT1}{x12,x22,…,xT-12,xT2}样本空间{x1s,x2s,…,xT-1s,xTs}随机过程简记为{xt}或xt。随机过程也常简称为过程。随机过程一般分为两类。一类是离散型的,一类是连续型的。如果一个随机过程{xt}对任意的tT都是一个连续型随机变量,则称此随机过程为连续型随机过程。如果一个随机过程{xt}对任意的tT都是一个离散型随机变量,则称此随机过程为离散型随机过程。本书只考虑离散型随机过程。连续型严(强)平稳过程随机过程平稳的离散型宽平稳过程非平稳的2严(强)平稳过程:一个随机过程中若随机变量的任意子集的联合分布函数与时间无关,即无论对T的任何时间子集(t1,t2,…,tn)以及任何实数k,(ti+k)T,i=1,2,…,n都有F(x(t1),x(t2),…,x(tn))=F(x(t1+k),x(t2+k),…,x(tn+k))成立,其中F(·)表示n个随机变量的联合分布函数,则称其为严平稳过程或强平稳过程。严平稳意味着随机过程所有存在的矩都不随时间的变化而变化。序列的期望、方差、自协方差、自相关系数等均不随时间推移而改变。严平稳的条件是非常严格的,而且对于一个随机过程,上述联合分布函数不便于分析和使用。因此希望给出不象强平稳那样严格的条件。若放松条件,则可以只要求分布的主要参数相同。如只要求从一阶到某阶的矩函数相同。这就引出了宽平稳概念。如果一个随机过程m阶矩以下的矩的取值全部与时间无关,则称该过程为m阶平稳过程。比如E[x(ti)]=E[x(ti+k)]=,Var[x(ti)]=Var[x(ti+k)]=2,Cov[x(ti),x(tj)]=Cov[x(ti+k),x(tj+k)]=ij2,其中,2和ij2为常数,不随t,(tT);k,((tr+k)T,r=i,j)变化而变化,则称该随机过程{xt}为二阶平稳过程。该过程属于宽平稳过程。如果严平稳过程的二阶矩为有限常数值,则其一定是宽平稳过程。反之,一个宽平稳过程不一定是严平稳过程。但对于正态随机过程而言,严平稳与宽平稳是一致的。这是因为正态随机过程的联合分布函数完全由均值、方差和协方差所惟一确定。本书简称二阶平稳过程为平稳过程。时间序列:随机过程的一次实现称为时间序列,也用{xt}或xt表示。与随机过程相对应,时间序列分类如下,连续型*(心电图,水位纪录仪,温度纪录仪)时间序列从相同的时间间隔点上取自连续变化的序列(人口序列)离散型一定时间间隔内的累集值(年粮食产量,进出口额序列)时间序列中的元素称为观测值。{xt}既表示随机过程,也表示时间序列。xt既表示随机过程的元素随即变量,也表示时间序列的元素观测值。在不致引起混淆的情况下,为方便,xt也直接表示随机过程和时间序列。随机过程与时间序列的关系图示如下随机过程:{x1,x2,…,xT-1,xT,}第1次观测:{x11,x21,…,xT-11,xT1}第2次观测:{x12,x22,…,xT-12,xT2}第n次观测:{x1n,x2n,…,xT-1n,xTn}某河流一年的水位值,{x1,x2,…,xT-1,xT,},可以看作一个随机过程。每一年的水位纪录则是一个时间序列,{x11,x21,…,xT-11,xT1}。而在每年中同一时刻(如t=2时)的水位纪录是不相同的。{x21,x22,…,x2n,}构成了x2取值的样本空间。3例如,要记录某市日电力消耗量,则每日的电力消耗量就是一个随机变量,于是得到一个日电力消耗量关于天数t的函数。而这些以年为单位的函数族构成了一个随机过程{xt},t=1,2,…365。因为时间以天为单位,是离散的,所以这个随机过程是离散型随机过程。而一年的日电力消耗量的实际观测值序列就是一个时间序列。自然科学领域中的许多时间序列常常是平稳的。如工业生产中对液面、压力、温度的控制过程,某地的气温变化过程,某地100年的水文资料,单位时间内路口通过的车辆数过程等。但经济领域中多数宏观经济时间序列却都是非平稳的。如一个国家的年GDP序列,年投资序列,年进出口序列等。为便于计算,先给出差分定义。差分:时间序列变量的本期值与其滞后值相减的运算叫差分。首先给出差分符号。对于时间序列xt,一阶差分可表示为xt-xt-1=xt=(1-L)xt=xt-Lxt(2.1)其中称为一阶差分算子。L称为滞后算子,其定义是Lnxt=xt-n。二次一阶差分表示为,xt=xt-xt-1=(xt-xt-1)–(xt-1-xt-2)=xt-2xt-1+xt–2,或xt=(1-L)2xt=(1–2L+L2)xt=xt–2xt-1+xt–2(2.2)k阶差分可表示为xt-xt-k=kxt=(1-Lk)xt=xt–Lkxtk阶差分常用于季节性数据的差分。下面介绍两种基本的随机过程(1)白噪声(whitenoise)过程白噪声过程:对于随机过程{xt,tT},如果E(xt)=0,Var(xt)=2,tT;Cov(xt,xt+k)=0,(t+k)T,k0,则称{xt}为白噪声过程。-3-2-1012320406080100120140160180200whitenoise-4-202420406080100120140160180200DJPY图2.1a由白噪声过程产生的时间序列图2.1b日元对美元汇率的收益率序列400.511.522.5300.050.10.150.20.250.300.511.522.5300.20.40.60.811.2图2.1c白噪声过程的总体谱2.1dAR(2)过程的总体谱(1=0.99,2=-0.5)白噪声是平稳的随机过程,因其均值为零,方差不变,随机变量之间非相关。显然上述白噪声是二阶宽平稳随机过程。如果{xt}同时还服从正态分布,则它就是一个强平稳的随机过程。白噪声源于物理学与电学,原指音频和电信号在一定频带中的一种强度不变的干扰声。(2)随机游走(randomwalk)过程对于下面的表达式xt=xt-1+ut(2.3)如果ut为白噪声过程,则称xt为随机游走过程。-25-20-15-10-50520406080100120140160180200randomwalk8085909510010511050100150200250300JPY图2.1e.由随机游走过程产生时间序列图2.1f.日元对美元汇率(300天,1995年)“随机游走”一词首次出现于1905年自然(Nature)杂志第72卷PearsonK.和RayleighL.的一篇通信中。该信件的题目是“随机游走问题”。文中讨论寻找一个被放在野地中央的醉汉的最佳策略是从投放点开始搜索。随机游走过程的均值为零,方差为无限大。xt=xt-1+ut=ut+ut-1+xt-2=ut+ut-1+ut-2+…E(xt)=E(ut+ut-1+ut-2+…)=0,Var(xt)=Var(ut+ut-1+ut-2+…)=tu2所以随机游走过程是非平稳的随机过程。2.2时间序列模型的分类(1)自回归过程如果一个线性过程可表达为5xt=1xt-1+2xt-2+…+pxt-p+ut,(2.4)其中i,i=1,…p是自回归参数,ut是白噪声过程,则称xt为p阶自回归过程,用AR(p)表示。xt是由它的p个滞后变量的加权和以及ut相加而成。若用滞后算子表示(1-1L-2L2-…-pLp)xt=L)xt=ut(2.5)其中L)=1-1L-2L2-…-pLp称为特征多项式或自回归算子。与自回归模型常联系在一起的是平稳性问题。对于自回归过程AR(p),如果其特征方程z)=1-1z-2z2-…-pzp=(1–G1z)(1–G2z)...(1–Gpz)=0(2.6)的所有根的绝对值都大于1,则AR(p)是一个平稳的随机过程。AR(p)过程中最常用的是AR(1)、AR(2)过程,xt=1xt-1+ut(2.7)保持其平稳性的条件是特征方程(1-1L)=0根的绝对值必须大于1,满足|1/1|1也就是|1|1解释如下:一阶自回归过程,xt=1xt-1+ut,可写为(1-1L)xt=utxt=(1-1L)-1ut在|1|1条件下,有xt=(1+1L+(1L)2+(1L)3+…)ut若保证AR(1)具有平稳性,0i1iiL必须收敛,即1必须满足|1|1。这是容易理解的,如果|1|1,0i1iiL发散,于是xt变成一个非平稳随机过程。由(2.7)式有xt=ut+1ut-1+12xt-2=ut+1ut-1+12ut-2+…(短记忆过程)因为ut是一个白噪声过程,所以对于平稳的AR(1)过程E(xt)=0Var(xt)=u2+12u2+14u2+…=22111u上式也说明若保证xt平稳,必须保证|1|1。例1:有AR(1)模型xt=0.6xt-1+ut则,(1-0.6L)xt=ut6xt=L6.011ut=(1+0.6L+0.36L2+0.216L3+…)ut=ut+0.6ut-1+0.36ut-2+0.216ut-3+…上式变换为一个无限阶的移动平均过程。下面分析AR(2)过程xt=1xt-1+2xt-2+ut(0)具有平稳性的条件。对于AR(2)过程,特征方程式是1-1L-2L2=0上式的两个根是L1,L2=2221124设1=1/L1,2=1/L21,2=2211242=242211(1)则(0)式,xt=1xt-1+2xt-2+ut,改写为(1-1L)(1-2L)xt=ut。AR(2)模型具有平稳性的条件是L11,L21(在单位圆外)或11,21(2)下面利用上述平稳性条件分析AR(2)过程中参数2,1的值域。由(1)式得1+2=242211+242211=1(3)12=421-44221=-2(4)利用(3),(