第12章时间序列模型2020/1/30中山学院经济与管理系1第12章时间序列模型第一节随机过程、时间序列第二节时间序列模型的分类第三节自相关函数第四节偏自相关函数第五节时间序列模型的建立与预测用什么方法去分析我国外商直接投资的变化趋势和国内生产总值的变化趋势.大部分同学都使用了时间变量或者虚拟变量作为被解释变量来分析外商直接投资的变化趋势.也就是说采用回归分析的方法来分析外商直接投资和国内生产总值的变化趋势.2020/1/30中山学院经济与管理系3回归分析方法主要是以经济理论为基础,根据几个变量之间的因果关系,建立回归模型来分析变量之间的关系,以达到分析的目的.回归分析方法既可以分析横截面数据,也可以分析时间序列数据.2020/1/30中山学院经济与管理系4时间序列分析方法由Box-Jenkins(1976)年提出。它适用于各种领域的时间序列分析。时间序列模型不同于一般的经济计量模型的两个特点是:⑴这种建模方法不以经济理论为依据,而是依据变量自身的变化规律,利用外推机制描述时间序列的变化。⑵明确考虑时间序列的非平稳性。如果时间序列非平稳,建立模型之前应先通过差分把它变换成平稳的时间序列,再考虑建模问题。第一节随机过程、时间序列为什么在研究时间序列之前先要介绍随机过程?时间序列不是无源之水。它是由相应随机过程产生的。只有从随机过程的角度认识了它的一般规律,对时间序列的分析才会有指导意义,对时间序列的认识才会更深刻。自然界中事物变化的过程可以分成两类。一类是确定型过程,一类是非确定型过程。确定型过程即可以用关于时间t的函数描述的过程。例如,真空中的自由落体运动过程,电容器通过电阻的放电过程,行星的运动过程等。2020/1/30中山学院经济与管理系7非确定型过程即不能用一个(或几个)关于时间t的确定性函数描述的过程。换句话说,对同一事物的变化过程独立、重复地进行多次观测而得到的结果是不相同的。例如,对河流水位的测量。其中每一时刻的水位值都是一个随机变量。如果以一年的水位纪录作为实验结果,便得到一个水位关于时间的函数xt。这个水位函数是预先不可确知的。只有通过测量才能得到。而在每年中同一时刻的水位纪录是不相同的。2020/1/30中山学院经济与管理系8随机过程:由随机变量组成的一个有序序列称为随机过程,用{x,tT}表示.随机过程简记为{xt}或xt。随机过程也常简称为过程。随机过程一般分为两类。一类是离散型的,一类是连续型的。如果一个随机过程{xt}对任意的tT都是一个连续型随机变量,则称此随机过程为连续型随机过程。如果一个随机过程{xt}对任意的tT都是一个离散型随机变量,则称此随机过程为离散型随机过程。91)均值E(Xt)=是与时间t无关的常数;2)方差Var(Xt)=2是与时间t无关的常数;3)协方差Cov(Xt,Xt+k)=k是只与时期间隔k有关,与时间t无关的常数;符合三个条件的过程称为平稳的随机过程.102.时间序列:随机过程的一次实现称为时间序列,也用{xt}或xt表示。与随机过程相对应,时间序列分类如下,连续型*(心电图,水位纪录仪,温度纪录仪)时间序列从相同的时间间隔点上取自连续变化的序列(人口序列)离散型一定时间间隔内的累集值(年粮食产量,进出口额序列)时间序列中的元素称为观测值。随机过程与时间序列的关系图示如下随机过程:{x1,x2,…,xT-1,xT,}第1次观测:{x11,x21,…,xT-11,xT1}第2次观测:{x12,x22,…,xT-12,xT2}第n次观测:{x1n,x2n,…,xT-1n,xTn}某河流一年的水位值,{x1,x2,…,xT-1,xT,},可以看作一个随机过程。每一年的水位纪录则是一个时间序列,{x11,x21,…,xT-11,xT1}。而在每年中同一时刻(如t=2时)的水位纪录是不相同的。例如,要记录某市日电力消耗量,则每日的电力消耗量就是一个随机变量,于是得到一个日电力消耗量关于天数t的函数。而这些以年为单位的函数族构成了一个随机过程{xt},t=1,2,…365。因为时间以天为单位,是离散的,所以这个随机过程是离散型随机过程。而一年的日电力消耗量的实际观测值序列就是一个时间序列。13自然科学领域中的许多时间序列常常是平稳.如工业生产中对液面、压力、温度的控制过程,某地的气温变化过程,某地100年的水文资料,单位时间内路口通过的车辆数过程等。但经济领域中多数宏观经济时间序列却都是非平稳的。如一个国家的年GDP序列,年投资序列,年进出口序列等。143.差分:时间序列变量的本期值与其滞后值相减的运算叫差分。首先给出差分符号。对于时间序列xt,一阶差分可表示为xt-xt-1=xt=(1-L)xt=xt-Lxt其中称为一阶差分算子。L称为滞后算子,其定义是Lnxt=xt-n。15二次一阶差分表示为,xt=xt-xt-1=(xt-xt-1)–(xt-1-xt-2)=xt-2xt-1+xt–2,或xt=(1-L)2xt=(1–2L+L2)xt=xt–2xt-1+xt–2k阶差分可表示为xt-xt-k=kxt=(1-Lk)xt=xt–Lkxtk阶差分常用于季节性数据的差分1617-3-2-1012320406080100120140160180200whitenoise-4-202420406080100120140160180200DJPY由白噪声过程产生的时间序列日元对美元汇率的收益率序列-.10-.05.00.05.102003200420052006R188001200160020002400280032002003200420052006sp19-.12-.08-.04.00.04.08.1297989900010203040506R20第二节时间序列模型的分类一、自回归过程(Auto-regressivemodel,AR)如果一个随机过程可表达为xt=1xt-1+2xt-2+…+pxt-p+ut,其中i,i=1,…p是自回归参数,ut是白噪声过程,则称xt为p阶自回归过程,用AR(p)表示。xt是由它的p个滞后变量的加权和以及ut相加而成。若用滞后算子表示(1-1L-2L2-…-pLp)xt=L)xt=ut其中L)=1-1L-2L2-…-pLp称为特征多项式或自回归算子。与自回归模型常联系在一起的是平稳性问题。对于自回归过程AR(p),如果其特征方程L)=1-1L-2L2-…-pLp=(1–G1L)(1–G2L)...(1–GpL)=0的所有根的绝对值都大于1,则AR(p)是一个平稳的随机过程。2020/1/30中山学院经济与管理系22AR(p)过程中最常用的是AR(1)、AR(2)过程,xt=1xt-1+ut保持其平稳性的条件是特征方程(1-1L)=0根的绝对值必须大于1,满足|1/1|1,也就是:|1|12020/1/30中山学院经济与管理系23二、移动平均过程(MovingAveragemodel,MA)如果一个线性随机过程可用下式表达xt=ut+1ut–1+2ut-2+…+qut–q=(1+1L+2L2+…+qLq)ut=L)ut其中1,2,…,q是回归参数,ut为白噪声过程,则上式称为q阶移动平均过程,记为MA(q)。之所以称“移动平均”,是因为xt是由q+1个ut和ut滞后项的加权和构造而成。“移动”指t的变化,“平均”指加权和。注意:(1)由定义知任何一个q阶移动平均过程都是由q+1个白噪声变量的加权和组成,所以任何一个移动平均过程都是平稳的。(2)与移动平均过程相联系的一个重要概念是可逆性。移动平均过程具有可逆性的条件是特征方程。L)=(1+1L+2L2+…+qLq)=0的全部根的绝对值必须大于1。25自回归与移动平均过程的关系①一个平稳的AR(p)过程(1-1L-2L2-…-pLp)xt=ut可以转换为一个无限阶的移动平均过程,xt=(1-1L-2L2-…-pLp)-1ut=L)-1ut②一个可逆的MA(p)过程xt=(1+1L+2L2+…+qLq)ut=L)ut可转换成一个无限阶的自回归过程,(1+1L+2L2+…+qLq)-1xt=L)-1xt=ut③对于AR(p)过程只需考虑平稳性问题,条件是L)=0的根(绝对值)必须大于1。不必考虑可逆性问题。④对于MA(q)过程,只需考虑可逆性问题,条件是L)=0的根(绝对值)必须大于1,不必考虑平稳性问题。三、自回归移动平均过程由自回归和移动平均两部分共同构成的随机过程称为自回归移动平均过程,记为ARMA(p,q),其中p,q分别表示自回归和移动平均部分的最大阶数。ARMA(p,q)的一般表达式是xt=1xt-1+2xt-2+…+pxt-p+ut+1ut-1+2ut-2+...+qut-q即(1-1L-2L2-…-pLp)xt=(1+1L+2L2+…+qLq)ut或(L)xt=(L)ut其中(L)和(L)分别表示L的p,q阶特征多项式。四、单整自回归移动平均过程以上介绍了三种平稳的随机过程。对于ARMA过程(包括AR过程),如果特征方程(L)=0的全部根取值在单位圆之外,则该过程是平稳的;如果若干个或全部根取值在单位圆之内,则该过程是强非平稳的。除此之外还有第三种情形,即特征方程的若干根取值恰好在单位圆上(根的值等于1)。这种根称为单位根,这种过程也是非平稳的。下面介绍这种重要的非平稳随机过程。28假设一个随机过程含有d个单位根,其经过d次差分之后可以变换为一个平稳的自回归移动平均过程。则该随机过程称为单整自回归移动平均过程。考虑如下模型(L)dyt=(L)ut其中(L)是一个平稳的自回归算子。即(L)=0的根都大于1。(L)表示可逆的移动平均算子。若取xt=dyt则第一个式子可表示为(L)xt=(L)ut说明yt经过d次差分之后,可用一个平稳的、可逆的ARMA过程xt表示。随机过程yt经过d次差分之后可变换为一个以(L)为p阶自回归算子,(L)为q阶移动平均算子的平稳、可逆的随机过程,则称yt为(p,d,q)阶单整(单积)自回归移动平均过程,记为ARIMA(p,d,q)。这种取名的目的是与以后各章中的称谓相一致。ARIMA过程也称为综合自回归移动平均过程。其中(L)d称为广义自回归算子。30当p0,d=0,q0时,ARIMA(p,d,q)变成ARMA(p,q)过程;d=0,p=0,q0时,ARIMA过程变成MA(q)过程;当d=q=0时,ARIMA过程变成AR(p)过程;而当p=d=q=0时,ARIMA过程变成白噪声过程;31第五节时间序列模型的建立与预测建立时间序列模型通常包括三个步骤:(1)模型的识别;(2)模型参数的估计;(3)诊断与检验。模型的识别就是通过对相关图的分析,初步确定适合于给定样本的ARIMA模型形式,即确定d,p,q的取值。2020/1/30中山学院经济与管理系32图2.8建立时间序列模型程序图一.识别用相关图和偏相关图识别模型形式(确定参数d,p,q)二.估计对初步选取的模型进行参数估计三.诊断与检验包括参数的显著性检验和残差的随机性检验模型可取吗止可取不可取1.模型的识别模型的识别主要依赖于对相关图与偏相关图的分析。在对经济时间序列进行分析之前,首先应对样本数据取对数,目的是消除数据中可能存在的异方差,然后分析其相关图。识别的第1步是判断随机过程是否平稳2020/1/30中山学院经济与管理系34由前面分析可知,如果一个随机过程是平稳的,其特征方程的根都应在单位圆之外。如果(L)=0的根接近单位圆,自相关函数将衰减的很慢。所以在分析相关图时,如果发现其衰减很慢,即可认为该时间序列是非平稳的。这时应对该时间序列进行差分,同时分析差分序列的相关图以判断差分序列的平稳性,直至得到一个平稳的序列。对于经济时间序列,差分次数,即模型ARIMA中的参数d