1时间序列模型结构模型虽然有助于人们理解变量之间的影响关系,但模型的预测精度比较低。在一些大规模的联立方程中,情况更是如此。而早期的单变量时间序列模型有较少的参数却可以得到非常精确的预测,因此随着BoxandJenkins(1984)等奠基性的研究,时间序列方法得到迅速发展。从单变量时间序列到多元时间序列模型,从平稳过程到非平稳过程,时间序列分析方法被广泛应用于经济、气象和过程控制等领域。本章将介绍如下时间序列分析方法,ARIMA模型、ARCH族模型、VAR模型、VEC模型、单位根检验及协整检验等。一、基本命令1.1时间序列数据的处理1)声明时间序列:tsset命令usegnp96.dta,clearlistin1/20genLgnp=L.gnptssetdatelistin1/20genLgnp=L.gnp2)检查是否有断点:tsreport,reportusegnp96.dta,cleartssetdatetsreport,reportdropin10/10listin1/12tsreport,reporttsreport,reportlist/*列出存在断点的样本信息*/3)填充缺漏值:tsfilltsfilltsreport,reportlistlistin1/124)追加样本:tsappendusegnp96.dta,cleartssetdatelistin-10/-1sumtsappend,add(5)/*追加5个观察值*/listin-10/-1sum25)应用:样本外预测:predictreggnp96L.gnp96predictgnp_hatlistin-10/-16)清除时间标识:tsset,cleartsset,clear1.2变量的生成与处理1)滞后项、超前项和差分项helptsvarlistusegnp96.dta,cleartssetdategenLgnp=L.gnp96/*一阶滞后*/genL2gnp=L2.gnp96genFgnp=F.gnp96/*一阶超前*/genF2gnp=F2.gnp96genDgnp=D.gnp96/*一阶差分*/genD2gnp=D2.gnp96listin1/10listin-10/-12)产生增长率变量:对数差分genlngnp=ln(gnp96)gengrowth=D.lngnpgengrowth2=(gnp96-L.gnp96)/L.gnp96gendiff=growth-growth2/*表明对数差分和变量的增长率差别很小*/listdategnp96lngnpgrowth*diffin1/101.3日期的处理日期的格式helptsfmt基本时点:整数数值,如-3,-2,-1,0,1,2,3....1960年1月1日,取值为0;3显示格式:定义含义默认格式%td日%tdDlCY%tw周%twCY!ww%tm月%tmCY!mn%tq季度%tqCY!qq%th半年%thCY!hh%ty年%tyCY1)使用tsset命令指定显示格式useB6_tsset.dta,cleartssett,dailylistuseB6_tsset.dta,cleartssett,weeklylist2)指定起始时点capdropmonthgeneratemonth=m(1990-1)+_n-1formatmonth%tmlisttmonthin1/20capdropyeargenyear=y(1952)+_n-1formatyear%tylisttyearin1/203)自己设定不同的显示格式日期的显示格式%d(%td)定义如下:%[-][t]d描述特定的显示格式具体项目释义:“描述特定的显示格式”中可包含如下字母或字符cymlndjhqw_.,:-/'!cCYMLNDJW定义如下:candC世纪值(个位数不附加/附加0)yandY不含世纪值的年份(个位数不附加/附加0)m三个英文字母的月份简写(第一个字母大写)4M英文字母拼写的月份(第一个字母大写)nandN数字月份(个位数不附加/附加0)dandD一个月中的第几日(个位数不附加/附加0)jandJ一年中的第几日(个位数不附加/附加0)h一年中的第几半年(1or2)q一年中的第几季度(1,2,3,or4)wandW一年中的第几周(个位数不附加/附加0)_displayablank(空格).displayaperiod(句号),displayacomma(逗号):displayacolon(冒号)-displayadash(短线)/displayaslash(斜线)'displayaclosesinglequote(右引号)!cdisplaycharacterc(code!!todisplayanexclamationpoint)样式1:FormatSampledateinformat-----------------------------------%td07jul1948%tdM_d,_CYJuly7,1948%tdY/M/D48/07/11%tdM-D-CY07-11-1948%tqCY.q1999.2%tqCY:q1992:2%twCY,_w2010,48-----------------------------------样式2:FormatSampledateinformat----------------------------------%d11jul1948%dDlCY11jul1948%dDlY11jul48%dM_d,_CYJuly11,1948%dd_M_CY11July1948%dN/D/Y07/11/48%dD/N/Y11/07/48%dY/N/D48/07/11%dN-D-CY07-11-1948----------------------------------clearsetobs1005gent=_n+d(13feb1978)listtin1/5formatt%dCY-N-D/*1978-02-14*/listtin1/5formatt%dcy_n_d/*1978214*/listtin1/5useB6_tsset,clearlisttssett,format(%twCY-m)list4)一个实例:生成连续的时间变量usee1920.dta,clearlistyearmonthin1/30sortyearmonthgentime=_ntssettimelistyearmonthtimein1/30generatenewmonth=m(1920-1)+time-1tssetnewmonth,monthlylistyearmonthtimenewmonthin1/301.4图解时间序列1)例1:clearsetseed13579113sim_armaar2,ar(0.70.2)nobs(200)sim_armama2,ma(0.70.2)tsset_ttslinear2ma2*亦可采用twowayline命令绘制,但较为繁琐twowaylinear2ma2_t2)例2:增加文字标注sysusetsline2,cleartssetdaytslinecalories,ttick(28nov200225dec2002,tpos(in))///ttext(347028nov2002thanks///347025dec2002x-mas,orient(vert))63)例3:增加两条纵向的标示线sysusetsline2,cleartssetdaytslinecalories,tline(28nov200225dec2002)*或采用twowayline命令locald1=d(28nov2002)locald2=d(25dec2002)linecaloriesday,xline(`d1'`d2')4)例4:改变标签tslinecalories,tlabel(,format(%tdmd))ttitle(Date(2002))tslinecalories,tlabel(,format(%td))二、ARIMA模型和SARMIA模型ARIMA模型的基本思想是:将预测对象随时间推移而形成的数据序列视为一个随机序列,用一定的数学模型来近似描述这个序列。这个模型一旦被识别后就可以从时间序列的过去值及现在值来预测未来值。ARIMA(1,1)模型:ttttyyεθερα+++=−−112.1ARIMA模型预测的基本程序:1)根据时间序列的散点图、自相关函数和偏自相关函数图以ADF单位根检验其方差、趋势及其季节性变化规律,对序列的平稳性进行识别。一般来讲,经济运行的时间序列都不是平稳序列。2)对非平稳序列进行平稳化处理。如果数据序列是非平稳的,并存在一定的增长或下降趋势,则需要对数据进行差分处理,如果数据存在异方差,则需对数据进行技术处理,直到处理后的数据的自相关函数值和偏相关函数值无显著地异于零。3)根据时间序列模型的识别规则,建立相应的模型。若平稳序列的偏相关函数是截尾的,而自相关函数是拖尾的,可断定序列适合AR模型;若平稳序列的偏相关函数是拖尾的,而自相关函数是截尾的,则可断定序列适合MA模型;若平稳序列的偏相关函数和自相关函数均是拖尾的,则序列适合ARMA模型。4)进行参数估计,检验是否具有统计意义。5)进行假设检验,诊断残差序列是否为白噪声。6)利用已通过检验的模型进行预测分析。2.2ARIMA模型中AR和MA阶数的确定方法:clearsim_armay_ar,ar(0.9)nobs(300)liney_ar_t,yline(0)acy_ar/*AR过程的ACF具有“拖尾”特征,长期记忆*/pacy_ar/*AR过程的PACF具有“截尾”特征*/7sim_armay_ma,ma(0.8)liney_ma_t,yline(0)acy_ma/*MA过程的ACF具有“截尾”特征,短期记忆*/pacy_ma/*MA过程的PACF具有锯齿型“拖尾”特征*/2.3ARIMA模型中涉及的检验:use=D.wpidfullerwpi/*单位根检验*/dfullerd_wpiwntestqwpi/*白噪声检验:Q检验*/wntestqd_wpiwntestbwpi,table/*累积统计Q检验并以列表显示*/wntestbd_wpi,tablewntestbwpi/*画出累积统计量Q*/wntestbd_wpi/*画出累积统计量Q*/corrgramwpi,lag(24)/*自相关、偏相关、Q统计量*/corrgramd_wpi,lag(24)2.4ARIMA模型和SARIMA模型的估计ARIMA模型:use=D.wpiarimawpi,arima(1,1,1)/*没有漂移项即常数项的命令是noconstant*/*或者下面的这种形式也行arimaD.wpi,ar(1)ma(1)SARIMA模型:use=ln(air)arimalnair,arima(0,1,1)sarima(0,1,1,12)noconstant2.5ARIMA模型的一个真实应用——美国批发物价指数use*单位根检验*/gend_wpi=D.wpidfullerd_wpi8arimawpi,arima(1,1,1)/*没有漂移项即常数项的命令是noconstant*/*或者下面的这种形式也行arimaD.wpi,ar(1)ma(1)acD.ln_wpi,ylabels(-.