第五章非平稳时间序列的随机分析(I)ARIMA建模确定性因素分解法优点:原理简单,操作简便,易于解释,主要应用与宏观经济分析与预测;缺点:只能提取强劲的确定性信息5.1差分运算5.1.1差分的定义及其实质这等价于当期的序列值等于前一期的序列值加上一个波动(差分),一个特殊的1阶自回归过程(单位根)适当的差分可以消除序列中蕴含的趋势性和周期性;5.1.2差分方式的选择(1)序列蕴含着线性趋势,则1阶差分就可以实现趋势平稳【例5.1】1964年-1999年中国纱年产量dataa;inputyearsha;dif=dif(sha);cards;数据;procgplot;plotsha*yeardif*year;symbolv=starc=redi=join;run;原始时间序列,可以看出是非平稳的,有近似线性趋势差分后的序列,可以看出已经消除了线性趋势,呈现平稳的随机波动注意,差分后的序列样本少了一个(为什么?)思考:为什么1阶差分可以消除线性趋势?(2)序列含有曲线趋势,通常低阶(2阶或者3阶)的差分就可以消除趋势项【例5.2】1950-1999年北京市民用车辆拥有量序列原始时间序列,有曲线趋势01960197019801990dif-40-30-20-100102030405060196019701980199020001阶差分后的序列,可以看出信息提取不充分,仍然有曲线趋势2阶差分后的序列,可以看出不再含有确定性的趋势了0100200300400500600700800900100011001200130014001500year195019601970198019902000dif1-100102030405060708090100110120130140year195019601970198019902000(3)蕴含固定周期的序列对蕴含固定周期的序列,可以进行步长为周期长度的差分运算【例5.3】1962年1月至1975年12月平均每头奶牛的月产奶量原始时间序列,可以看出同时含有线性趋势项和周期项对该数据我们首先做1阶差分消除线性趋势,我们看到差分后的序列具有较稳定的季节波动。dif2-40-30-20-100102030405060year195019601970198019902000milk5006007008009001000time19621962196319631964196419651965196619661967196719681968196919691970197019711971197219721973197319741974197519751976对上述差分后的序列做12步(周期长为12)的周期差分,提取季节波动我们可以看到周期差分后的序列呈现典型的平稳随机波动,我们可以对该序列做ARMA建模。5.1.3过差分问题理论上,足够多次的差分运算可以充分提取原序列中的非平稳确定性信息,但是在差分中会有信息损失(样本量会减少),差分运算要恰到好处,避免过度差分。【例5.4】假定下列非平稳序列其中为白噪声,容易计算均为平稳序列,但是dif1-70-60-50-40-30-20-100102030405060708090100110120time19621962196319631964196419651965196619661967196719681968196919691970197019711971197219721973197319741974197519751976dif1_12-30-20-10010203040time19621962196319631964196419651965196619661967196719681968196919691970197019711971197219721973197319741974197519751976;过差分使得方差增大,没有必要;5.2ARIMA模型简介许多非平稳的序列经过适当差分后会显示出平稳序列的性质,我们称这个非平稳序列为差分平稳序列。对差分平稳序列可以使用模型建模。5.1.1ARIMA模型定义具有如下结构的模型称为求和自回归滑动平均模型(AutoregressiveIntegratedMovingAverage,ARIMA),简记为模型;这个模型也可以简记为特别的,当时,即为模型当时,可以简记为模型当时,可以简记为模型当时,则上述模型即为该模型称为随机漫步或者随机游走(RandomWalk)模型,该模型是有效市场理论(EfficientMarketTheory,EMT)的核心,经济学家普遍认为投机价格的走势类似于随机漫步.5.2.2ARIMA模型的性质(1)平稳性对于模型:如果我们记显然,的根有个在单位圆外,有个在单位圆上,因此不平稳;(2)方差当时,不仅均值非平稳,序列方差也非平稳了,以最简单的随机漫步模型为例容易计算;但是为常数;5.2.3ARIMA建模(1)ARIMA模型建模的步骤NYNY以具体的例子来说明【例5.6】1952年至1988年中国农业实际国民收入指数序列1.原始时间序列,可以看出序列具有明显的趋势,为典型的非平稳序列对原始序列做1阶差分,差分后的序列见下图,可以看出差分后的序列基本上在常值附近波动,为更进一步的考察期平稳性,观察其ACF图像agric80100120140160180200220240260280time195019551960196519701975198019851990获得观察值序列平稳性检验差分运算白噪声检验ARMA建模建模结束AutocorrelationsLagCovarianceCorrelation-198765432101234567891StdError078.2391671.00000||********************|0142.0757330.53778|.|***********|0.166667216.2466050.20765|.|****.|0.20939237.0585880.09022|.|**.|0.2150364-11.132207-.14228|.***|.|0.2160855-7.917076-.10119|.**|.|0.2186726-9.245185-.11817|.**|.|0.2199697-11.564313-.14781|.***|.|0.22172587.1087350.09086|.|**.|0.224446912.9651160.16571|.|***.|0.22546510-0.909105-.01162|.|.|0.22882311-2.455085-.03138|.*|.|0.22884012-3.501852-.04476|.*|.|0.22895913-6.583063-.08414|.**|.|0.22920214-7.883765-.10076|.**|.|0.23005815-4.783310-.06114|.*|.|0.231281162.0875150.02668|.|*.|0.2317301712.8947760.16481|.|***.|0.2318151815.6312500.19979|.|****.|0.235047可以看出序列仅仅具有强烈的短期自相关性,所以可以认为1阶差分后的序列平稳。2.对差分后的序列进行白噪声检验,结果如下AutocorrelationCheckforWhiteNoiseToChi-PrLagSquareDFChiSq--------------------Autocorrelations--------------------615.3360.01780.5380.2080.090-0.142-0.101-0.1181218.33120.1060-0.1480.0910.166-0.012-0.031-0.0451824.66180.1344-0.084-0.101-0.0610.0270.1650.200可以看出在0.05的检验显著性水平下,延迟6阶的LB检验统计量为15.33,P值为0.01780.05,因此该差分后的序列不能认为是白噪声,我们可以对其做进一步的建模;3.定阶观察差分后序列的ACF和PACF,我们可以看到ACF1阶截尾,而PACF则显著的不截尾,因此考虑用MA(1)模型来拟合。考虑到前面已经进行了1阶差分运算,实际上我们是在用IMA(1,1)模型来拟合原始时间序列。AutocorrelationCheckforWhiteNoiseToChi-PrLagSquareDFChiSq--------------------Autocorrelations--------------------615.3360.01780.5380.2080.090-0.142-0.101-0.1181218.33120.1060-0.1480.0910.166-0.012-0.031-0.0451824.66180.1344-0.084-0.101-0.0610.0270.1650.200-20-100102030time195019551960196519701975198019851990PartialAutocorrelationsLagCorrelation-19876543210123456789110.53778|.|***********|2-0.11474|.**|.|30.03912|.|*.|4-0.27003|.*****|.|50.16219|.|***.|6-0.17787|.****|.|70.03051|.|*.|80.21004|.|****.|90.02902|.|*.|10-0.25795|.*****|.|110.04421|.|*.|120.04346|.|*.|13-0.03857|.*|.|14-0.15591|.***|.|150.21892|.|****.|160.00855|.|.|170.05496|.|*.|180.01825|.|.|4.利用条件最小二乘估计法,我们估计得结果如下:ConditionalLeastSquaresEstimationStandardApproxParameterEstimateErrortValuePr|t|LagMU4.996612.086382.390.02230MA1,1-0.707660.12683-5.58.00011ConstantEstimate4.996611VarianceEstimate56.48743StdErrorEstimate7.515812AIC249.3305SBC252.4976NumberofResiduals36*AICandSBCdonotincludelogdeterminant.CorrelationsofParameterEstimatesParameterMUMA1,1MU1.000-0.018MA1,1-0.0181.000AutocorrelationCheckofResidualsToChi-PrLagSquareDFChiSq--------------------Autocorrelations--------------------63.6350.6036-0.0240.1660.108-0.2060.035-0.058127.86110.7262-0.1450.0740.182-0.1240.061-0.0691811.03170.8552-0.015-0.081-0.0240.0060.0730.1752418.73230.7166-0.0320.0430.099-0.188-0.060-0.155ModelforvariableagricEstimatedMean4.996611Period(s)ofDifferencing1MovingAverageFactorsFactor1:1+0.70766B**(