第五章非平稳序列的随机分析本章结构差分运算1.ARIMA模型2.Auto-Regressive模型3.异方差的性质4.方差齐性变换5.条件异方差模型6.5.1差分运算本节结构差分运算的实质差分方式的选择过差分确定性趋势所谓确定性趋势(deterministictrend),是指模型中含有明确的时间t变量,趋势可以有t的线性函数表示。例如:确定性趋势模型又称“均值非平稳模型”、“趋势平稳模型”。确定性趋势模型剔除趋势项即为平稳模型。如上例:ttxabtttxbta随机趋势模型随机趋势模型常被称为单位根过程,模型中AR项含有成分(1-B),典型例子是随机游走模型。随机趋势模型又称“差分平稳模型”,可以通过差分剔除趋势,使模型平稳化。如对随机游走模型:1tttxx差分运算的实质差分方法是一种非常简便、有效的确定性信息提取方法Cramer分解定理在理论上保证了适当阶数的差分一定可以充分提取确定性信息差分运算的实质是使用自回归的方式提取确定性信息diitiditdtdxCxBx0)1()1(差分方式的选择序列蕴含着显著的线性趋势,一阶差分就可以实现趋势平稳序列蕴含着曲线趋势,通常低阶(二阶或三阶)差分就可以提取出曲线趋势的影响对于蕴含着固定周期的序列进行步长为周期长度的差分运算,通常可以较好地提取周期信息例5.1【例2.1】1964年——1999年中国纱年产量序列蕴含着一个近似线性的递增趋势。对该序列进行一阶差分运算考察差分运算对该序列线性趋势信息的提取作用1tttxxx差分前后时序图原序列时序图差分后序列时序图例5.2尝试提取1950年——1999年北京市民用车辆拥有量序列的确定性信息差分后序列时序图一阶差分二阶差分例5.3差分运算提取1962年1月——1975年12月平均每头奶牛的月产奶量序列中的确定性信息差分后序列时序图一阶差分1阶-12步差分过差分从理论上而言,足够多次的差分运算可以充分地提取原序列中的非平稳确定性信息。但应当注意的是,差分运算的阶数并不是越多越好。因为差分运算是一种对信息的提取、加工过程,每次差分都会有信息的损失。在实际应用中差分运算的阶数得适当,应当避免过度差分的现象。例5.4假设序列如下考察一阶差分后序列和二阶差分序列的平稳性与方差ttatx102()0,(),(,)0,1ttttiEaVaraCovaai比较一阶差分平稳方差小二阶差分(过差分)平稳方差大111tttttaaxxx21122ttttttaaaxxx212)()(tttaaVarxVar22126)2()(ttttaaaVarxVar本章结构差分运算1.ARIMA模型2.Auto-Regressive模型3.异方差的性质4.方差齐性变换5.条件异方差模型6.5.2ARIMA模型本节结构ARIMA模型结构ARIMA模型性质ARIMA模型建模ARIMA模型预测疏系数模型季节模型ARMA模型的定义具有如下结构的模型称为自回归移动平均模型,简记为特别当时,称为中心化模型),(qpARMA01111200()0(),()0,()0,ttptpttqtqpqtttsstxxxEVarEstExst,,00),(qpARMA系数多项式引进延迟算子,中心化模型又可以简记为阶自回归系数多项式阶移动平均系数多项式),(qpARMAttBxB)()(qqqBBBB2211)(pppBBBB2211)(ARIMA模型结构使用场合差分平稳序列拟合模型结构tsExtsEVarEBxBtsstttttd,0,0)(,)(0)()()(2,ARIMA模型族d=0ARIMA(p,d,q)=ARMA(p,q)P=0ARIMA(P,d,q)=IMA(d,q)q=0ARIMA(P,d,q)=ARI(p,d)d=1,P=q=0ARIMA(P,d,q)=randomwalkmodel随机游走模型(randomwalk)模型结构模型使用场合KarlPearson(1905)在《自然》杂志上提问:假如有个醉汉醉得非常严重,完全丧失方向感,把他放在荒郊野外,一段时间之后再去找他,在什么地方找到他的概率最大呢?这个醉汉的行走轨迹就是一个随机游走模型。传统的经济学家普遍认为投机价格的走势类似于随机游走模型,随机游走模型也是有效市场理论的核心。tsExtsEVarExxtsstttttt,0,0)(,)(0)(21,ARIMA模型的平稳性ARIMA(p,d,q)模型共有p+d个特征根,其中p个在单位圆内,d个在单位圆上。所以当时ARIMA(p,d,q)模型非平稳。例5.5ARIMA(0,1,0)时序图0dARIMA模型的方差齐性时,原序列方差非齐性d阶差分后,差分后序列方差齐性0d2110)()()0,1,0(txVarxVarARIMAttt模型2)()()0,1,0(ttVarxVarARIMA模型ARIMA模型建模步骤获得观察值序列平稳性检验差分运算YN白噪声检验Y分析结束N拟合ARMA模型例5.6对1952年——1988年中国农业实际国民收入指数序列建模一阶差分序列时序图一阶差分序列自相关图一阶差分后序列白噪声检验延迟阶数统计量P值615.330.01781218.330.10601824.660.13442拟合ARMA模型偏自相关图建模定阶ARIMA(0,1,1)参数估计模型检验ttBxB)70766.01(99661.4)1(48763.56)(tVar残差白噪声检验参数显著性检验延迟阶数统计量P值待估参数t统计量P值63.630.60362.390.0223127.860.7262-5.580.00011811.030.855221ARIMA模型预测原则最小均方误差预测原理Green函数递推公式jdpjdpjj1122112111式中,,0,10,0jjj0,0jj预测值)()(111111tltltlltltltx)(let)(ˆlxt22121)1()]([0)]([lttleVarleEltx那么的真实值为:序列分解111111ˆ()()tltltlltltltttxGGGGelxl预测误差预测值1t12210ˆ(|,,)()(|,,)[()]ttlttlttltttiiExxxxlVarxxxVarelG例5.7已知ARIMA(1,1,1)模型为且求的95%的置信区间ttBxBB)6.01()1)(8.01(5.41tx3.5tx8.0t123tx预测值等价形式计算预测值69.5)1(ˆ8.0)2(ˆ8.1)3(ˆ59.58.0)1(ˆ8.1)2(ˆ46.56.08.08.1)1(ˆ1ttttttttttxxxxxxxxx12126.08.08.1)6.01()8.08.11(tttttttxxxBxBB预报方差与置信区间广义自相关函数为Green函数为方差为95%置信区间为2()()(1)(10.8)(1)11.80.dBBBBBBB1211.80.61.21.80.81.362896.4)1()]3([22221eVarˆˆ((3)1.96((3)),(3)1.96((3)))(1.63,9.75)ttxVarexVare例5.6续:对中国农业实际国民收入指数序列的预测疏系数模型ARIMA(p,d,q)模型是指d阶差分后自相关最高阶数为p,移动平均最高阶数为q的模型,通常它包含p+q个独立的未知系数:如果该模型中有部分自相关系数或部分移动平滑系数为零,即原模型中有部分系数省缺了,那么该模型称为疏系数模型。qp,,,,,11pjj1,qkk1,疏系数模型类型如果只是自相关部分有省缺系数,那么该疏系数模型可以简记为为非零自相关系数的阶数如果只是移动平滑部分有省缺系数,那么该疏系数模型可以简记为为非零移动平均系数的阶数如果自相关和移动平滑部分都有省缺,可以简记为),),,,((1qdppARIMAm)),,(,,(1nqqdpARIMA)),,(,),,,((11nmqqdppARIMAmpp,,1nqq,,1例5.8对1917年-1975年美国23岁妇女每万人生育率序列建模一阶差分自相关图建模定阶ARIMA((1,4),1,0)参数估计模型检验模型显著参数显著ttBBxB433597.026633.011)1(季节模型简单季节模型乘积季节模型简单季节模型简单季节模型是指序列中的季节效应和其它效应之间是加法关系简单季节模型通过简单的趋势差分、季节差分之后序列即可转化为平稳,它的模型结构通常如下ttttITSxttdDBBx)()(例5.9拟合1962——1991年德国工人季度失业率序列差分平稳对原序列作一阶差分消除趋势,再作4步差分消除季节效应的影响,差分后序列的时序图如下白噪声检验延迟阶数统计量P值643.840.00011251.710.00011854.480.00012差分后序列自相关图模型拟合定阶ARIMA((1,4),(1,4),0)参数估计ttBBxBB4428132.044746.011)1)(1(模型检验残差白噪声检验参数显著性检验延迟阶数统计量P值待估参数统计量P值62.090.71915.480.00011210.990.3584-3.410.00012t14拟合效果图乘积季节模型使用场合序列的季节效应、长期趋势效应和随机波动之间有着复杂地相互关联性,简单的季节模型不能充分地提取其中的相关关系构造原理短期相关性用低阶ARMA(p,q)模型提取季节相关性用以周期步长S为单位的ARMA(P,Q)模型提取假设短期相关和季节效应之间具有乘积关系,模型结构如下tSStDSdBBBBx)()()()(例5.10:拟合1948——1981年美国女性月度失业率序列差分平稳一阶、12步差分差分后序列自相关图简单季节模型拟合结果延迟阶数拟合模型残差白噪声检验AR(1,12)MA(1,2,12)ARMA((1,12),(1,12)值P值值P值值P值614.580.00579.50.023315.770.00041216.420.088314.190.115817.990.0213结果拟合模型均不显著222周期周期点123……S1x1x2x3……xS2xS+1xS+2xS+3……x2S3x2S+1x2S+2x2S+3……x3S……nx(n-1)S+1x(n-1)S+2x(n-1)S+3……xnS…………………………………………………………设序列存在规则的周期(S),如果把原序列按周期重新排列,即可得到一个二维列联表。乘积季节模型乘积季节模型()()()()SDdSsStstBBxBB这里表示不同周期的同一周期点上的相关关系;()SDsStBX则表示同一周期内不同周期点上的相关关系。()dtBX差分后序列