SAS学习系列38.-时间序列分析Ⅱ—非平稳时间序列的确定性分析

整理文档很辛苦,赏杯茶钱您下走!

免费阅读已结束,点击下载阅读编辑剩下 ...

阅读已结束,您可以下载文档离线阅读编辑

资源描述

38.非平稳时间序列的确定性分析实际中大多数时间序列是非平稳的,对非平稳时间序列的分析方法主要有两类:确定性分析和随机性分析。确定性分析——提取非平稳时间序列明显的规律性(长期趋势、季节性变化、周期性),目的是:①克服其它因素影响,单纯测度出单一确定因素对序列的影响;②推断各种确定性因素彼此之间相互作用关系及它们对序列的综合影响。随机性分析——分析非平稳时间序列由随机因素导致的随机波动性。(一)趋势分析有的时间序列具有明显的长期趋势,趋势分析就是要找出并利用这种趋势对序列发展做出合理预测。1.趋势拟合法即把时间作为自变量,相应的序列观察值作为因变量,建立序列值随时间变化的回归模型。分为线性拟合和非线性拟合。2.平滑法利用修匀技术,消弱短期随机波动对序列的影响,使序列平滑化,从而显示出长期趋势变化的规律。(1)移动平均、加权移动平均已知序列值x1,…,xt-1,预测xt的值为12ˆtttntxxxxn称为n期移动平均值,n的选取带有一定的经验性,n过长或过短,各有利弊,也可以根据均方误差来选取。一般最新数据更能反映序列变化的趋势。因此,要突出新数据的作用,可采用加权移动平均法:1122ˆttntntwxxxxn其中,111niin.(2)二次移动平均对应线性趋势,移动平均拟合值有滞后性,可以采用二次移动平均加以改进:对移动平均值再做一次移动平均。(3)指数平滑法指数平滑法是一种对过去观察值加权平均的特殊形式,观测值时间越远,其权数呈指数下降。一次指数平滑法可用于对时间序列进行修匀,以消除随机波动。预测公式为:1ˆˆ(1)tttsxs其中α∈(0,1)为平滑常数,ˆts为第t期平滑预测值,初始预测值0ˆs(通常取最初几个实测数据的均值)。一般来说,时间序列有较大的随机波动时,宜选择较大的α值,以便能较快跟上近期的变化;也可以利用预测误差选择。(4)二次、三次指数平滑法即对一次指数平滑后的序列再做一次指数平滑,但不是直接将二次指数平滑值作为预测值,而是利用其来求出方程参数,利用滞后偏差的规律来建立直线趋势模型。计算公式:(1)(1)1ˆˆ(1)tttsxs(2)(1)(2)1ˆˆˆ(1)tttsss(1)(2)ˆˆ2tttass,(1)(2)ˆˆ()1tttbssˆtmttxabm其中,m为预测超前期数,取(2)(1)00ˆˆss.(5)霍尔特双参数线性指数平滑法设α,β∈(0,1)为参数,ˆtb为趋势增量。用趋势增量来修正,消除了滞后性,对数据进行平滑:11ˆˆˆ(1)()ttttsxsb用指数平滑法估计趋势增量,对相邻两次平滑之差做修正,再加上前期趋势增量,对趋势进行平滑:11ˆˆˆˆ()(1)ttttbssb计算超前m期的预测值:ˆˆˆtmttxsbm初值的选取:11ˆsx,121ˆbxx.(二)时间序列的分解一、Gramer分解定理1963年,Gramer在Wald分解定理的基础上,得到了Gramer分解定理:任一时间序列{Xt}都可以分解为叠加的两部分:由多项式决定的确定性趋势成分,平稳的零均值误差成分,即0()djtttjtjXutB其中,t为0均值白噪声序列,B为延迟算子,且()(())()()0tttEEBBE00()()()ddjjttjjjjEXEuEtt即均值序列0djjjt反映了{Xt}受到的确定性影响,而{:()}tttB反映了{Xt}受到的随机影响。Gramer定理说明任何一个序列的波动都可以视为同时受到了确定性影响和随机性影响的综合作用。平稳时间序列要求这两方面的影响都是稳定的,而非平稳时间序列产生的机理就在于它所受到的这两方面的影响至少有一方面是不稳定的。二、时间序列的结构形式非平稳时间序列(xt)的确定性因素分为4种:(1)趋势变化因素(Tt)——表现出某种倾向,上升或下降或水平;(2)季节变化因素(St)——周期固定的波动变化;(3)循环变化因素(Ct)——周期不固定的波动变化;(4)不规则因素(εt)——随机波动,由许多不可控的因素影响而引起的变化。时间序列{Xt}的结构形式有三种:(1)加法模式:xt=Tt+St+Ct+εt(2)乘法模式:xt=TtStCtεt(3)混合模式:xt=TtStCt+εt上述模式中,趋势变化Tt是基础,其它变化与趋势变化结合,构成序列{xt}.在加法模式中,各变化因素均与xt的单位相同;在乘法模式中,Tt与xt有相同的单位,其它因素的变化均数比例值;在混合模型中,Tt、εt与xt有相同的单位,St和Ct是比例值。各式中的随机因素εt,均假定为独立的、方差不变的、均值为0的白噪声序列。在这些假定下,对时间序列进行分解。三、时间序列的传统分解法步骤1.分解出长期趋势因素与循环因素设序列的季节长度为4(一年分为4季)。由假定E(εt)=0,故只要对序列xt作移动长度为4的移动平均,就可消除季节和随机波动的影响(因为随机波动有正波动和负波动,一做平均,正负波动就相互抵消,随机波动影响就接近于零)。记移动平均值为:则移动平均后的序列,即为序列的趋势因素和循环因素。类似地,若序列按月份周期,则取12。2.分解季节因素与随机因素考虑乘法模式xt=TtStCtεt,则两边同除以MAtx得只含季节因素与随机因素。因此,它含有确定季节因素所必须的信息。若它的比值大于100%,就意味着序列的实际值xt比滑动平均值TtCt要大(该季度的季节性与随机性高于平均数,反之低于平均数),反之要小。3.从Stεt中分解季节因素St即保留季节性,消除随机性,可以采取了按季节平均的方法,将前面得到的序列Stεt逐年逐季排列起来,然后将各年的相同季节的Stεt相加起来,再进行平均。4.从TtCt序列中分解出Ct序列TtCt包含了趋势因素与循环因素,要把这两者分离出来,首先要确定一种能最好地描述数据的长期趋势变化的曲线类型。趋势变化曲线,可能有以下几种类型:(1)线性趋势:Tt=a+bt(2)指数曲线:Tt=αeβt(3)S型曲线:属于何种趋势曲线,要根据序列的数值进行判断,并运用最小二乘法,估计出有关参数。确定了趋势因素Tt后,可以用下式计算出循环指数Ct:Ct也围绕100%波动,若Ct低(高)于100%,则意味着第t年的经济活动水平低(高)于所有年份的平均水平。四、温特线性和季节性指数平滑既含有线性趋势和季节性的数据进行处理和预测,使用温特(Winter)线性和季节性指数平滑方法,模型形式为:xt=St(Tt+εt)判断数据是否有季节性,粗略判断可以直接观察时序图,更好的方法是解析法,即通过研究数据序列的自相关性判断。温特方法由三个基础的平滑公式和一个预测方程组成,每个平滑公式都含有一个平滑系数:总体平滑公式:趋势平滑公式:季节的平滑公式:预测公式:其中,α,β,γ是三个不同的平滑系数,Tt是消除季节因素后的趋势平滑值,xt是序列的实际值,ht是趋势增加或减少量序列,St是季节调整因子,τ是季节的长度(如一年中的月数12或季度数4),l是向前预测期数,ˆtlx是向前l期的预测值。总体平滑和趋势平滑公式是序列xt消除季节因素St后,霍尔特双参数α和β线性指数平滑法。季节平滑公式是序列xt消除趋势因素Tt后,季节指数的加权平均修匀值。以当前观察的季节指数xt/Tt和上期季节指数St-τ进行γ加权平均。对于乘法模型来说,季节指数围绕1波动,可能大于1,也可能小于1。在拟合模型时可以通过求解最小的均方误差MSE得到三个平滑系数的具体值。预测公式是利用拟合模型短期向前预测l期的预测值公式。(三)季节调整——PROCX11过程X11过程是根据美国国情调查局编制的时间序列季节调整过程X-11改编的,可以对月度或季度时间序列进行季节调整。其基本原理就是时间序列的确定性因素分解方法。X11过程是基于这样的假定:任何时间序列都可以拆分成长期趋势波动Tt、季节波动St、不规则波动εt的影响。又有经济学家发现在经济时间序列中交易日Dt也是一个很重要的影响因素(日历天数的组成不同而引起的变动)。因此,任一时间序列可以分解乘法模型xt=TtStDtεt或加法模型xt=Tt+St+Dt+εt。由于宏观调控部门主要关注的是序列的长期趋势波动Tt的规律,所以X11过程主要目的是要从原序列中剔除季节影响、交易日影响和不规则波动影响,得到尽可能准确的长期趋势规律。而采取的方法就是前文的因素剔除法和平滑技术。X11过程不依赖任何模型,普遍采用移动平均法:用多次短期中心移动平均法消除不规则波动,用周期移动平均消除趋势,用交易周期移动平均消除交易日的影响。在整个过程中总共要用到11次移动平均,所以得名为X11过程。基本语法:procx11data=数据集/可选项;monthly选项列表;quarterlly选项列表;arima选项列表;macurves选项;outputout=数据集/选项列表;pdweights变量tables表名列表;var变量列表;by变量;id变量列表;说明:(1)monthly或quarterly语句是必不可少的,用来说明数据集是月度序列还是季度序列;(2)pdweights和macurves语句只能与monthly语句一起用,分别用来指定星期几的权重和月份的滑动平均长度;(3)tables语句控制各种表格的输出。output语句语句控制生成out=后指定的数据集;(4)procx11语句的可选项:outtdr=数据集名——输出交易日回归的结果(B15表和C15表中的内容)到数据集;outstb=数据集名——输出稳定季节性检验的结果(表D8中的内容)到数据集;outex——把在arima处理过程中预测的观察加到out=输出数据集中;(5)arima语句及可选项X-11方法用一系列中心化滑动平均来估计季节成分,但在起始和结尾处只能用非对称权重。非对称权重可导致季节因子估计不准,有了新数据以后就可能造成大的更改。加拿大统计局开发了一种X-11-ARIMA方法来处理该问题。使用arima语句,就是对在var语句中指定的序列应用X-11-ARIMA方法。该方法从原始数据估计一个arima模型(使用用户指定的模型,或者通过五个预先定义的arima模型中选择一个最优的),然后用此模型把序列外推一年或几年。再根据这个延长了序列进行季节调整,此时原序列的尾部就可用对称权重了。backcast=n——指定序列反向外推的年数,默认为0;chicr=值——指定Box-Ljung拟合不足卡方检验时所用的显著水平值,默认为0.05。原假设为预定的模型(共5个)无拟合不足;forecast=n——指定预报的年数,默认为1;mape=值——指定平均相对误差的临界值,取值在1到100之间,默认为15。mape值作为接受还是拒绝一个模型的临界值。模型的mape值小于临界值说明模型可用,反之模型被拒绝。mape值的计算公式如下:其中,n=36(最后三年的月数)或12(最后三年的季度数),xt为原始序列的最后三年的观察值。maxiter=n——指定估计过程最多允许的迭代次数,n取值为1到60之间,默认为15;method=cls|uls|ml——指定估计方法,分别为条件最小二乘法、无条件最小二乘法、最大似然估计;model=(P=n1Q=n2SP=n3SQ=n4DIF=n5SDIF=n6)——指定arima模型。P和SP表示一般的和季节的自回归过程(AR)阶数;Q和SQ表示一般的和季节的移动平均过程(MA)阶数,DIF和SDIF表示一般的和季节的差分阶数;季节s=12(对应monthly)或4(对应quarterly)。例如,指定一个(0,1,1)(0,1,1)s模型,表示(P,DIF,Q)(SP,SDIF,SQ)s模型。假设考虑月度序列s=12,且E(xt)=μ,则具体模型形式为:ovdifcr=值——指定对5个预

1 / 25
下载文档,编辑使用

©2015-2020 m.777doc.com 三七文档.

备案号:鲁ICP备2024069028号-1 客服联系 QQ:2149211541

×
保存成功