版本01时间序列分析方法与其它统计分析方法(回归分析)的主要区别1时间序列分析方法明确强调变量值顺序的重要性,而其它统计分析方法则不必如此。2时间序列各观察值之间存在一定的依存关系,而其它统计分析一般要求每一变量各自独立3时间序列分析根据序列自身的变化规律来预测未来,而其它统计分析则根据某一变量与其它变量间的因果关系来预测该变量的未来。4.时间序列是一组随机变量的一次样本实现,而其它统计分析的样本值一般是对同一随机变量进行N次独立重复实验的结果。5.二者建模思路不同2有时应用时间序列分析方法显得很有必要1.很多情况下,很难或不可能用变量间的因果关系来说明某一变量的变化。2.即使能估计出一个有关变量的令人满意的回归方程,其结果也可能不能用于预测。3常用软件EVIEWS。版本11一般概念:1.变量的观测值按时间顺序,在一定时期内的变动过程,从中寻找和分析事物的变化特征、发展趋势和规律。它是系统中某一变量受其它各种因素影响的总结果。获得事物随时间过程的演变特性与规律,进而预测事物的未来发展。它不研究事物之间相互依存的因果关系。2.惯性原则、近大远小原理2构成要素分为四种,即长期趋势(Seculartrend):在较长时期内呈现出某种持续发展变化的状态、趋向或规律季节变动(Seasonalfluctuation):在一年内重复出现的周期性波动循环波动(Cyclicalmovement):围绕长期趋势的一种波浪形或振荡式变动不规则波动(Irregularvariations):不规则波动,除去趋势、周期性和季节性之后的偶然性波动实际变化情况一般是几种变动的叠加或组合。预测时一般设法过滤除去不规则变动,突出反映趋势性和周期性变动。趋势性、周期性:随机性:综合性3平稳性:样本序列的自相关函数在某一固定水平线附近摆动,即方差和数学期望稳定为常数。各观察值基本上在某个固定的水平上波动,或虽有波动,但并不存在某种规律,而其波动可以看成是随机的平稳过程的自相关系数和偏自相关系数都会以某种方式衰减趋近于0,前者测度当前序列与先前序列之间简单和常规的相关程度,后者是在控制其它先前序列的影响后,测度当前序列与某一先前序列之间的相关程度。4基本步骤(1)分析数据序列的变化特征。(2)选择模型形式和参数检验。(3)利用模型进行趋势预测。(4)评估预测结果并修正模型。1.一般假定均值为0,否则令5分解模型按四种因素对时间序列的影响方式不同,时间序列可分解为多种模型。乘法模型Yi=Ti×Si×Ci×Ii加法模型Yi=Ti+Si+Ci+Ii最常用的是乘法模型。其基本假设是各构成因素互不独立,对事物的影响是相互的,除对时间序列的发展水平产生影响外,因素之间也相互影响。利用乘法模型可以将各因素从时间序列中分离出来进行分析。5自回归AR(P)模型yt=φ1yt-1+φ2yt-2+……+φpyt-p+εt:p模型的阶次,滞后的时间周期,通过实验和参数确定;yt当前预测值,与自身过去观测值yt-1、…、yt-p是同一序列不同时刻tXttXX的随机变量,相互间有线性关系,也反映时间滞后关系,yt-1、yt-2、……、yt-p同一平稳序列过去p个时期的观测值;φ1、φ2、……、φp自回归系数,通过计算得出的权数,表达yt依赖于过去的程度,且这种依赖关系恒定不变;识别条件:当kp时,有φk=0或φk服从渐近正态分布N(0,1/n)且(|φk|2/n1/2)的个数≤4.5%,即平稳时间序列的偏相关系数φk为p步截尾,自相关系数rk逐步衰减而不截尾,则序列是AR(p)模型。用PACF函数判别(从p阶开始的所有偏自相关系数均为0)。平稳条件:一阶-|φ1|1。二阶-φ1+φ21、φ1-φ21、|φ2|1。φ越大,自回归过程的波动影响越持久.一般AR过程的ACF函数呈单边递减或阻尼振荡,所以用PACF函数判别(从p阶开始的所有偏自相关系数均为0)6移动平均MA(Q)模型yt=εt-θ1εt-1-θ2εt-2-……-θqεt-q或1,qttjtjjXbt平稳{}tX称为MA(q)序列用过去各个时期的随机干扰或预测误差的线性组合来表达当前预测值。参数θ取值对时间序列的影响没有AR模型中参数p的影响强烈,即这里较大的随机变化不会改变时间序列的方向.识别条件:当kq时,有自相关系数rk=0或自相关系数rk服从N(0,1/n(1+2∑r2i)1/2)且(|rk|2/n1/2(1+2∑r2i)1/2)的个数≤4.5%,即平稳时间序列的自相关系数rk为q步截尾,偏相关系数φk逐步衰减而不截尾,则序列是MA(q)模型。一般MA过程的PACF函数呈单边递减或阻尼振荡,所以用ACF函数判别(从q阶开始的所有自相关系数均为0)。可逆条件:一阶:|θ1|1。二阶:|θ2|1、θ1+θ21。当满足可逆条件时,MA(q)模型可以转换为AR(p)模型.7混合自回归移动平均ARMA(P,Q)模型yt=φ1yt-1+φ2yt-2+……+φpyt-p+εt-θ1εt-1-θ2εt-2-……-θpεt-q;p和q是模型的自回归阶数和移动平均阶数;φ和θ是不为零的待定系数;识别条件:平稳时间序列的偏相关系数φk和自相关系数rk均不截尾,但较快收敛到0,则该时间序列可能是ARMA(p,q)模型。实际问题中,多数要用此模型。因此建模解模的主要工作是求解p、q和φ、θ的值,8差分自回归移动平均ARIMA(P,D,Q)模型,1122......tttttqqjtjjyq识别条件:模型识别平稳时间序列的偏相关系数φk和自相关系数rk均不截尾,且缓慢衰减收敛;模型形式类似ARMA(p,q)模型,但数据必须经过特殊处理。特别当线性时间序列非平稳时,不能直接利用ARMA(p,q)模型,但可以利用有限阶差分使非平稳时间序列平稳化,实际应用中d一般不超过2。若时间序列存在周期性波动,则可按时间周期进行差分,目的是将随机误差有长久影响的时间序列变成仅有暂时影响的时间序列。即差分处理后新序列符合ARMA(p,q)模型,原序列符合ARIMA(p,d,q)模型。思想:(1)对数据进行适当d次差分;(2)拟合成ARMA(p,q)模型.一般用有限较少数据,难于区分ARMA(p,q)与ARIMA(p,1,q)模型.用600个数据难分,6000个才较明显3.一般要求时间序列样本数据n50,滞后周期kn/44.样本数据LagNumber121110987654321ACF1.0.50.0-.5-1.0ConfidenceLimitsCoefficient从图中看出;样本序列数据的自相关系数在某一固定水平线附近摆动,且按周期性逐渐衰减,所以该时间序列基本是平稳的版本21前提和伪回归传统计量经济学模型的假定条件:序列的平稳性、正态性。所谓“伪回归”,是指变量间本来不存在相依关系,但回归结果却得出存在相依关系的错误结论。造成“伪回归”的根本原因在于时序序列变量的非平稳性2平稳性基本上不存在趋势的序列,各观察值基本上在某个固定的水平上波动,或虽有波动,但并不存在某种规律,而其波动可以看成是随机的。非平稳性时间序列可以通过一次或多次差分的方式变成平稳性时间序列。是指时间序列的统计规律不会随着时间的推移而发生变化。弱平稳是指随机过程的期望、方差和协方差不随时间推移而变化。概率分布函数不随时间的平移而变化:P(Y1,Y2,……,Yt)=P(Y1+m,Y2+m,…,Yt+m)期望值、方差和自协方差是不依赖于时间的常数:E(Yt)=E(Yt+m);Var(Yt)=Var(Yt+m);Cov(Yt,Yt+k)=Cov(Yt+m,Yt+m+k)•随机性时间序列模型是以时间序列的平稳性为基础建立的严平稳:如果对t1,t2,…,tn,h∈T和任意整数n,都使(yt1,yt2…,ytn)与(yt1+h,yt2+h,…,ytn+h)同分布,则概率空间(W,F,P)上随机过程{y(t),t∈T}称为平稳过程。具有时间上的平稳不变性。实践当中是非常困难甚至是不可能的。宽平稳:宽平稳是指随机过程的均值函数、方差函数均为常数,自协方差函数仅是时间间隔的函数。序號96918681767166615651464136312621161161SCORE2260224022202200218021603非平稳性是指时间序列的统计规律随着时间的位移而发生变化,即生成变量时间序列数据的随机过程的特征随时间而变化。非平稳性的表现形式多种多样,主要特征有:趋势性、异方差性、波动性、周期性、季节性、以及这些特征的交错混杂等。具有趋势性的非平稳时间序列,序列的各阶自相关函数值显著不为零,同时随着阶数的增大,函数值呈缓慢下降的趋势;偏自相关函数值则呈明显的下降趋势,很快落入置信区间。异方差的非平稳时间序列,其各阶自相关函数显著不为零,且呈现出正负交错,缓慢下降的趋势;偏自相关函数值也呈正负交错的形式,且下降趋势明显。具有周期性的非平稳时间序列,其自相关函数呈明显的周期性波动,且以周期长度及其整数倍数为阶数的自相关和偏自相关函数值均显著不为零。非周期的波动性时间序列,自相关函数值会在一定的阶数之后较快的趋于零,而偏自相关函数则会很快的落入到置信区间内。4事先剔除序列趋势性再识别序列的季节性实际问题中,常会遇到季节性和趋势性同时存在的情况,这时必须事先剔除序列趋势性再用上述方法识别序列的季节性,否则季节性会被强趋势性所掩盖,以至判断错误.5包含季节性的时间序列也不能直接建立ARMA模型需进行季节差分消除序列的季节性,差分步长应与季节周期一致.5截尾拖尾序號248235222209196183170157144131118105927966534027141STOCK4240383634323028266模型识别6长期趋势分析简单平均法、移动平均法、指数平滑法、趋势方程法(趋势线配合法)6.1简单平均法(SIMPLEAVERAGE)tiittYtYYYtF12111)(1tiittYtYYYtF12111)(1适合对较为平稳的时间序列进行预测,即当时间序列没有明显变动趋势时用该方法比较好。如果时间序列有明显变动趋势或有季节变动影响时该方法预测不够准确,此方法将远期数值和近期数值在预测未来中的作用同等看待6.2移动平均法(MOVINGAVERAGEMETHOD)(1)简单移动平均法(simplemovingaverage)预测误差用均方误差(MSE)来衡量(两个公式)m为趋势方程中未知常数的个数主要适合对较为平稳的时间序列进行预测,关键是确定合理的移动间隔长度,选择一个使均方误差达到最小的移动步长,如果现象的发展具有周期性,应以周期长度作为移动间隔的长度,如对月份资料应采用12项移动平均,对季度资料应采用4项移动平均,可以消除变动周期的影响。(2)易受异常数据的影响,为避免这种情况,可以用中位数来代替平均数,这就是移动中位数法。此方法不适合于预测。移动平均后的趋势值应放在各移动项的中间位置。如3项移动平均的趋势值应放在第2项对应的位置上,5项移动平均的趋势值应放在第3项对应的位置上,其余类推。(3)加权移动平均法(weightedmovingaverage)对近期的观察值和远期的观察值赋予不同的权数后再进行预测,当时间序列的波动较大时,最近期的观察值应赋予最大的权数,较远的时期的观察值赋予的权数依次递减;当时间序列的波动不是很大时,对各期的观察值应赋予近似相等的权数。所选择的各期的权数之和必须等于1。用均方误差来测度预测精度,选择一个均方误差最小的移动间隔和权数的组合6.3趋势方程法(趋势线配合法)1.散点图法:以时间t为横轴,以时间序列观察值Y为纵轴,绘出散点图,根据散点的分布形态来选择趋势方程。2.数据特征法:计算出时间序列某些动态分析特征值,如增长量、增长率等,根据这些特征值选择合适的模型。估计方程中的参数,如常用的最小二乘法,最后依据方程计算趋势值及预测值。指数曲线expo