时间序列分析模型时间序列的基本概念一、时间序列1、含义:指被观察到的依时间为序排列的数据序列。2、特点:(1)现实的、真实的一组数据,而不是数理统计中做实验得到的。既然是真实的,它就是反映某一现象的统计指标,因而,时间序列背后是某一现象的变化规律。(2)动态数据。1950-1998年中国水灾受灾面积(单位:千公顷)05000100001500020000250003000019501952195419561958196019621964196619681970197219741976197819801982198419861988199019921994199619982010年11月17日--2011年4月8日上证综指二、时间序列分析时间序列分析:是一种根据动态数据揭示系统动态结构和规律的统计方法。其基本思想:根据系统的有限长度的运行记录(观察数据),建立能够比较精确地反映序列中所包含的动态依存关系的数学模型,并借以对系统的未来进行预报三、确定性时间序列分析与随机性时间序列分析:时间序列依据其特征,有以下几种表现形式,并产生与之相适应的分析方法:(1)长期趋势变化受某种基本因素的影响,数据依时间变化时表现为一种确定倾向,它按某种规则稳步地增长或下降。使用的分析方法有:移动平均法、指数平滑法、模型拟和法等;(2)季节性周期变化受季节更替等因素影响,序列依一固定周期规则性的变化,又称商业循环。采用的方法:季节指数;(3)循环变化周期不固定的波动变化。(4)随机性变化由许多不确定因素引起的序列变化。它所使用的分析方法就是我们要讲的时间序列分析。趋势变化分析确定性变化分析周期变化分析循环变化分析时间序列分析随机性变化分析:AR、MA、ARMA模型Wold分解定理(1938)对于任何一个离散平稳过程它都可以分解为两个不相关的平稳序列之和,其中一个为确定性的,另一个为随机性的,不妨记作其中:为确定性序列,为随机序列,它们需要满足如下条件(1)(2)(3)}{txtttVx}{tVt0jjtjt020,1jj),0(~2WNtstVEst,0),(确定性序列与随机序列的定义对任意序列而言,令关于q期之前的序列值作线性回归其中为回归残差序列,。确定性序列,若随机序列,若}{t2)(qtVar2lim0qq)(lim2tqqyVarCramer分解定理(1961)任何一个时间序列都可以分解为两部分的叠加:其中一部分是由多项式决定的确定性趋势成分,另一部分是平稳的零均值误差成分,即}{txtttx确定性影响随机性影响taB)(djjjt01950-1998年中国水灾受灾面积(单位:千公顷)-50000500010000150002000025000300003500040000450001950195219541956195819601962196419661968197019721974197619781980198219841986198819901992199419961998循环变动C(Cyclical)不规则变动I(Irregular)季节变动S(Seasonal)长期趋势T(Trend)对两个分解定理的理解Wold分解定理说明任何平稳序列都可以分解为确定性序列和随机序列之和。它是现代时间序列分析理论的灵魂,是构造ARMA模型拟合平稳序列的理论基础。Cramer分解定理是Wold分解定理的理论推广,它说明任何一个序列的波动都可以视为同时受到了确定性影响和随机性影响的综合作用。平稳序列要求这两方面的影响都是稳定的,而非平稳序列产生的机理就在于它所受到的这两方面的影响至少有一方面是不稳定的。确定性时序分析的目的克服其它因素的影响,单纯测度出某一个确定性因素对序列的影响推断出各种确定性因素彼此之间的相互作用关系及它们对序列的综合影响时间序列趋势分析目的有些时间序列具有非常显著的趋势,我们分析的目的就是要找到序列中的这种趋势,并利用这种趋势对序列的发展作出合理的预测常用方法趋势拟合法平滑法趋势拟合法趋势拟合法就是把时间作为自变量,相应的序列观察值作为因变量,建立序列值随时间变化的回归模型的方法分类线性拟合非线性拟合线性拟合使用场合长期趋势呈现出线形特征模型结构)(,0)(ttttIVarIEIbtax例:拟合澳大利亚政府1981——1990年每季度的消费支出序列线性拟合模型参数估计方法最小二乘估计参数估计值2)(,0)(40,2,1,ttttIVarIEtIbtax12.89ˆ,69.8498ˆba拟合效果图非线性拟合使用场合长期趋势呈现出非线形特征参数估计指导思想能转换成线性模型的都转换成线性模型,用线性最小二乘法进行参数估计实在不能转换成线性的,就用迭代法进行参数估计常用非线性模型模型变换变换后模型参数估计方法线性最小二乘估计线性最小二乘估计--迭代法--迭代法--迭代法2ctbtaTtttabTttbcaTtbcateTttbcaT122ttttTTlnaalnbbln2ctbtaTttbaTt例:对上海证券交易所每月末上证指数序列进行模型拟合非线性拟合模型变换参数估计方法线性最小二乘估计拟合模型:2ctbtaTt22tt20952.02517.502tTt拟合效果图时间序列预测法时间序列预测法可用于短期预测、中期预测和长期预测。根据对资料分析方法的不同,又可分为:简单序时平均数法、加权序时平均数法平滑法平滑法是进行趋势分析和预测时常用的一种方法。它是利用修匀技术,削弱短期随机波动对序列的影响,使序列平滑化,从而显示出长期趋势变化的规律简单平均数法:也称算术平均法。即把若干历史时期的统计数值作为观察值,求出算术平均数作为下期预测值。这种方法基于下列假设:“过去这样,今后也将这样”,把近期和远期数据等同化和平均化,因此只能适用于事物变化不大的趋势预测。如果事物呈现某种上升或下降的趋势,就不宜采用此法。加权平均数法:就是把各个时期的历史数据按近期和远期影响程度进行加权,求出平均值,作为下期预测值。移动平均法基本思想假定在一个比较短的时间间隔里,序列值之间的差异主要是由随机波动造成的。根据这种假定,我们可以用一定时间间隔内的平均值作为某一期的估计值分类n期中心移动平均n期移动平均移动平均期数确定的原则事件的发展有无周期性以周期长度作为移动平均的间隔长度,以消除周期效应的影响对趋势平滑的要求移动平均的期数越多,拟合趋势越平滑对趋势反映近期变化敏感程度的要求移动平均的期数越少,拟合趋势越敏感移动平均预测)(1ˆ21nlTlTlTlTxxxnxilxilxxilTilTilT,,ˆ例某一观察值序列最后4期的观察值为:5,5.4,5.8,6.2(1)使用4期移动平均法预测。(2)求在二期预测值中前面的系数等于多少?2ˆTx2ˆTxTx解(1)(2)在二期预测值中前面的系数等于45.548.54.556.5ˆ41ˆ6.542.68.54.5541ˆ21123211TTTTTTTTTTxxxxxxxxxx3212122121121611654141ˆ41ˆTTTTTTTTTTTTTTTTxxxxxxxxxxxxxxxxTx1656.3、时间序列模型参考书:金融时间序列分析图书馆,超星电子图书时间序列模型的基本概念及其适用性5.3、时间序列模型的基本概念随机时间序列模型(nimeseriesmodeling)是指仅用它的过去值及随机扰动项所建立起来的模型,其一般形式为Yn=F(Yn-1,Yn-2,…,n)建立具体的时间序列模型,需解决如下三个问题:(1)模型的具体形式(2)时序变量的滞后期(3)随机扰动项的结构例如,取线性方程、一期滞后以及白噪声随机扰动项(n=n),模型将是一个1阶自回归过程AR(1):Yn=aYn-1+n这里,n特指一白噪声。一般的p阶自回归过程AR(p)是Yn=a1Yn-1+a2Yn-2+…+apYn-p+n(*)(1)如果随机扰动项是一个白噪声(n=n),则称(1)式为一纯AR(p)过程(pureAR(p)process),记为Yn=a1Yn-1+a2Yn-2+…+apYn-p+n(2)如果n不是一个白噪声,通常认为它是一个q阶的移动平均(movingaverage)过程MA(q):n=n-c1n-1-c2n-2--cqn-q该式给出了一个纯MA(q)过程(pureMA(p)process)。一般的p阶自回归过程AR(p)是Yn=a1Yn-1+a2Yn-2+…+apYn-p+n(1)将纯AR(p)与纯MA(q)结合,得到一个一般的自回归移动平均(aunoregressivemovingaverage)过程ARMA(p,q):Yn=a1Yn-1+a2Yn-2+…+apYn-p+n-c1n-1-c2n-2--cqn-q该式表明:(1)一个随机时间序列可以通过一个自回归移动平均过程生成,即该序列可以由其自身的过去或滞后值以及随机扰动项来解释。(2)如果该序列是平稳的,即它的行为并不会随着时间的推移而变化,那么我们就可以通过该序列过去的行为来预测未来。这也正是随机时间序列分析模型的优势所在。需要说明的是,在上述模型的平稳性、识别与估计的讨论中,ARMA(p,q)模型中均未包含常数项。如果包含常数项,该常数项并不影响模型的原有性质,因为通过适当的变形,可将包含常数项的模型转换为不含常数项的模型。下面以一般的ARMA(p,q)模型为例说明。对含有常数项的模型qtqttptpttXXX1111方程两边同减/(1-a1--ap),则可得到qtqttptpttxxx1111其中piiXx11pttti,,1,趋势项和季节性的典型差分处理方法1.恒定趋势即总的趋势保持在同一水平,均值0。引入算子,定义为:=(1–B),即xt=xt-xt-1可以消除恒定趋势。例如IBM股票模型用xt=(1-1B)at更为合适。有恒定趋势的模型有一个极点的绝对值接近为1。2.线性趋势总趋势按照线性规律增减,即模型有两个极点的绝对值接近为1的情况。用算子:2=(1–B)2可以消除线性趋势,例如:2xt=(1-1B)at3.多项式趋势有多个极点的绝对值接近于1,引入算子:3=(1–B)3例如:3xt=(1-1B-2B2)at4.季节性有的时间序列按照一定的周期波动,例如月平均温度是按照12个月的周期波动的,每小时用电量按照24小时的周期变化…,称为季节性。为消除季节性的影响,引入算子:s=1–Bs例如,航空公司的模型AR(13,13)模型中的参数1~12的数值都很小,而接近于零,用周期为12的模型为合适。由于该时间序列不仅有周期为12的季节性,而且还有恒定趋势,所以用以下模型最合适:12=(1–B)(1–B12)xt=(1-1B)(1-12B12)at经典回归模型的问题:迄今为止,对一个时间序列Yn的变动进行解释或预测,是通过某个单方程回归模型或联立方程回归模型进行的,由于它们以因果关系为基础,且具有一定的模型结构,因此也常称为结构式模型(snrucnuralmodel)。然而,如果Yn波动的主要原因可能是我们无法解释的因素,如气候、消费者偏好的变化等,则利用结构式模型来解释Yn的变动就比较困难或不可能,因为要取得相应的量化数据,并建立令人满意的回归模型是很困难的。这时