数学建模――时间序列分析

整理文档很辛苦,赏杯茶钱您下走!

免费阅读已结束,点击下载阅读编辑剩下 ...

阅读已结束,您可以下载文档离线阅读编辑

资源描述

年前的古埃及人把尼罗河涨落的情况逐天记录下来,就构成所谓的时间序列。对这个时间序列长期的观察使他们发现尼罗河的涨落非常有规律。由于掌握了尼罗河泛滥的规律,使得古埃及的农业迅速发展,从而创建了埃及灿烂的史前文明。引例引例时间序列:某一系统在不同的时间(地点或其他条件等)的响应(数据)。时间序列是按一定的顺序排列而成,“一定顺序”既可以是时间顺序,也可以是具有不同意义的物理量。如:研究高度与气压的关系,这里的高度就可以看作“时间”总而言之,时间序列只是强调顺序的重要性,因此又被称为“纵向数据”,相对于“横向数据”而言的。什么是时间序列时间序列数据的预处理平稳性检验纯随机性检验平稳时间序列数据分析非平稳时间序列数据分析内容提要时间序列数据的预处理时间序列数据的预处理基本概念平稳性检验纯随机性检验概率分布的意义随机变量族的统计特性完全由它们的联合分布函数或联合密度函数决定时间序列概率分布族的定义几个重要数字特征:均值、方差、自协方差、自相关系数TtttmmxxxFmmtttm,,,),,,2,1()},,,({2121,,,21时间序列数据的预处理1基本概念1.1基本的数字特征特征统计量均值方差自协方差自相关系数()tttEXxdFx22()()()tttttDXEXxdFx(,)()()ttsstsEXX(,)(,)tststsDXDX时间序列数据的预处理1.2平稳时间序列的定义严平稳严平稳是一种条件比较苛刻的平稳性定义,它认为只有当序列所有的统计性质都不会随着时间的推移而发生变化时,该序列才能被认为平稳。宽平稳宽平稳是使用序列的特征统计量来定义的一种平稳性。它认为序列的统计性质主要由它的低阶矩决定,所以只要保证序列低阶矩平稳(二阶),就能保证序列的主要性质近似稳定。时间序列数据的预处理满足如下条件的序列称为宽平稳序列TtskksttskkstTtEXTtEXtt且,为常数,,,),(),()3,)2,)12时间序列数据的预处理常数均值和方差自协方差函数和自相关函数只依赖于时间的平移长度,而与时间的起止点无关延迟k自协方差函数延迟k自相关系数)0()(kk为整数kkttk),,()(平稳时间序列的统计性质时间序列数据的预处理平稳时间序列的意义时间序列数据结构的特殊性可列多个随机变量,而每个变量只有一个样本观察值平稳性的重大意义极大地减少了随机变量的个数,并增加了待估变量的样本容量极大地简化了时序分析的难度,同时也提高了对特征统计量的估计精度时间序列数据的预处理平稳性检验主要有两种方法:根据时序图和自相关图显示的特征做出判断的图检验方法构造检验统计量进行假设检验的方法。时间序列数据的预处理2平稳性检验时序图检验根据平稳时间序列均值、方差为常数的性质,平稳序列的时序图应该显示出该序列始终在一个常数值附近随机波动,而且波动的范围有界、无明显趋势及周期特征。自相关图检验平稳序列通常具有短期相关性。该性质用自相关系数来描述就是随着延迟期数的增加,平稳序列的自相关系数会很快地衰减向零。2.1平稳性的图检验时间序列数据的预处理例1检验1964年——1999年中国纱年产量序列的平稳性例2检验1962年1月——1975年12月平均每头奶牛月产奶量序列的平稳性例3检验1949年——1998年北京市每年最高气温序列的平稳性平稳性检验时间序列数据的预处理例1平稳性检验时间序列数据的预处理平稳性检验时间序列数据的预处理平稳性检验时间序列数据的预处理例2自相关图时间序列数据的预处理例3时序图时间序列数据的预处理例3自相关图时间序列数据的预处理时间序列数据的预处理等间隔时间数据的录入程序说明(数据的录入)时间序列数据的预处理等间隔时间数据的录入程序说明(数据的录入)时间序列数据的预处理数据的变换程序说明(数据的录入)时间序列数据的预处理取数据中的子集程序说明(数据的录入)时间序列数据的预处理缺失数据的插入程序说明(数据的录入)dataa;inputsha@@;year=intnx('year','1964',_n_-1);formatyearyear4.;dif=dif(sha);cards;97130156.5135.2137.7180.5205.2190188.6196.7180.3210.8196223238.2263.5292.6317335.4327321.9353.5397.8436.8465.7476.7462.6460.8501.8501.5489.5542.3512.2559.8542567;procgplot;plotsha*year=1dif*year=2;symbol1v=circlei=joinc=black;symbol2v=stari=joinc=red;procarimadata=a;identifyvar=shanlag=22;run;时间序列数据的预处理1964年——1999年中国纱年产量SAS程序时间序列数据的预处理1962年1月—1975年12月平均每头奶牛月产奶量SAS程序时间序列数据的预处理1949年——1998年北京市每年最高气温SAS程序纯随机序列的定义纯随机性的性质纯随机性检验时间序列数据的预处理3纯随机性检验3.1纯随机序列的定义纯随机序列也称为白噪声序列,它满足如下两条性质TststststTtEXt,,,0,),()2(,)1(2时间序列数据的预处理标准正态白噪声序列时序图时间序列数据的预处理3.2白噪声序列的性质纯随机性各序列值之间没有任何相关关系,即为“没有记忆”的序列方差齐性根据马尔可夫定理,只有方差齐性假定成立时,用最小二乘法得到的未知参数估计值才是准确的、有效的线性无偏估计00)(kk,)0(2tDX时间序列数据的预处理3.3纯随机性检验检验原理假设条件检验统计量判别原则时间序列数据的预处理Barlett定理如果一个时间序列是纯随机的,得到一个观察期数为的观察序列,那么该序列的延迟非零期的样本自相关系数将近似服从均值为零,方差为序列观察期数倒数的正态分布0,)1,0(~ˆknNkn时间序列数据的预处理假设条件原假设:延迟期数小于或等于期的序列值之间相互独立备择假设:延迟期数小于或等于期的序列值之间有相关性1,0210mHm:mkmHk,:至少存在某个1,01mm时间序列数据的预处理检验统计量Q统计量LB统计量)(~ˆ212mnQmkk)(~)ˆ()2(212mknnnLBmkk时间序列数据的预处理判别原则拒绝原假设当检验统计量大于分位点,或该统计量的P值小于时,则可以以的置信水平拒绝原假设,认为该序列为非白噪声序列接受原假设当检验统计量小于分位点,或该统计量的P值大于时,则认为在的置信水平下无法拒绝原假设,即不能显著拒绝序列为纯随机序列的假定21()m121()m1时间序列数据的预处理样本自相关图例4随机生成的100个服从标准正态的白噪声序列纯随机性检验时间序列数据的预处理检验结果LBQLBQ延迟统计量检验统计量值P值延迟6期2.360.8838延迟12期5.350.9454由于P值显著大于显著性水平,所以该序列不能拒绝纯随机的原假设。换句话说可以认为该序列的波动没有任何统计规律可循,因此可以停止对该序列的统计分析。时间序列数据的预处理数据预处理部分的小结:序列平稳性与纯随机性检验的基本步骤:1.绘制该序列时序图;2.自相关图检验;3.该序列若是平稳序列,进行纯随机性检验.实例:对1950年—1998年北京市城乡居民定期储蓄所占比例序列的平稳性与纯随机性进行检验。时间序列数据的预处理时间序列数据的预处理dataa;inputyearprop;cards;/*数据省略*/;procgplot;plotprop*year=1;/*所画的图记为图1*/symbol1v=diamondi=joinc=red;procarimadata=a;identifyvar=prop;run;相应的SAS程序时间序列数据的预处理1.绘制时序图该序列显示北京市城乡居民定期储蓄所占比例序列波动“貌似”比较平稳时间序列数据的预处理2.自相关图进一步检验平稳性样本自相关图延迟3阶后,自相关系数都落在2倍标准差范围以内,而且自相关系数向零衰减的速度非常快。综合前两个步骤,可知北京市城乡居民定期储蓄所占比例为平稳序列时间序列数据的预处理3.序列纯随机性检验结论:由于统计量的P值0.0001,远远小于0.05,即拒绝序列为纯随机序列的假定。因而认为京市城乡居民定期储蓄所占比例的变动不属于纯随机波动,各序列值之间有相关关系。这说明我们可以根据历史信息预测未来年份的北京市城乡居民定期储蓄所占比例,该平稳序列属于非白噪声序列,可以对其继续进行研究。时间序列数据的预处理平稳时间序列数据分析方法性工具与两种相关系数自回归(AutoRegression,AR)模型移动平均(MovingAverage,MA)模型ARMA模型平稳序列建模平稳时间序列数据分析1.1方法性工具差分运算一阶差分阶差分步差分pk1tttxxx111tptptpxxxkttkxx平稳时间序列数据分析1.方法性工具与两种相关系数延迟算子延迟算子类似于一个时间指针,当前序列值乘以一个延迟算子,就相当于把当前序列值的时间向过去拨了一个时刻记B为延迟算子,有1,pxBxtppt平稳时间序列数据分析延迟算子的性质10B为任意常数cxcxBcxcBttt,)()(111)(ttttyxyxBnttnxxB,)1()1(0iniininBCB)!(!!ininCin其中平稳时间序列数据分析则有(用延迟算子表示差分):1.2两种样本相关系数的基本概念与计算样本自相关系数样本偏自相关系数nttkntkttkxxxxxx121)())((ˆ平稳时间序列数据分析所谓滞后k阶偏自相关系数就是指在给定中间k-1个随机变量xt-1,xt-2,…xt-k+1的条件下,或者说,在剔除了中间k-1个随机变量的干扰之后,xt-k对xt影响的相关度量。样本偏自相关系数的计算平稳时间序列数据分析2.AR模型的定义具有如下结构的模型称为阶自回归模型,简记为特别当时,称为中心化模型tsExtsEVarExxxxtsstttptptpttt,0,0)(,)(0)(0222110,p)(pAR00)(pAR平稳时间序列数据分析均值如果AR(p)模型满足平稳性条件,则有根据平稳序列均值为常数,且为白噪声序列,有推导出p101)(110tptpttxxEExTtEExtt,0)(,}{t平稳时间序列数据分析AR(P)序列中心化变换称为的中心化序列,令p101ttxy}{ty}{tx平稳时间序列数据分析中心化AR(P)模型引进延迟算子,中心化模型又可以简记为自回归系数多项式)(pARttxB)(ppBBBB2211)(平稳时间序列数据分析AR模型自相关系数的性质拖尾性呈负指数衰减1()pkiiikc不能恒等于零pccc,,,211()pkiiikc0平稳时间序列数据分析例5考察如下AR模型的自相关图ttttttttttttttxxxxxxxxxx

1 / 187
下载文档,编辑使用

©2015-2020 m.777doc.com 三七文档.

备案号:鲁ICP备2024069028号-1 客服联系 QQ:2149211541

×
保存成功