时间序列的预处理

整理文档很辛苦,赏杯茶钱您下走!

免费阅读已结束,点击下载阅读编辑剩下 ...

阅读已结束,您可以下载文档离线阅读编辑

资源描述

第二章时间序列的预处理本章结构平稳性检验纯随机性检验SAS软件基本操作2.1平稳性检验特征统计量平稳时间序列的定义平稳时间序列的统计性质平稳时间序列的意义平稳性的检验概率分布概率分布的意义随机变量族的统计特性完全由它们的联合分布函数或联合密度函数决定时间序列概率分布族的定义局限性在实际应用中,要得到序列的联合概率分布几乎是不可能的,而且联合概率分布通常涉及非常复杂的数学运算,这些原因使我们很少直接使用联合概率分布进行时间序列分析TtttmmxxxFmmtttm,,,),,,2,1()},,,({2121,,,21特征统计量均值只要满足条件,就一定存在某个常数,使得随机变量Xt总是围绕在常数值附近作随机波动,则称为序列在t时刻的均值函数。)(xxdFEXttt)(xxdFtttt特征统计量方差当时,可以定义时间序列的方差函数用以描述序列值围绕其均值作随机波动时平均的波动程度。)()()(22xdFxXEDXttttt)(xxdFt特征统计量自协方差对于时间序列Xt,任取,定义为序列Xt的自协方差函数:))((),(ssttXXEstT,st),(st特征统计量自相关系数对于时间序列Xt,任取,定义为序列Xt的自相关系数:T,st),(ststDXDXstst),(),(平稳时间序列的定义严平稳严平稳是一种条件比较苛刻的平稳性定义,它认为只有当序列所有的统计性质都不会随着时间的推移而发生变化时,该序列才能被认为平稳。宽平稳宽平稳是使用序列的特征统计量来定义的一种平稳性。它认为序列的统计性质主要由它的低阶矩决定,所以只要保证序列低阶矩平稳(二阶),就能保证序列的主要性质近似稳定。平稳时间序列的统计定义满足如下条件的序列称为严平稳序列满足如下条件的序列称为宽平稳序列),,,(),,,(21,21,2121mtttmtttxxxFxxxFmm有,正整数,正整数Ttttmm,,,,21TtskksttskkstTtEXTtEXtt且,为常数,,,),(),()3,)2,)12严平稳与宽平稳的关系一般关系严平稳条件比宽平稳条件苛刻,通常情况下,严平稳(低阶矩存在)能推出宽平稳成立,而宽平稳序列不能反推严平稳成立特例不存在低阶矩的严平稳序列不满足宽平稳条件,例如服从柯西分布的严平稳序列就不是宽平稳序列当序列服从多元正态分布时,宽平稳可以推出严平稳平稳时间序列的统计性质常数均值自协方差函数和自相关函数只依赖于时间的平移长度而与时间的起止点无关延迟k自协方差函数延迟k自相关系数)0()(kk为整数kkttk),,()(TtEXt,自相关系数的性质规范性且对称性10kk1kk自相关系数的性质非负定性对任意整数m,相关阵为对称非负定阵非唯一性一个平稳时间序列一定唯一决定了它的自相关函数,但一个自相关函数未必唯一对应着一个平稳时间序列。m02-m1-m02-m011-m10m平稳时间序列的意义时间序列数据结构的特殊性可列多个随机变量,而每个变量只有一个样本观察值平稳性的重大意义极大地减少了随机变量的个数,并增加了待估变量的样本容量极大地简化了时序分析的难度,同时也提高了对特征统计量的估计精度平稳性的检验(图检验方法)时序图检验根据平稳时间序列均值、方差为常数的性质,平稳序列的时序图应该显示出该序列始终在一个常数值附近随机波动,而且波动的范围有界、无明显趋势及周期特征自相关图检验平稳序列通常具有短期相关性。该性质用自相关系数来描述就是随着延迟期数的增加,平稳序列的自相关系数会很快地衰减向零例题例2.1检验1964年——1999年中国纱年产量序列的平稳性例2.1时序图例2.1自相关图例题例2.2检验1962年1月——1975年12月平均每头奶牛月产奶量序列的平稳性例2.2时序图例2.2自相关图例题例2.3检验1949年——1998年北京市每年最高气温序列的平稳性例2.3时序图例2.3自相关图2.2纯随机性检验纯随机序列的定义纯随机性的性质纯随机性检验纯随机序列的定义纯随机序列也称为白噪声序列,它满足如下两条性质TststststTtEXt,,,0,),()2(,)1(2标准正态白噪声序列时序图白噪声序列的性质纯随机性各序列值之间没有任何相关关系,即为“没有记忆”的序列方差齐性根据马尔可夫定理,只有方差齐性假定成立时,用最小二乘法得到的未知参数估计值才是准确的、有效的00k(k),)0(2tDX纯随机性检验检验原理假设条件检验统计量判别原则Barlett定理如果一个时间序列是纯随机的,得到一个观察期数为的观察序列,那么该序列的延迟非零期的样本自相关系数将近似服从均值为零,方差为序列观察期数倒数的正态分布0,)1,0(~ˆknNkn假设条件原假设:延迟期数小于或等于期的序列值之间相互独立备择假设:延迟期数小于或等于期的序列值之间有相关性1,0210mHm:mkmHk,:至少存在某个1,01mm检验统计量Q统计量(Box和pierce)仅适合大样本场合,对小样本则效果不太精确LB统计量(Ljung和Box)在各种检验场合普遍采用的Q统计量通常指的是LB统计量)(~ˆ212mnQmkk)(~)ˆ()2(212mknnnLBmkk判别原则拒绝原假设当检验统计量大于分位点,或该统计量的P值小于时,则可以以的置信水平拒绝原假设,认为该序列为非白噪声序列接受原假设当检验统计量小于分位点,或该统计量的P值大于时,则认为在的置信水平下无法拒绝原假设,即不能显著拒绝序列为纯随机序列的假定21()m121()m1例2.4:标准正态白噪声序列纯随机性检验样本自相关图检验结果LBQLBQ延迟统计量检验统计量值P值延迟6期2.360.8838延迟12期5.350.9454例2.5对1950年——1998年北京市城乡居民定期储蓄所占比例序列的平稳性与纯随机性进行检验例2.5时序图例2.5自相关图例2.5白噪声检验结果延迟阶数LB统计量检验LB检验统计量的值P值675.460.00011282.570.0001表中数据显示该序列数语非白噪声序列。2.3SAS软件操作SAS软件介绍创建时间序列SAS数据集时间序列数据集的处理SAS软件介绍SAS的全称是StatisticalAnalysisSystem,由美国北卡罗来纳州立大学教授(A.J.Barr&J.H.Goodnight)联合开发的软件。具有完备的数据访问、数据管理、数据分析和数据呈现功能的大型集成化软件系统。在SAS系统中有一个专门进行计量经济与时间序列分析的模块:SAS/ETS。SAS/ETS编程语言简洁,输出功能强大,分析结果精确,是进行时间序列分析与预测的理想的软件由于SAS系统具有全球一流的数据仓库功能,因此在进行海量数据的时间序列分析时它具有其它统计软件无可比拟的优势创建时间序列SAS数据集data(sasuser.)example1_1;命令SAS系统建议一个名字为example1_1的临时数据集inputtimemonyy7.Price;输入两个变量的数据,一个为时间(7为子符长度,如jan2005),一个为价格formattimemonyy5.;表示时间的输出格式是字符长度为5的数据(如jan05)cards;表示下面开始输入数据行,接着就是数据录入。Jan2005101这里数据是以列的方式读取,第一列数据会自动赋值给变量timeFeb200582第二列数据会自动赋值给变量priceMar200566Apr200535May200531Jun20057;表示数据已经输入完毕run;表示系统程序写好,可以运行了procprintdata=example1_1;表明可以查看数据集example1_1的内容run;时间序列数据集的处理间隔函数的使用(intnx)dataexample1_2;命令SAS系统建议一个名字为example1_2的临时数据集inputPrice;输入一个为价格的数据time=intnx(‘month’,’01jan2005’d,_n_-1);用intnx函数给时间变量time赋值,即从2005年1月1日开始,以月为间隔每读入一个price数据,就产生一个time数据formattimemonyy5.;表示时间的输出格式是字符长度为5的数据(如jan05)cards;表示下面开始输入数据行,接着就是数据录入。3.413.453.423.533.45;procprintdata=example1_2;表明可以查看数据集example1_2的内容run;时间序列数据集的处理序列变换dataexample1_3;inputPrice;logprice=log(price);表明将price的对数函数值赋值为新变量logpricetime=intnx(‘month’,’01jan2005’d,_n_-1);用intnx函数给时间变量time赋值,即从2005年1月1日开始,以月为间隔每读入一个price数据,就产生一个time数据formattimemonyy5.;表示时间的输出格式是字符长度为5的数据(如jan05)cards;表示下面开始输入数据行,接着就是数据录入。3.413.453.423.533.45;procprintdata=example1_3;表明可以查看数据集example1_3的内容run;时间序列数据集的处理缺失值插值dataexample1_5;inputPrice;time=intnx(‘month’,’01jan2005’d,_n_-1);formattimedate.;表示的输出格式是按照01jan05格式的数据cards;3.413.453.533.45;procexpanddata=example1_5out=example1_6;表明将example1_5种的所有缺失值用插值的方法补齐,并将补齐后的数据集另存为example1_6idtime;procprintdata=example1_5;procprintdata=example1_6;run;时间序列数据集的处理绘制时序图dataexample2_2;inputfreq@@;用@@表明数据以行的方式读取year=intnx('year','1jan1970'd,_n_-1);formatyearyear4.;cards;97154101149221157128215129239155238276204136296176307154227200291233356221309321156234432278356254349322254327432401;procgplot;下面准备对数据进行绘图plotfreq*year;要求系统以freq为纵坐标,year为横坐标以symbol语句所规定的格式绘图symbolv=squarec=redi=join;v表示观察值的图形,可选择star(星号),dot(点),circle(圆);diamond(菱形)等形状;c表示颜色;I表示连线方式,可选择join(线性连接),spline(光滑连接)等连线方式。run;时间序列数据集的处理平稳性检验dataexample2_2;inputfreq@@;用@@表明数据以行的方式读取year=intnx('year','1jan1970'd,_n_-1);formatyearyear4.;cards;9715410114922115712821512

1 / 48
下载文档,编辑使用

©2015-2020 m.777doc.com 三七文档.

备案号:鲁ICP备2024069028号-1 客服联系 QQ:2149211541

×
保存成功