时间序列分析学年论文

整理文档很辛苦,赏杯茶钱您下走!

免费阅读已结束,点击下载阅读编辑剩下 ...

阅读已结束,您可以下载文档离线阅读编辑

资源描述

2011-2012学年09级统计学专业学年论文题目运用SAS对中国历年运动员获世界冠军数进行建模并作预报.学生姓名学号成绩评语:指导教师日期运用SAS对历年中国运动员获世界冠军数进行建模并作预测摘要:本文通过选取1978年-2009年中国历年运动员获得金牌数,运用SAS统计软件进行处理分析,选取显著的系数,建立模型,对年我国2010以后运动员金牌数做出预测。关键字SASAR模型参数估计平稳时间序列1、引言在自然现象和经济现象中,人们为了对某些事物或系统的运行规律探索其究竟,需要观测所要研究的某种现象,从而得到一定顺序的数据资料。通过分析这些数据资料,对事物或系统的未来发展进行预测或控制方法,称为时间系列分析。从统计学的内容来看,研究数据的统计方法就是时间序列分析。就此足以看到时间序列分析的重要性及其应用的广泛性。时间序列的统计解释是某项统计指标按时间顺序记录的指标值数列时间序列的统计意义是某一系统程序运行过程中的不用时间点的响应,是系统行为量化数据的有序客观记录,反映了系统的结构特征和运行规律。随机时间序列分析就是利用数学的方法描述时间序列的构成因素,具体地说就是对影响时间序列的长期趋势、季节变动、循环波动进行预订和估计;进一步的,将它们从时间序列中分离后,对剩余的一项时间序列的随机波动进行分析和建模;从而实现对时间序列变化规律的认识,预测或控制未来行为。2、SAS介绍StatisticslAnalysisiSystem简称SAS,可以用来分析数据和编写报告。它是美国SAS研究所的产品,在国际上被誉为标准通用软件,在我国深受医学、农林、财经、社会科学、行政管理等众多领域的专业工作者的好评。SAS采用积木式模型结构,其中的SAS/STAT模块是目前功能最强的多元统计分析程序集,可以作回归分析、聚类分析、判别分析、主成分分析、因子分析、典型相关分析、各种实验设计的方差分析、协方差分析以及时间序列分析。3、平稳时间序列的基本概念时间序列的统计特征函数,时间序列{Xt,t∈Z}是按时间次序排列的随机变量序列。对时间序列的研究通常情况下是通过统计特征函数进行的。1)均值函数如果对任意t∈Z,EXt存在,则称函数Mx(t)=EXt,t∈Z为时间序列{Xt,t∈Z}的均值。如果对任意t∈Z,EXt存在,则称{Xt,t∈Z}为二阶矩时间序列有:2)自协方差函数Cx(s,t)=E[(Xs-Mx(s))(Xt-Mx(t))],s,t∈Z.3)方差函数Dx(t)=E[Xt-Mx(t)]2,t∈Z.4)自相关函数Rx(s,t)=E(XsXt),s,t∈Z.二阶矩时间序列的协方差和相关函数一定存在,且有下列关系:Cx(s,t)=Rx(s,t)-Mx(s)Mx(t),特别的,当Xt的均值函数值Mx(t)=0时,Cx(s,t)=Rx(s,t).均值函数Mx(t)是时间序列{Xt,t∈Z}在时刻t的平均值,称为集平均。发差函数Dx(t)是时间序列在t时刻均值函数Mx(t)的偏离程度。自协方差函数Cx(s,t)和自相关函数Rx(s,t)则反映时间序列在时刻s和t的线性相关程度。下面介绍时间序列分析的重点对象—平稳时间序列的概念。平稳时间序列如果一个时间序列{Xt,t∈Z}具有如下特征则称其为平稳时间序列:1)在任意时刻t∈Z,Xt存在有限的方差,即Xt是一个二阶矩形时间序列;2)在任意时刻t∈Z,Xt的均值函数Mx(t)=μ为与t无关的常数;3)在任意时刻s,t∈Z,Xt的自协方差函数Cx(s,t)=γt-s是时间差t-s的函数,及对任意s,t∈Z和k∈Z,Cx(s,t)=Cx(s+k,t+k)=γt-s。很明显,平稳时间序列的统计特征主要是由其协方差函数刻画的,时间序列分析理论的一个重要特点就是利用自协方差函数研究平稳时间序列的统计性质。4、平稳性检验平稳时间序列因为有很好的统计特征,所以便于研究。我们先检验所观测的样本是否具有平稳性,然后根据其平稳性来建立相适应的模型。平稳性检验中的以下二种方法1)数据检验法数据图检验是在t-Xt平面直角坐标系中将研究的试驾序列绘成连线图,观察其是否具有趋势性或周期性,若无明显的趋势性或周期性,其波动幅度也不大,就认为序列是平稳的。2)自相关函数检验法一个零均值平稳序列的自相关函数要么是结尾的,要么是拖尾的。因此,如果一个时间序列零均值化以后的自相关函数出现了缓慢衰减或周期性的衰减的情况,则说明序列可能存在某种趋势或周期性。5、白噪声序列如果序列彼此之间没有任何相依性,那就意味着该序列是一个没有记忆的序列,过去的行为对将来的发展没有丝毫影响,这种序列称为纯随机序列,也称为白噪声序列。白噪声序列需要满足如下性质:任取t∈t,有EXt=μ;任取t,s∈T,有,ts,t,0sts,2)-)(E-(XstE,δμμγ。表一历年中国运动员获金牌数年份19781979198019811982198319841985金牌数41232513393746年份19861987198819891990199119921993金牌数26695482549389103年份19941995199619971998199920002001金牌数791027592839211090年份20022003200420052006200720082009金牌数110841011061411231201426.SAS分析及模型建立根据上表,运用如下SAS程序得到时序图。输入:dataexample2;inputx@@;t=intnx('year','01jan1978'd,_n_-1);formattyear4.;cards;0.0761180.0882740.1200920.2088650.2508150.1396630.1735640.2474750.1295970.0986030.1667950.2360720.3123810.364070.2613350.1707890.1095360.0687490.0624960.1063540.1052320.0973730.1287270.1771090.1567390.1696630.2288150.1814640.0855210.176881;procgplot;plotx*t;symboli=jionv=dot;run;图一x0.060.070.080.090.100.110.120.130.140.150.160.170.180.190.200.210.220.230.240.250.260.270.280.290.300.310.320.330.340.350.360.37t1980198219841986198819901992199419961998200020022004200620082010从上图可以看出存在奇异点。再输入程序:dataexample2;inputx@@;t=intnx('year','01jan1980'd,_n_-1);formattyear4.;cards;0.0761180.0882740.1200920.2088650.2508150.1396630.1735640.2474750.1295970.0986030.1667950.2360720.3123810.364070.2613350.1707890.1095360.0687490.0624960.1063540.1052320.0973730.1287270.1771090.1567390.1696630.2288150.1814640.0855210.176881;procgplot;plotx*t;symboli=jionv=dot;procmeans;varx;run;得到N均值标准差最小值最大值------------------------------------------------------------------300.16330560.07443810.06249600.3640700------------------------------------------------------------------因为均值为0.1633056,标准差为0.0744381.根据置信区间公式(均值—2*标准差,均值+2*标准差)得到置信区间(0.014429,0.312182)。显然,0.312381,0.36407(0.014429,0.312182),所以,0.312381,0.36407为奇异值。将其修正2*0.236072—0.1633056=0.3088384.将修正后的数据再进行时序分析。由SAS输入:dataexample2;inputx@@;t=intnx('year','01jan1978'd,_n_-1);formattyear4.;cards;0.0761180.0882740.1200920.2088650.2508150.1396630.1735640.2474750.1295970.0986030.1667950.2360720.30883840.30883840.2613350.1707890.1095360.0687490.0624960.1063540.1052320.0973730.1287270.1771090.1567390.1696630.2288150.1814640.0855210.176881;procarima;identifyvar=xnlag=12minicp=(0:5)q=(0:5);run;得到图2图2AutocorrelationsLagCovarianceCorrelation-198765432101234567891StdError00.00468021.00000||********************|010.00281400.60127|.|************|0.18257420.000708000.15128|.|***.|0.2396563-0.0001373-.02933|.*|.|0.2428184-0.0010769-.23011|.*****|.|0.2429365-0.0015647-.33432|.*******|.|0.2500966-0.0012545-.26804|.*****|.|0.2645737-0.0006004-.12828|.***|.|0.2734758-0.0000138-.00295|.|.|0.27547490.000070750.01512|.|.|0.27547510-0.0001650-.03526|.*|.|0.27550311-0.0005373-.11480|.**|.|0.27565312-0.0006276-.13409|.***|.|0.277242.markstwostandarderrorsPartialAutocorrelationsLagCorrelation-19876543210123456789110.60127|.|************|2-0.32929|*******|.|30.08389|.|**.|4-0.34735|*******|.|5-0.00058|.|.|6-0.08261|.**|.|70.06692|.|*.|8-0.02765|.*|.|9-0.11784|.**|.|10-0.10132|.**|.|11-0.16195|.***|.|120.02434|.|.|修正后的自相关函数和偏自相关函数对数据进行平稳性检验由SAS输入:dataexample2;inputx@@;t=intnx('year','01jan1978'd,_n_-1);formattyear4.;cards;0.0761180.0882740.1200920.2088650.2508150.1396630.1735640.2474750.1295970.0986030.1667950.2360720.30

1 / 12
下载文档,编辑使用

©2015-2020 m.777doc.com 三七文档.

备案号:鲁ICP备2024069028号-1 客服联系 QQ:2149211541

×
保存成功