《统计软件实验报告》SPSS软件的上机实践应用时间序列分析数学与统计学学院一、实验内容:时间序列是指一个依时间顺序做成的观察资料的集合。时间序列分析过程中最常用的方法是:指数平滑、自回归、综合移动平均及季节分解。本次实验研究就业理论中的就业人口总量问题。但人口经济的理论和实践表明,就业总量往往受到许多因素的制约,这些因素之间有着错综复杂的联系,因此,运用结构性的因果模型分析和预测就业总量往往是比较困难的。时间序列分析中的自回归求积分移动平均法(ARIMA)则是一个较好的选择。对于时间序列的短期预测来说,随机时序ARIMA是一种精度较高的模型。我们已辽宁省历年(1969-2005)从业人员人数为数据基础建立一个就业总量的预测时间序列模型,通过spss建立模型并用此模型来预测就业总量的未来发展趋势。二、实验目的:1.准确理解时间序列分析的方法原理2.学会实用SPSS建立时间序列变量3.学会使用SPSS绘制时间序列图以反应时间序列的直观特征。4.掌握时间序列模型的平稳化方法。5.掌握时间序列模型的定阶方法。6.学会使用SPSS建立时间序列模型与短期预测。7.培养运用时间序列分析方法解决身边实际问题的能力。三、实验分析:总体分析:先对数据进行必要的预处理和观察,直到它变成稳态后再用SPSS对数据进行分析。数据的预处理阶段,将它分为三个步骤:首先,对有缺失值的数据进行修补,其次将数据资料定义为相应的时间序列,最后对时间序列数据的平稳性进行计算观察。数据分析和建模阶段:根据时间序列的特征和分析的要求,选择恰当的模型进行数据建模和分析。四、实验步骤:SPSS的数据准备包括数据文件的建立、时间定义和数据期间的指定。SPSS的时间定义功能用来将数据编辑窗口中的一个或多个变量指定为时间序列变量,并给它们赋予相应的时间标志,具体操作步骤是:1.选择菜单:Date→DefineDates,出现窗口:单击【ok(确认)】按钮,此时完成时间的定义,SPSS将在当前数据编辑窗口中自动生成标志时间的变量。当数据准备好,为认识数据的变化规律,判断数据是否存在离群点和缺损值,最直接的观察方法是绘制序列的图像。2.选择菜单选项栏中的AnalyzeforecastingSequenceCharts,弹出SequenceCharts对话框。单击【ok(确认)】按钮,得到时序图:观察发现序列没有明显的周期性,为非平稳时间序列。一般而言,一次差分可以将序列中的线性趋势去掉,二次差分可以将序列中的抛物线趋势去掉,图中曲线存在线性趋势,用一阶差分运算去除。3.选择菜单:TransformCreateTimeSeries,弹出对话框:单击【ok(确认)】按钮,此时完成线性成分的去除,SPSS将在当前数据编辑窗口中自动生成差分后的新变量X_1。数据经过一阶差分后,检验差分序列自相关和偏相关函数是否为截尾或拖尾,若是则数据已为平稳序列可以进行ARIMA建模,否则继续对数据进行平稳化处理。4.选择菜单Analyze→TimeSeries→Autoregression。把被解释变量选择到Dependent框中,选择解释变量到Independent(s)框中。单击【ok(确认)】按钮,此时生成自相关和偏自相关相关数据。表中显示的是自相关计算结果,从左向右,依次列出的是:滞后数、自相关系数值、标准误差、Box-ljung统计量(值、自由度、原假设成立的概率值)。通过标准误差以及Box-ljung统计量的相伴概率都可以说该时间序列不是白噪声,是具有自相关性的时间序列,可以建立ARIMA模型。自相关图显示序列在2阶滞后期时进入平稳置信区间并拖尾,所以MA(q)的q取值为2。偏自相关序列在1阶滞后期时进入平稳置信区间并拖尾,所以AR(p)的p取值为1。数据经过一阶差分,所以I(d)的取值为1。5.当时间序列的数据已经准备好以后,选择菜单栏中的AnalyzeForecastingCreateModels命令,弹出CreateModels对话框。在该对话框左侧的Variables列表框中选择一个变量,将其移入DependentVariables列表框。在Method下拉列表框中选择ARIMA,然后选择ARIMA选项,单击Criteria按钮,弹出ARIMACriteria对话框。单击CreateModels对话框中的ok按钮,将进行ARIMA模型建模和分析,结果如下:平稳的R方为0.414说明基本拟合。我们根据以上方法改变ARIMA(p,d,q)中的系数重新建模。(p,d,q)取值分别为(1,1,0)得出结果如下:通过平稳R方值的比较,(1,1,2)的平稳R方取值明显大于(1,1,0)模型的取值,所以此次实验ARIMA(1,1,2)模型较适合,预测2006年就业人数为1946.63万,在1881.52与2103.75万范围之内。