数据分析(方法与案例)作者贾俊平统计学11-2统计学STATISTICS(第四版)2020-2-29未来是不可预测的,不管人们掌握多少信息,都不可能存在能作出正确决策的系统方法。——C.R.Rao统计名言第11章时间序列预测11.1时间序列的成分和预测方法11.2平稳序列的预测11.3趋势预测11.4多成分序列的预测11.5Box-Jenkins方法:ARIMA模型11-4统计学STATISTICS(第四版)2020-2-29学习目标时间序列的组成要素预测方法的选择与评估平稳序列的预测方法趋势序列的预测方法多成分序列的预测方法ARIMA模型使用SPSS和Excel预测11-5统计学STATISTICS(第四版)2020-2-29下个月的消费者信心指数是多少?消费者信心指数不仅仅是消费信心的反映,在某种程度上反映了消费者对整个宏观经济运行前景的看法一些国家都把消费者信心指数作为经济运行的一项预警指标来看待。国家统计局定期公布这类数据下表是国家统计局公布的2009年7月至2010年8月我国的消费者预期指数、消费者满意指数和消费者信心指数(%)怎样预测下个月的消费者信心指数呢?首先需要弄清楚它在2009年7月至2010年8月过去的这段时间里是如何变化的,找出其变化的模式。如果预期过去的变化模式在未来的一段时间里能够延续,就可以根据这一模式找到适当的预测模型并进行预测。本章介绍的内容就是有关时间序列的预测问题11-6统计学STATISTICS(第四版)2020-2-29下个月的消费者信心指数是多少?日期消费者预期指数消费者满意指数消费者信心指数2009.07101.1103.6102.12009.08102.0103.8102.72009.09102.2103.7102.82009.10102.6104.0103.22009.11103.0103.8103.32009.12104.0103.8103.92010.01104.6104.8104.72010.02104.5103.7104.22010.03108.2107.5107.92010.04106.8106.2106.62010.05108.2107.7108.02010.06108.9107.8108.52010.07108.6106.4107.82010.08107.9106.2107.311.1时间序列的成分和预测方法11.1.1时间序列的成分11.1.2预测方法的选择与评估第11章时间序列预测11.1.1时间序列的成分11.1时间序列成分和预测方法11-9统计学STATISTICS(第四版)2020-2-29时间序列(timesseries)1.按时间顺序记录的一组数据2.观察的时间可以是年份、季度、月份或其他任何时间形式3.观测时间用表示,观测值用表示4.时间序列的组成要素(components):趋势、季节变动、循环波动和不规则波动t),,2,1(ntYt11-10统计学STATISTICS(第四版)2020-2-29时间序列的组成要素(components)1.趋势(trend)持续向上或持续向下的变动2.季节变动(seasonalfluctuation)在一年内重复出现的周期性波动3.循环波动(Cyclicalfluctuation)非固定长度的周期性变动4.不规则波动(irregularvariations)除去趋势、季节变动和周期波动之后的随机波动称为不规则波动只含有随机波动而不存在趋势的序列也称为平稳序列(stationaryseries)5.四种成分与序列的关系:Yi=Ti×Si×Ci×Ii11-11统计学STATISTICS(第四版)2020-2-29含有不同成分的时间序列平稳趋势周期季节11-12统计学STATISTICS(第四版)2020-2-29时间序列的成分(例题分析)【例11-1】1990年—2005年我国人均GDP、轿车产量、金属切削机床产量和棉花产量的时间序列。绘制图形观察其所包含的成分11-13统计学STATISTICS(第四版)2020-2-29含有不同成分的时间序列(a)人均GDP序列(b)轿车产量序列(c)机床产量序列(d)棉花产量序列11.1.2预测方法的选择与评估11.1时间序列成分和预测方法11-15统计学STATISTICS(第四版)2020-2-29预测方法的选择与评估11-16统计学STATISTICS(第四版)2020-2-29预测方法的评估1.一种预测方法的好坏取决于预测误差的大小2.预测误差是预测值与实际值的差距3.度量方法有平均误差(meanerror)、平均绝对误差(meanabsolutedeviation)、均方误差(meansquareerror)、平均百分比误差(meanpercentageerror)和平均绝对百分比误差(meanabsolutepercentageerror)4.较为常用的是均方误差(MSE)nFYMSEniii12)(11.2平稳序列的预测11.2.1移动平均预测11.2.2简单指数平滑预测第11章时间序列预测11-18统计学STATISTICS(第四版)2020-2-29平稳序列的预测1.平稳序列(stationaryseries):不含有趋势的序列,其波动主要是随机成分所致,序列的平均值不随着时间的退役而变化2.通过对时间序列进行平滑以消除其随机波动,因而也称为平滑法3.平稳序列的预测方法有简单平均(simpleaverage)法、移动平均(movingaverage)法、简单指数平滑(simpleexponentialsmoothing)法、Box-Jenkins方法(ARIMA模型)等4.本节主要介绍移动平均和简单指数平滑两种方法,Box-Jenkins方法在10.5节中介绍11.2.1移动平均预测11.2平稳序列的预测11-20统计学STATISTICS(第四版)2020-2-29移动平均预测(movingaverage)1.选择一定长度的移动间隔,对序列逐期移动求得平均数作为下一期的预测值2.将最近k期数据平均作为下一期的预测值3.设移动间隔为k(1kt),则t+1期的移动平均预测值为4.预测误差用均方误差(MSE)来衡量kYYYYYFttktkttt1211nFYMSEniii12)(误差个数误差平方和11-21统计学STATISTICS(第四版)2020-2-29移动平均预测(特点)1.将每个观测值都给予相同的权数2.只使用最近期的数据,在每次计算移动平均值时,移动的间隔都为k3.主要适合对较为平稳的序列进行预测4.对于同一个时间序列,采用不同的移动步长预测的准确性是不同的选择移动步长时,可通过试验的办法,选择一个使均方误差达到最小的移动步长11-22统计学STATISTICS(第四版)2020-2-29移动平均预测(例题分析)【例11-2】根据表11-1中的棉花产量数据,分别取移动间隔k=3和k=5进行移动平均预测,计算出预测误差,并将原序列和预测后的序列绘制成图形进行比较。进行移动平均预测11-23统计学STATISTICS(第四版)2020-2-29移动平均预测(例题分析)11-24统计学STATISTICS(第四版)2020-2-29移动平均预测(例题分析)11.2.2简单指数平滑预测11.2平稳序列的预测11-26统计学STATISTICS(第四版)2020-2-29简单指数平滑预测(simpleexponentialsmoothing)1.适合于平稳序列(没有趋势和季节变动的序列)对过去的观测值加权平均进行预测的一种方法2.观测值时间越远,其权数也跟着呈现指数的下降,因而称为指数平滑3.t+1的预测值是t期观测值与t期平滑值St的线性组合,其预测模型为tttSYF)1(1Yt为第t期的实际观测值St为第t期的预测值为平滑系数(01)11-27统计学STATISTICS(第四版)2020-2-29简单指数平滑预测(平滑系数的确定)1.不同的会对预测结果产生不同的影响当时间序列有较大的随机波动时,宜选较小的,注重于近期的实际值时,宜选较大的2.选择时,还应考虑预测误差误差均方来衡量预测误差的大小确定时,可选择几个进行预测,然后找出预测误差最小的作为最后的值11-28统计学STATISTICS(第四版)2020-2-29简单指数平滑预测(例题分析)指数平滑预测【例11-2续】根据表11-1中的棉花产量数据,分别取=0.3和=0.5进行指数平滑预测,计算出预测误差,并将原序列和预测后的序列绘制成图形进行比较阻尼系数=1-11-29统计学STATISTICS(第四版)2020-2-29简单指数平滑预测(例题分析—Excel输出的结果)11-30统计学STATISTICS(第四版)2020-2-29简单指数平滑预测(例题分析)010020030040050060070019901991199219931994199519961997199819992000200120022003200420052006年份棉花产量棉花产量α=0.3α=0.511-31统计学STATISTICS(第四版)2020-2-29移动平均和简单指数平滑预测(例题比较分析)11-32统计学STATISTICS(第四版)2020-2-29用SPSS进行简单指数平滑预测(13.0版本)第1步:选择【Analyze-TimeSeries】【ExponentialSmoothing】,进入主对话框第2步:将预测变量(本例为“棉花产量”)选入【Variables】。在【Model】下选择【Simple】。点击【Parameters】,在【General[Alpha]-Value】后输入制定的值(本例分别取0.3和0.5)(注:若不知道指定多大的合适,可选择【GridSearch】,系统会自动搜索,初始值为0,步长为0.1,终止值为1)在【InitialValue】下选择【Custom】,并在【Starting】后输入初始值(本例选择1990年的实际值:450.77),在【Trend】后输入“0”(表示没有趋势)。点击【Continue】返回主对话框(注:初始值的默认方式是【Automatic】,此时系统会根据原始值序列自动计算适合的初始值和趋势值)点击【Save】,在【PredictCase】下点击【Predict-Through】,在【Observation】后的方框内输入要预测的要预测的观测值的时期数(本例为17,表示要预测2006年的数值)。【Continue】返回主对话框。点击【OK】指数平滑预测11-33统计学STATISTICS(第四版)2020-2-29用SPSS进行简单指数平滑预测(16.0版本)使用SPSS进行时间序列预测时,首先需要对观测值序列附加时间因方法是选择【Data】【Definedates】,然后在【CasesAre】下根据需要选择【Years】、【Years,quarters】等等,然后指定第一个观测值的时间【FirstCaseIs】。这样,SPSS会在观测值序列之后加上时间变量第1步:选择【Analyze-TimeSeries】【Createmodels】,进入主对话框第2步:将预测变量选入【DependentVariables】。在【Method】下选择【ExponentialSmoothing】,点击【Criteria】,在【ModelType】下选择【Simple】(进行简单指数平滑预测),点击【Continue】返回主对话框第3步:点击【Save】,在【Description】下选择需要预测的结果,如【PredictedValues】、【LowerConfidenceLimits】、【UpperConfidenceLimits】、【NoiseResiduals】等。点击【options】,在【For