数学建模中的预测方法沈炎峰TEL:6648022015.8.12历届CUMCM数据预测题目2003年A题SARS的传播问题2005年A题长江水质评价和预测问题2006年B题艾滋病疗法的评价及疗效的预测问题2007年A题中国人口增加预测问题2009年D题“会议筹备”对与会人数的确定2010B题上海世博会影响力相关数据预测2012A题葡萄酒质量评价和相关预测问题2013A题交通事故阶段车流量的分析与预测3一、预测的概念系统预测:根据系统发展变化的实际数据和历史资料,运用现代的科学理论和方法,以及各种经验、判断和知识,对事物在未来一定时期内的可能变化情况,进行推测、估计和分析。4预测的特点科学性:据统计资料和目前信息,运用一定程序、方法和模型,分析预测对象与相关因素的相互联系,而揭示预测对象特性和变化规律。近似性:受许多随机因素的影响,事前预测的结果,往往与将来实际发生的结果有一定偏差。局限性:对预测对象的认识常受知识、经验、观察和分析能力限制,又掌握资料和信息不够准确完整,或建模时简化等,导致预测的分析不够全面。一、预测的概念5根据预测的内容:科学预测、技术预测、社会预测、经济预测、军事预测根据预测的期限:短期预测(1年内)、中期预测(2~5年)、长期预测(5~10年及以上)根据预测的性质:定性预测、定量预测、综合预测预测分类一、预测的概念6预测技术的种类繁多,据统计有150多种。其中广泛采用有15~20种。定性预测方法定量预测方法时间序列分析因果关系分析移动平均指数平滑Box-Jenkins法回归分析法计量经济模型状态空间分析Markov预测灰色系统模型专家会议法主观概率法领先指标法神经网络预测法一、预测的概念7确定预测目标收集、分析资料选择预测方法进行预测分析评价预测方法及其结果修正预测结果提交预测报告预测步骤一、预测的概念8ModelAssessmentObjectives:◆Chooseanappropriatemodelfromcandidates◆EstimatethepredictionperformanceofagivenmodelForbothofthesepurposes,thebestapproachistoruntheprocedureonanindependenttestset,ifoneisavailableIfpossibleoneshouldusedifferenttestdatafor(1)and(2)above:avalidationsetfor(1)andatestsetfor(2)Oftenthereisinsufficientdatatocreateaseparatevalidationortestset.InthisinstanceCross-Validationisuseful.9K-FoldCross-ValidationDividethedataintoKroughlyequalparts(typicallyK=5or10)foreachk=1,2,…,K,fitacandidatemodeltotheotherK-1parts,andcomputeitserrorinpredictingthekthpart:Thisgivesthecross-validationerrordothisformanymodelsandchoosethemodelthatmakessmallest.2ˆ()(())kiiikthpartEyy10二、时间序列分析预测法时间序列:系统中某一变量或指标的数值或统计观测值,按时间顺序排列成一个数值序列,就称为时间序列(TimeSeries),又称动态数据。年份199019911992199319941995一季度4.776.387.4610.348.4810.39二季度6.168.066.3710.458.1510.48三季度5.049.648.469.549.4312.23四季度5.136.838.898.279.6710.98某市六年来汽车货运量(亿吨公里)11二、时间序列分析预测法系统预测中讨论的时间序列,一般是某随机过程的一个样本。通过对其分析研究,找出动态过程的特性、最佳的数学模型、估计模型参数,并检验利用数学模型进行统计预测的精度,是时间序列分析的内容。年份199019911992199319941995一季度4.776.387.4610.348.4810.39二季度6.168.066.3710.458.1510.48三季度5.049.648.469.549.4312.23四季度5.136.838.898.279.6710.98某市六年来汽车货运量(亿吨公里)12二、时间序列分析预测法某市六年来汽车货运量0246810121416456789101113时间序列特征:趋势性T:总体上持续上升或下降的总变化趋势,其间的变动幅度可能有时不等。季节性S:以一年为周期,四个季节呈某种周期性,各季节出现波峰和波谷的规律类似。周期性C:决定于系统内部因素的周期性变化规律,又分短周期、中周期、长周期等几种。不规则性I:包括突然性和随机性变动两种。二、时间序列分析预测法任一时间序列可表示为几种变动的不同组合的总结果,且可表示为:加法模型:Y=T+S+C+I乘法模型:Y=T·S·C·I14二、时间序列分析预测法某市六年来汽车货运量时间序列分解——趋势项——周期项——随机项15平滑预测法包括移动平均法和指数平滑法两种,其具体是把时间序列作为随机变量,运用算术平均和加权平均的方法做未来趋势的预测。这样得到的趋势线比实际数据点的连线要平滑一些,故称平滑预测法。趋势外推预测法根据预测对象历史发展的统计资料,拟合成预先指定的某种时间函数,并用它来描述预测目标的发展趋势。平稳时间序列预测法由于平稳时间序列的随机特征不随时间变化,所以可利用过去的数据估计该时间序列模型的参数,从而可以预测未来。二、时间序列分析预测法---分类161移动平均法移动平均法:在原时间序列内依次求连续若干期的平均数作为其某一期的趋势值,如此逐项递移求得一系列的移动平均数,形成一个新的、派生的平均数时间序列。在新的时间序列中偶然因素的影响被削弱,从而呈现出现象在较长时间的基本发展趋势。17把时间序列连续N期的平均数作为最近一期(第t期)的趋势值:)(111)1(NttttYYYNMN期移动平均数18把时间序列连续N期的平均数作为N期的中间一期的趋势值。如果N为奇数,则把N期的移动平均值作为中间一期的趋势值。如果N为偶数,须将移动平均数再进行一次两项移动平均,以调整趋势值的位置,使趋势值能对准某一时期)。相当于对原序列进行一次N+1项移动平均,首末两个数据的权重为0.5,中间数据权重为1。为偶数)NYYYYNMNtNtttNt()5.05.0(1112/中心化移动平均19Example1新卫机械厂的销售收入(万元):年份销售收入年份销售收入年份销售收入年份销售收入1985108019902160199521602000324019861260199123401996234020013420198718001992198019972880200232401988162019932520199830602003306019891440199425591999270020043600销售收入050010001500200025003000350040001985198619871988198919901991199219931994199519961997199819992000200120022003200420中心移动平均法销售收入3年移动平均销售收入4年移动平均移正19851080108019861260138012601987180015601800148519881620162016201642.519891440174014401822.5144015301755189021移动平均的结果0500100015002000250030003500400019851986198719881989199019911992199319941995199619971998199920002001200220032004销售收入3年移动平均4年移动平均22移动平均法一般用来消除不规则变动的影响,把序列进行修匀(smoothing),以观察序列的其他成分。如果移动平均的项数等于季节长度则可以消除季节成分的影响;如果移动平均的项数等于平均周期长度的倍数则可以消除循环变动的影响。由于区分长期趋势和循环变动比较困难,在应用中有时对二者不做区分,而是把两项合在一起称为“趋势循环”成分(trend-cycle)。移动平均法的应用23指数平滑方法的基本原理指数平滑是一种加权移动平均,既可以用来描述时间序列的变化趋势,也可以实现时间序列的预测。指数平滑预测的基本原理是:用时间序列过去取值的加权平均作为未来的预测值,离当前时刻越近的取值,其权重越大。24tttYYYˆ)1(ˆ1式中:1ˆtY表示时间序列第t+1期的预测值;tY表示时间序列第t期的实际观测值;tYˆ表示时间序列第t期的预测值;表示平滑系数,01。1112211ˆ)1()1()1()1(ˆ)1(ˆYYYYYYYYtttttttt单参数指数平滑的模型为:25适用场合单参数(一次)指数平滑适用于不包含长期趋势和季节成分的时间序列预测如果原序列有增长趋势,平滑序列将系统的低于实际值如果原序列有下降趋势,平滑序列将系统的高于实际值26平滑系数的确定选择合适的平滑系数是提高预测精度的关键。如果序列波动较小,则平滑系数应取小一些,不同时期数据的权数差别小一些,使预测模型能包含更多历史数据的信息;如果序列趋势波动较大,则平滑系数应取得大一些。这样,可以给近期数据较大的权数,以使预测模型更好地适序列趋势的变化。统计软件中可以根据拟合误差的大小自动筛选最优的平滑系数值。27初始预测值的确定初始预测值的确定等于第一个观测值等于前k个值的算术平均适用场合:单参数(一次)指数平滑适用于不包含长期趋势和季节成分的平稳时间序列预测28案例分析新卫机械厂销售额的单参数指数平滑预测分析预测创建模型方法选择“指数平滑”;根据需要设置“条件”。拟合情况与2年的预测值(下页图)。SPSSStatistics估计的=0.689.拟合数据的MAPE=12.847%.29单参数指数平滑的图形结果30二、时间序列分析预测法---平稳时间序列时序图检验根据平稳时间序列均值与方差为常数的性质,平稳序列的时序图应该显示出该序列始终在一个常数值附近随机波动,而且波动的范围有界、无明显趋势及周期特征自相关图检验平稳序列通常具有短期相关性。该性质用自相关系数来描述就是随着延迟期数的增加,平稳序列的自相关系数对很快地衰减向零。纯随机性检验(白噪声检验)平稳性检验AR(1)模型的自相关函数ACF(k)-1.00-0.90-0.80-0.70-0.60-0.50-0.40-0.30-0.20-0.100.000.100.200.300.400.500.600.700.800.901.000123456789101112延迟k自相关系数tttxx18.0AR(1)模型的自相关函数ACF(k)-1.00-0.90-0.80-0.70-0.60-0.50-0.40-0.30-0.20-0.100.000.100.200.300.400.500.600.700.800.901.000123456789101112延迟k自相关系数tttxx18.031AR(p)模型MA(q)模型ARMA(p,q)模型平稳时间序列分析模型:ARMA模型的全称是自回