数学建模中预测方法2015年2历届CUMCM数据预测题目2003年A题SARS的传播问题2005年A题长江水质评价和预测问题2006年B题艾滋病疗法的评价及疗效的预测问题2007年A题中国人口增加预测问题2009年D题“会议筹备”对与会人数的确定2010B题上海世博会影响力相关数据预测3一、预测的概念系统预测:根据系统发展变化的实际数据和历史资料,运用现代的科学理论和方法,以及各种经验、判断和知识,对事物在未来一定时期内的可能变化情况,进行推测、估计和分析。几个问题三六九,出门走。早霞不出门,晚霞行千里。4预测的特点科学性:据统计资料和目前信息,运用一定程序、方法和模型,分析预测对象与相关因素的相互联系,而揭示预测对象特性和变化规律。近似性:受许多随机因素的影响,事前预测的结果,往往与将来实际发生的结果有一定偏差。局限性:对预测对象的认识常受知识、经验、观察和分析能力限制,又掌握资料和信息不够准确完整,或建模时简化等,导致预测的分析不够全面。一、预测的概念5根据预测的内容:科学预测、技术预测、社会预测、经济预测、军事预测根据预测的期限:短期预测(1年内)、中期预测(2~5年)、长期预测(5~10年及以上)根据预测的性质:定性预测、定量预测、综合预测预测分类一、预测的概念6预测技术的种类繁多,据统计有150多种。其中广泛采用有15~20种。定性预测方法定量预测方法时间序列分析因果关系分析移动平均指数平滑Box-Jenkins法回归分析法计量经济模型状态空间分析Markov预测灰色系统模型专家会议法/Delphi法主观概率法领先指标法神经网络预测法一、预测的概念7确定预测目标收集、分析资料选择预测方法进行预测分析评价预测方法及其结果修正预测结果提交预测报告预测一般步骤一、预测的概念8二、时间序列分析预测法时间序列:系统中某一变量或指标的数值或统计观测值,按时间顺序排列成一个数值序列,就称为时间序列(TimeSeries),又称动态数据。年份199019911992199319941995一季度4.776.387.4610.348.4810.39二季度6.168.066.3710.458.1510.48三季度5.049.648.469.549.4312.23四季度5.136.838.898.279.6710.98某市六年来汽车货运量(亿吨公里)9二、时间序列分析预测法系统预测中讨论的时间序列,一般是某随机过程的一个样本。通过对其分析研究,找出动态过程的特性、最佳的数学模型、估计模型参数,并检验利用数学模型进行统计预测的精度,是时间序列分析的内容。年份199019911992199319941995一季度4.776.387.4610.348.4810.39二季度6.168.066.3710.458.1510.48三季度5.049.648.469.549.4312.23四季度5.136.838.898.279.6710.98某市六年来汽车货运量(亿吨公里)10二、时间序列分析预测法某市六年来汽车货运量0246810121416456789101111时间序列特征:趋势性T:总体上持续上升或下降的总变化趋势,其间的变动幅度可能有时不等。季节性S:以一年为周期,四个季节呈某种周期性,各季节出现波峰和波谷的规律类似。周期性C:决定于系统内部因素的周期性变化规律,又分短周期、中周期、长周期等几种。不规则性I:包括突然性和随机性变动两种。二、时间序列分析预测法任一时间序列可表示为几种变动的不同组合的总结果,且可表示为:加法模型:Y=T+S+C+I乘法模型:Y=T·S·C·I12二、时间序列分析预测法某市六年来汽车货运量时间序列分解——趋势项——周期项——随机项13平滑预测法包括移动平均法和指数平滑法两种,其具体是把时间序列作为随机变量,运用算术平均和加权平均的方法做未来趋势的预测。这样得到的趋势线比实际数据点的连线要平滑一些,故称平滑预测法。趋势外推预测法根据预测对象历史发展的统计资料,拟合成预先指定的某种时间函数,并用它来描述预测目标的发展趋势。平稳时间序列预测法由于平稳时间序列的随机特征不随时间变化,所以可利用过去的数据估计该时间序列模型的参数,从而可以预测未来。二、时间序列分析预测法---分类14二、时间序列分析预测法---平稳时间序列时序图检验根据平稳时间序列均值与方差为常数的性质,平稳序列的时序图应该显示出该序列始终在一个常数值附近随机波动,而且波动的范围有界、无明显趋势及周期特征自相关图检验平稳序列通常具有短期相关性。该性质用自相关系数来描述就是随着延迟期数的增加,平稳序列的自相关系数对很快地衰减向零。纯随机性检验(白噪声检验)平稳性检验AR(1)模型的自相关函数ACF(k)-1.00-0.90-0.80-0.70-0.60-0.50-0.40-0.30-0.20-0.100.000.100.200.300.400.500.600.700.800.901.000123456789101112延迟k自相关系数tttxx18.0AR(1)模型的自相关函数ACF(k)-1.00-0.90-0.80-0.70-0.60-0.50-0.40-0.30-0.20-0.100.000.100.200.300.400.500.600.700.800.901.000123456789101112延迟k自相关系数tttxx18.015AR(p)模型MA(q)模型ARMA(p,q)模型平稳时间序列分析模型:ARMA模型的全称是自回归移动平均(autoregressionmovingaverage)模型,它是目前最常用的拟合平稳时间序列的模型。ARMA模型又可细分为AR模型、MA模型和ARMA模型三大类。tptptttxxxx22110qtqttttx2211qtqtttptpttttxxxx221122110二、时间序列分析预测法---平稳时间序列16确定性时间序列分析(平滑法、趋势外推拟合法)通常这种非平稳的时间序列显示出非常明显的规律性,比如有显著的趋势或有固定的变化周期。随机性时间序列分析(ARIMA模型)由随机因素导致的的非平稳时间序列,通常这种随机波动非常难以确定和分析。通过差分法或适当的变换使非平稳序列的化成为平稳序列。在实际情况中,绝大部分序列都是非平稳的,因而对非平稳序列的分析更普遍、更重要,相应地各种分析方法也更多。通常包含下列两种方法:二、时间序列分析预测法---非平稳序列非平稳序列分析法17ARIMA(AutoregressiveIntegratedMovingAverage)模型,差分自回归滑动平均模型(滑动也译作移动),又称求合自回归滑动平均模型。ARIMA(p,d,q)中,AR是自回归,p为自回归项数;MA为滑动平均,q为滑动平均项数,d为使之成为平稳序列所做的差分次数(阶数)。ARIMA(p,d,q)模型是ARMA(p,q)模型的扩展。二、时间序列分析预测法---非平稳序列18Box-Jenkins法-时间序列分析法19例:建立国际航线旅客月度人数的ARIMA模型。我们已有一组1949年至1961年国际航线旅客月度人数的144条记录。使用ARIMA过程进行建模和预测。其数据列于下表所示。二、时间序列分析预测法—实例分析YEAR12345678910111219491121181321291211351481481361191041181950115126141135125149170170158133114140195114515017816317217819919918416214616619521711801931811832182302422091911721941953196196236235229243264272237211180201195420418823522723426430229325922920322919552422332672692703153643473122742372781956284277317313318374413405355306271306195731530135634835542246546740434730533619583403183623483634354915054043593103371959360342406396420472548559463407362405196041739141946147253562260640846139043220(1)绘制时序图二、时间序列分析预测法—实例分析21(2)对平稳性和季节性的识别对平稳性和季节性的识别通常有时序图和自相关图两种方法,或两者结合起来一起判断。时序图,是通过直接观察时间序列折线图来检验序列是否平稳。如果时间序列有某种趋势或呈现出增加或减少范围的扩散现象,则序列是不平稳的。自相关图。如果序列的折线图并不明显地呈现上述现象,而我们又无法直接判断序列究竟平稳与否,通常可以利用自相关图来检测序列是否平稳。二、时间序列分析预测法—实例分析22二、时间序列分析预测法—实例分析23(3)变换不平稳序列为平稳序列如果时间序列呈线性趋势,均值不是常数,利用一阶差分将产生一个平稳序列。如果时间序列呈二次趋势,均值不是常数,利用二阶差分将产生一个平稳序列。如果时间序列呈现出随时间的上升或下降而偏差,方差不是常数,通常可利用取自然对数转化为平稳序列。如果时间序列呈现指数趋势,均值和方差都不是常数,通常也可利用取自然对数转化为平稳序列。如果时间序列呈现“相对环”趋势,通常将数据除以同时发生的时间序列的相应值转化为平稳序列。二、时间序列分析预测法—实例分析24a)取对数消除振幅变大趋势---线性增长趋势二、时间序列分析预测法—实例分析25b)需要对这个新序列数据再进行滞后一次(消除增长)和滞后12次(消除季节)共两次差分最终转换为平稳序列(4)检验待选的时间序列模型的自相关函数二、时间序列分析预测法—实例分析26ACF图中,我们认为自相关系数在延迟1阶后都落入2倍标准差内,然后在延迟12阶处突然有一个较大的自相关系数,紧接着又落入2倍标准差内,很象在1,12处截尾27(5)估计备选时间序列模型的参数估计(6)利用确定的模型进行预测二、时间序列分析预测法—实例分析281、定义一元线性回归预测是处理因变量y与自变量x之间线性关系的回归预测法,其数学模型为:(7.4.1)yabx其中a、b称为回归系数首先根据x、y的现有统计数据,在直角坐标系中作散点图,观察y随x而变是否为近似的线性关系。若是,则求出式(7.4.1)中的a、b值,就可确定其数学模型,然后由x的未来变化去求相应的y值。三、回归分析预测法---一元线性回归Y=a+bxyxax029使拟合的数值与实际值的总方差为最小,即拟合程度最好,则得两者之差ei22(7.4.6)ˆiiiiiiabQiiyyyexabxye总方差根据极值原理,式(7.4.6)对a、b分别求偏导,并令其=0,得222iiiiQiiaaabaaababxyyxyx三、回归分析预测法---一元线性回归2、a、b的确定方法—最小二乘法30000(7.4.7)iiQyabxanabyxiinabyxiibyxiiaybxn令,即所以27.4.7Qiibbabyx将式代入得()三、回归分析预测法---一元线性回归31222iiiiiiiQybxxyibbybxbxbybxxyxxyxx20