天津理工大学中环信息学院王武1第二章预测类数学模型本章重点:预测类数学模型的基本思想,掌握基本的数据拟合方法—多项式数据拟合,灰色预测模型等。学习要求1.能用基本的数学模型方法解决一些简单的预测类问题。2.掌握基本拟合方法的原理与优缺点。2.1最小二乘法的基本原理和多项式拟合2.1.1最小二乘法的基本原理从整体上考虑近似函数同所给数据点(i=0,1,…,m)误差(i=0,1,…,m)(i=0,1,…,m)绝对值的最大值,即误差向量的∞—范数;二是误差绝对值的和,即误差向量r的1—范数;三是误差平方和的算术平方根,即误差向量r的2—范数;前两种方法简单、自然,但不便于微分运算,后一种方法相当于考虑2—范数的平方,因此在曲线拟合中常采用误差平方和来度量误差(i=0,1,…,m)的整体大小。数据拟合的具体作法是:对给定数据(i=0,1,…,m),在取定的函数类中,求,使误差(i=0,1,…,m)的平方和最小,即=从几何意义上讲,就是寻求与给定点(i=0,1,…,m)的距离平方和为最小的曲线(图6-1)。函数称为拟合函数或最小二乘解,求拟合函数的方法称为曲线拟合的最小二乘法。可有不同的选取方法.天津理工大学中环信息学院王武22—12.1.2多项式拟合所谓多项式数据拟合,主要是采用多项式函数形式来进行拟合、逼近数据所呈现出来的趋势。多项式的系数可以由最小二乘法计算出来。假设给定数据点(i=0,1,…,m),为所有次数不超过的多项式构成的函数类,现求一,使得(1)当拟合函数为多项式时,称为多项式拟合,满足式(1)的称为最小二乘拟合多项式。特别地,当n=1时,称为线性拟合或直线拟合。显然为的多元函数,因此上述问题即为求的极值问题。由多元函数求极值的必要条件,得(2)即(3)(3)是关于的线性方程组,用矩阵表示为天津理工大学中环信息学院王武3(4)式(3)或式(4)称为正规方程组或法方程组。可以证明,方程组(4)的系数矩阵是一个对称正定矩阵,故存在唯一解。从式(4)中解出(k=0,1,…,n),从而可得多项式(5)可以证明,式(5)中的满足式(1),即为所求的拟合多项式。我们把称为最小二乘拟合多项式的平方误差,记作由式(2)可得(6)多项式拟合的一般方法可归纳为以下几步:(1)由已知数据画出函数粗略的图形——散点图,确定拟合多项式的次数n;(2)列表计算和;(3)写出正规方程组,求出;(4)写出拟合多项式。在实际应用中,或;当时所得的拟合多项式就是拉格朗日或牛顿插值多项式。*2.1.3最小二乘拟合多项式的存在唯一性定理1设节点互异,则法方程组(4)的解存在唯一。天津理工大学中环信息学院王武4定理2设是正规方程组(4)的解,则是满足式(1)的最小二乘拟合多项式。*2.1.4多项式拟合中克服正规方程组的病态在多项式拟合中,当拟合多项式的次数较高时,其正规方程组往往是病态的。而且:①正规方程组系数矩阵的阶数越高,病态越严重;②拟合节点分布的区间偏离原点越远,病态越严重;③(i=0,1,…,m)的数量级相差越大,病态越严重。为了克服以上缺点,一般采用以下措施:①尽量少作高次拟合多项式,而作不同的分段低次拟合;②不使用原始节点作拟合,将节点分布区间作平移,使新的节点关于原点对称,可大大降低正规方程组的条件数,从而减低病态程度。平移公式为:(9)③对平移后的节点(i=0,1,…,m),再作压缩或扩张处理:(10)其中,(r是拟合次数)(11)经过这样调整可以使的数量级不太大也不太小,特别对于等距节点,作式(10)和式(11)两项变换后,其正规方程组的系数矩阵设为A,则对1~4次多项式拟合,条件数都不太大,都可以得到满意的结果。变换后的条件数上限表如下:拟合次数1234=19.950.3435天津理工大学中环信息学院王武5④在实际应用中还可以利用正交多项式求拟合多项式。一种方法是构造离散正交多项式;另一种方法是利用切比雪夫节点求出函数值后再使用正交多项式。这两种方法都使正规方程组的系数矩阵为对角矩阵,从而避免了正规方程组的病态。例1:世界人口预测问题人类社会进入20世纪以来,在科学技术和生产力飞速发展的同时,世界人口也以空前的规模增长,统计数据如表3.1所示。表3.1世界人口统计数据年份1625183019301960197419871999人口/亿5102030405060可以看出,人口每增长10亿的时间由100年缩短为十几年。人口增长使人类赖以生存的地球环境急剧恶化,人们幡然醒悟,开始研究人类和自然的关系、人口数量的变化规律,以及如何进行人口控制的问题。根据上表,预测2000年以后的世界人口发展趋势。解题思路:1、问题分析:本题主要是根据已有的人口数据,预测未来的人口发展趋势,在不考虑其他因素的前提下,我们可采用多项式来拟合(建模论文中要写清楚具体方法原理与步骤)数据所呈现出来的趋势。设y(Population)为人口数量,x(Year)为年份。2、模型建立:我们可以先采用三次拟合,设32yaxbxcxd。3、模型求解:Matlab三次拟合源程序如下:Year=[1625,1830,1960,1974,1987,1999];%输入自变量—年份Population=[5,10,20,30,40,50,60];%输入因变量—人口数量Year1=1625:2020;%输入需要检测的年份—1625-2020Year2=2000:2020;%输入需要预测的年份[P2,S2]=polyfit(Year,Population,3)%P2为系数,S2为残差Population1=polyval(P2,Pear1);%计算拟合结果Population2=polyval(P2,Pear2);%计算拟合结果Polt(Year,Population,’*’,Year2,Population2,’X’,Year1,Population1);%画图lengend(‘实际数据’,’拟合数据’)天津理工大学中环信息学院王武6xlabel(‘年份’);ylabel(‘人口数量(亿人)’)执行上述程序后,可以得到三次拟合结果如图3.1所示16001650170017501800185019001950200020500102030405060708090年份人口数量(亿人)实际拟合拟合数据图3.1三次拟合结果得到相应的三次拟合函数式为6327.6100.0417242955yxxx,三次拟合的平方误差为2.3274相应的预测结果见表3.3表3.22001—2020年世界人口预测数据年份2001200220032004200520062007200820092010人数61.4562.3663.2964.2365.1766.1367.0968.0769.0670.05年份2011201220132014201520162017201820192020人数71.0672.0873.1074.1475.1976.2477.3178.3979.4880.58将上述程序第五行的3改为2,即可做二次拟合,执行上述程序后,可以得到三次拟合结果如图3.2所示天津理工大学中环信息学院王武71600165017001750180018501900195020002050-10010203040506070年份人口数量(亿人)实际拟合拟合数据图2二次拟合结果得到相应的二次拟合的平方误差为14.4641,且在1700—1750年出现了负人口的情况,这与实际是不相符的,因此二次拟合效果显然不如三次拟合的效果。需要说明的是不是次数越高的拟合效果就越好,在实际操作中,经常进行多个不同次数的拟合,选取效果最好的拟合次数。4、模型评价在二次拟合中返现拟合函数在1700—1750年出现了负人口数的状况,这与实际不符。因此在拟合中一定要注意拟合的合理性。2.2非多项式拟合前面介绍了多项式数据拟合,但是多项式数据拟合有一定的局限性,有时需要对非多项式的测试数据进行拟合,并预测其后期数据。在非多项式拟合中,Malthus拟合和Logistic拟合是最典型的、应用最广的拟合方式。2.2.1Malthus拟合Malthus拟合是由英国统计学家和人口学家Malthus提出来的。设时刻t某一个较大国家或较大地区的人口数量为()xt,则()xt是一个较大的整天津理工大学中环信息学院王武8数。为了利用微积分这一数学工具,我们设()xt是连续可微的函数。记初始时刻0t的人口数量为0x,假设人口增长率为常数r,即单位时间内()xt的增长量等于r乘以()xt。考虑ttt时间内人口的数量,显然()()()xttxtrxtt,令0t,得到()xt满足微分方程:0()000()()rttdxrxxtxedtxtx当0r时,表示人口将按指数规律随时间无限增长,称为指数增长模型。2.2.2Logistic拟合设在所考查的自然环境下,群里所能达到的最大总数(生存极限数)为K,若开始时群体的自然增长率为r,随着群体的增长,增长率下降,一旦群体总数达到K,群体停止增长,即增长率为零。通过以上分析可知,自然环境对种群增长率的组织作用体现在r上,即随着群体数量的增长而下降,若将r表示为()xt的函数()rx,则显然它应该是减函数,则:00()()dxrxxdtxtx设()rx为一个线性函数,()()1xtrxK。采用分离变量法求解上述方程有0()0()1(1)()rttKxtKext求解上述微分方程,Matlab程序如下:Dsolve(‘Dx=r*(1-x/K)*x’,’t’)2.3灰色预测模型灰色系统理论经过20年的发展其主要内容包括以灰色哲学为基础的思想体系,以灰色代数系统、灰色方程、灰色矩阵等为基础的理论体系,以灰色序列生成为基础的方法体系,以灰色关联空间为依托的分析体系,以灰色模型(GM)为核心的模型体系,以系统分析、评估、建模、预测、决策、控制、优化为主体的技术体系。天津理工大学中环信息学院王武9灰色模型主要是对小数据进行预测。灰色预测模型是一种针对含有不确定因素的小数据问题进行预测的方法。设(0)(0)(0)(0)(1)(1)(1)(1)((1),(2),,,()),((1),(2),,,())XxxxnXxxxn称(0)()()()kXkaxkb为(1,1)GM模型的原始形式。其中G表示灰色(grey),M表示模型(Model),第一个1表示一阶方程,第二l表示1个变量。GM(1,1)模型首先对原始数据进行一阶累加生成(或累减),然后利用指数曲线拟合并预测,最后通过累减还原得到预测值。一般将原始数据序列记为(0)X,将一阶累加生成序列记为(1)X。建(1,1)GM模型的步骤如下:1、假定原始数据序列为(0)(0)(0)(0)((1),(2),,,())Xxxxn对原始数据序列进行一阶累加生成(1)(1)(1)(1)((1),(2),,,())Xxxxn其中,(1)(0)1()()1,2,,kiXkxikn2、构造紧邻均值生成序列(1)Z令(1)(1)(1)1()()(1)2zkxkxk,得(1)(1)(1)(1)((1),(2),,,())Zzzzn3、求最小二乘估计参数a和b若ˆ,Taab为参数序列,且(1)(1)(1)(2)1(3)1()1zzBzn,(1)(1)(1)(2)(3)()nxxYxn用最小二乘法求解1,()TTTnaabBBBY4、(1,1)GM模型的基本形式天津理工大学中环信息学院王武10将方程(1)(1)dxaxbdt离散化,微分变差分,得GM(1,1)灰微分方程(0)(1)()()xkazkb称为(1,1)GM模型的基本形式。称(1)(1)dxaxbdt为灰微分方程(0)(1)()()xkazkb的白化方程。5、白化微分方程求解(1)求得到微分方程的解也称为时间响应函数:(1)(1)()((0))atbbxtxeaa