1建模中几种基本预测方法(数模大全-数学建模的几种基本预测算法的探讨)1.1微分方程适用范围:传染病的预测模型、经济增长预测模型、正规战与游击战的预测模型、药物在体内的分布与排除预测模型、人口的预测模型、烟雾的扩散与消失预测模型以及相应的同类型的预测模型改进方法:常系数改进,增加控制系数,综合二者。优点:短、中、长期的预测都适合,既能反映内部规律,反映事物的内在关系,也能分析两个因素的相关关系,精度相应的比较高,另外对初等模型的改进也比较容易理解和实现。缺点:虽然反映的是内部规律,但是由于方程的建立是以局部规律的独立性假定为基础,故做中长期预测时,偏差有点大,而且微分方程的解比较难以得到。1.2时间序列(数模大全-时间序列模型)使用范围:数据具有以下特点时:(1)长期趋势变动。它是指时间序列朝着一定的方向持续上升或下降,或停留在某一水平上的倾向,它反映了客观事物的主要变化趋势。(2)季节变动。(3)循环变动。通常是指周期为一年以上,由非季节因素引起的涨落起伏波形相似的波动。(4)不规则变动。通常它分为突然变动和随机变动。建立方法有以下几种1)移动平均法:简单移动平均:近期预测,趋势变化不大加权移动平均:不同时期数据影响力不同时,近期预测,趋势变化不大趋势移动平均:存在直线上升下降时,做二次平均进行调整。使用于直线与周期趋势并存的2)指数平滑法一般说来历史数据对未来值的影响是随时间间隔的增长而递减的。所以,更切合实际的方法应是对各期观测值依时间顺序进行加权平均作为预测值。前者无法满足,指数可以。主意:加权系数选择,根据数据变化特性选择。1).一次指数平滑2).二次指数平滑(为了解决一次指数平滑中滞后问题)数据3).三次指数平滑:当数据量呈现曲线变动时3)差分指数平滑法克服了指数平滑法的数据滞后性4)自适应滤波法利用部分已知数据先分权后进行预测另外已知数据,然后对权系数进行修正,重复,最终得出较为合理的权系数对未知数进行预测。5)趋势外推预测方法理解为用matlab绘制模拟线然后利用已知函数对其进行归化。1.3灰色预测(数模大全-灰色系统理论及其应用)针对数据量较少,数据关系不清晰,GM(1,1)模型:一个变量,适用于较强指数变化规律GM(1,N)N各变量Verhulst模型,GM(2,1),DGM模型非单调摆动发展序列,饱和状态的S型序列1.4BP神经网络(数模大全-神经网络模型)熵值法分权:熵值法是一种客观赋权法,其根据各项指标观测值所提供的信息的大小来确定指标权重。算法实现过程:1.建立数据矩阵:111212122212.....................mmnnnmXXXXXXAXXX其中Xij为第i个方案第j个指标的数值2.数据的非负数化处理由于熵值法计算采用的是各个方案某一指标占同一指标值总和的比值,因此不存在量纲的影响,不需要进行标准化处理,若数据中有负数,就需要对数据进行非负化处理!此外,为了避免求熵值时对数的无意义,需要进行数据平移:对于越大越好的指标:12'1212min(X,X,...,X)1max(X,X,...,X)min(X,X,...,X)ijjjnjijjjnjjjnjXX对于越小越好的指标12'1212max(X,X,...,X)1max(X,X,...,X)min(X,X,...,X)jjnjijijjjnjjjnjXX为了方便起见,仍记非负化处理后的数据为Xij3.计算第j项指标下第i个方案占该指标的比重1(j1,2,...,m)ijijnijiXPX4.计算第j项指标的熵值1*log(P)njijijiekP其中k0,ln为自然对数,0ije。式中常数K与样本数m有关,一般令k=1lnm,则01e5计算第j项指标的差异系数对于第j项指标,指标值Xij的差异越大,对方案评价的作用越大,熵值就越小,指标为:1jjge则jg越大指标越重要。6.求权数1,1,2,...,jjjgjjgWjmg7.计算各方案的综合得分1*(i1,2,...,n)mijijjSWP3.熵值法的优缺点熵值法是根据各项指标指标值的变异程度来确定指标权数的,这是一种客观赋权法,避免了人为因素带来的偏差,但由于忽略了指标本身重要程度,有时确定的指标权数会与预期的结果相差甚远,同时熵值法不能减少评价指标的维数!分治算法:基本思想,在任何一个可以用计算机求解的问题所需的计算时间都与其规模N有关。问题的规模越小,就越容易直接求解,解题所需的计算时间也越少。当n较大时,问题就不容易解决了。分治算法的基本思想,是将一个规模为N的问题分解为K(1KN)个规模较小的子问题,这些子问题互相独立且与原问题性质相同,只要求出子问题的解,就可以得到原问题的解。基本步骤:(1)分解:把一个原问题分成两个或多个更小的问题;(2)解决:分别解决每个小问题;(3)合并:把各小问题的解答组合起来,即可得到原问题的解答。小问题通常与原问题相似,可以递归地使用分而治之策略来解决。显著性检验:事先对总体(随机变量)的参数或者总体分布形式作出一个假设,利用样本信息来判断这个假设(原假设)是否合理,即判断总体的真实情况与原假设是否存在显著差异。检验对象:1.是检验数据是否是属于母体内抽取的样本,即检验总体参数与样本统计量之间是否存在显著的差异;2.检验数据的统计量是否存在着显著的差异。目的:差异显著性检验就是要判定造成差异的原因,即差异是由于误差或偶然因素引起的或两者确实本身存在着差异。1).成组比较检验---t检验(小样本)我们将两个样本平均数1X和2X作比较,看1X-2X差数是否有显著的差异。随机变量X1和X2都是正态分布,则1X-2X也是正态分布,采用t检验法对两组样本的差异显著性进行检验。1212=XXXXtS式中1X,2X为两个样本算数平均数;12XXS为两个样本平均数差数的标准差。121222=XXXXSSSn2)U检验(大样本)3)方差分析----F检验法2122SFS烟羽模型:2222(x,y,z)exp222yzyzQyzXu原始模型为为无界空间连续点源扩散的高斯模型公式,然而在实际中,由于地面的存在,烟羽的扩散是有界的。根据假设可以把地面看做一镜面,对泄漏气体起全反射作用,并采用像源法处理,可以把任一点p处的浓度看做两部分的贡献之和:一部分是不存在地面时所造成的泄漏物浓度;一部分是由于地面反射作用增加的泄漏物浓度。该处的泄漏物浓度即相当于不存在地面时由位于(0,0,H)的实源和位于(0,0,-H)的像源在P点处所造成的泄漏物浓度之和。其中,实源的贡献为:))(21exp()21exp(2),,(22221zyzyHzyuQzyxX其中,像源的贡献为:))(21exp()21exp(2,,22222zyzyHzyuQzyxX)(则该处的实际浓度为:)()()(zyxXzyxXzyxX,,,,,,21由以上条件公式可得到高架连续点源扩散的高斯烟羽模型公式为:)])(21exp())(21[exp()21exp(2,,,,222222zzyzyHzHzyuQHtzyxX)(其中:X(x,y,z)为下风向x米、横向y米、地面上方z米处的扩散的气体浓度,单位为kg/m3;Q为源强(即源释放速率),单位为kg/s;u为平均风速,单位为m/s;y为水平扩散参数,单位为m;z为垂直扩散参数,单位为m;t为泄漏后是时间,单位为s;H为泄漏源有效高度,单位为m;y为横向距离,单位为m;z为垂直方向距离,单位为m。令z=0,即可得到地面气体浓度计算公式:2222exp21exp,0,,zyzyHyuQHyxX)()((11)令y=z=0,即可得到地面轴线气体浓度计算公式:)2exp(),0,0,(22zzyHuQHxX(12)其中,X(x,y,0)为下风向x米、横向y米处的地面扩散气体浓度,单位为kg/m3;若令y=0,则可以得到下风向中心线上的浓度分布。*泄漏源有效高度(烟云抬升高度的计算)有效源高:HHHS其中,sH为泄漏源几何架高,H为烟云抬升高度。实验表明,泄漏源抬升高度可以用下面公式近似计算:VdVHS/.42SV是气云释放速度,单位为m/s;d是泄漏出口直径,单位为m;V为环境风速,单位为m/s;*扩散系数的选取Pasquill的分类方法现代优化算法:1.蚁群算法Step1:0(NC)NC为迭代步数或搜索次数;各ij和ij的初始化;将m个蚂蚁置于n个顶点上。Step2:将各蚂蚁的初始出发点置于当前解集中;对每个蚂蚁k(k=1,2,…,m)按概率pijk转移至下一顶点j,将顶点j置于当前解集。Step3:计算各蚂蚁的目标函数值zk(k=1,2,…,m),记录当前的最好解。Step4:按更新方程修改轨迹强度。Step5:1NCNC,若NC预定的迭代次数且无退化行为(即找到的都是相同解),则转Step2.若为了简化计算,增加处理较大规模的TSP问题的能力,则将(4)式修改为:(t1)(t)(1)ijijij,(0,1)其中1,(i,j)0,kijijBEd其它此处BE为本次最优路线上的边集。