数学建模思想方法大全及方法适用范围

waterwww
0 ℃
2020-08-01

整理文档很辛苦，赏杯茶钱您下走！

还剩 ... 页未读，继续阅读 >>

免费阅读已结束，点击下载阅读编辑剩下 ... 页

阅读已结束，您可以下载文档离线阅读编辑

资源描述

《数学建模思想方法大全及方法适用范围》主讲人：厚积薄发（冰强，BruceJan）数学中国社区-专业的数学建模网站第一篇：方法适用范围3?'m&m)_0n*p.Q5l一、统计学方法*t(u*Q0B4R1.1多元回归1、方法概述：在研究变量之间的相互影响关系模型时候，用到这类方法，具体地说：其可以定量地描h7W5述某一现象和某些因素之间的函数关系，将各变量的已知值带入回归方程可以求出因变量的估计值，从而可以进行预测等相关研究。3j8N6J-?(T2、分类7F#C;q%k9N(t4M8|;M分为两类：多元线性回归和非线性线性回归；其中非线性回归可以通过一定的变化转%@(^-化为线性回归，比如：y=lnx可以转化为y=uu=lnx来解决；所以这里主要说明多元线性(M1L'回归应该注意的问题。3、注意事项在做回归的时候，一定要注意两件事：（1）回归方程的显著性检验（可以通过sas和spss来解决）（2）回归系数的显著性检验（可以通过sas和spss来解决）3u4F:i.dT7a0]9E*f(U,@2j0w检验是很多学生在建模中不注意的地方，好的检验结果可以体现出你模型的优劣，是完整论文的体现，所以这点大家一定要注意。$b-~.l)p#F+o'\)fu4、使用步骤：.i:L!U6W!v8w5g（1）根据已知条件的数据，通过预处理得出图像的大致趋势或者数据之间的大致关系；（2）选取适当的回归方程；（3）拟合回归参数；（4）回归方程显著性检验及回归系数显著性检验7n/C+u#y-q（5）进行后继研究（如：预测等）4M7j2W%T'\$a9a1.2聚类分析1、方法概述:F'e5r%V5S,S0T!s该方法说的通俗一点就是，将n个样本，通过适当的方法（选取方法很多，大家可以自行查找，可以在数据挖掘类的书籍中查找到，这里不再阐述）选取m聚类中心，通过研究-各样本和各个聚类中心的距离Xij，选择适当的聚类标准，通常利用最小距离法（一个样本归于一个类也就意味着，该样本距离该类对应的中心距离最近）来聚类，从而可以得到聚类.结果，如果利用sas软件或者spss软件来做聚类分析，就可以得到相应的动态聚类图。这种模型的的特点是直观，容易理解。$u%\+f0F'x&u9R+x)s%T2、分类!n*i.a;?!T;y3B聚类有两种类型：（1）Q型聚类：即对样本聚类；/q/e^0s7r3C.a*M2\（2）R型聚类：即对变量聚类；'U)w+Q0D*J6N&y'H通常聚类中衡量标准的选取有两种：9W9|8m0q$Y（1）相似系数法-e(pf'^!f0B;|)~（2）距离法聚类方法：*D)v*s-e:V&m（1）最短距离法1l(R!Z!H9_*y（2）最长距离法（3）中间距离法&i*T8zX)b.e9p（4）重心法7T(`2DJ!B)p&?（5）类平均法（6）可变类平均法7T$S-X:G(r/v'm（7）可变法B&M'jl%qW;P（8）利差平均和法在具体做题中，适当选区方法；3、注意事项+V%T;?!_)U3R:X0h在样本量比较大时，要得到聚类结果就显得不是很容易，这时需要根据背景知识和相关(G的其他方法辅助处理。4、方法步骤（1）首先把每个样本自成一类；（2）选取适当的衡量标准，得到衡量矩阵，比如说：距离矩阵或相似性矩阵，找到矩/G!A.]i!?'G.pk阵中最小的元素，将该元素对应的两个类归为一类，9T!K.F-vZ&M-n（3）重新计算类间距离，得到衡量矩阵（4）重复第2步，直到只剩下一个类；补充：聚类分析是一种无监督的分类，下面将介绍有监督的分类。1.3数据分类.K5Cz&m2F*V?3n!x)a1、方法概述数据分类是一种典型的有监督的机器学习方法，其目的是从一组已知类别的数据中发现0r3v,分类模型，以预测新数据的未知类别。这里需要说明的是：预测和分类是有区别的，预测是对数据的预测，而分类是类别的预测。2、分类方法：&{3]#k0C7y'G:L0|.L&H8{（1）神经网路7V)z3L2[$l:G7t.r5{（2）决策树（这里不再阐述，有兴趣的同学，可以参考数据挖掘和数据仓库相关书籍）3、注意事项神经网路适用于下列情况的分类：（1）数据量比较小，缺少足够的样本建立数学模型；1g9}+o3\!E+`#a（2）数据的结构难以用传统的统计方法来描述（3）分类模型难以表示为传统的统计模型神经网路的优点：分类准确度高，并行分布处理能力强，对噪声数据有较强的鲁棒性和容错能力，能#s$h-s$s.d+U&|#Q,Z够充分逼近复杂的非线性关系，具备联想记忆的功能等。神经网路缺点：需要大量的参数，不能观察中间学习过程，输出结果较难解释，会影响到结果的可'E'Li7Y(r7Y5H0K$G(}信度，需要较长的学习时间，当数据量较大的时候，学习速度会制约其应用。4、步骤（1）初始化全系数（2）输入训练样本;W#u9C#X+`1]-V(k+w（3）计算实际输出值（4）计算实际输出值和期望输出值之间的误差)i2I0r1?!{#G3S（5）用误差去修改权系数3r+U6G3M%X$Kk(b3l.{7L（6）判断是否满足终止条件，如果满足终止，否则进入第二步'j3\*F!Q*K5f5X!O$U1y#q1.4判别分析1、概述1{'p*N1L#O6H9T7[7?其是基于已知类别的训练样本，对未知类别的样本判别的一种统计方法，也是一种有监0d1v3N6P7X督的学习方法，是分类的一个子方法！具体是：在研究已经过分类的样本基础上，根据某些判别分析方法建立判别式，然后对未知分类的样本进行分类！2、分类*D!o:G(N6o,\3`5m根据判别分析方法的不同，可分为下面几类：$D0I*E$j/H%[（1）距离判别法（2）Fisher判别法（3）Bayes判别法,U(m)P3e$M.X.S+bX（4）逐步判别法关于这几类的方法的介绍，大家可以参考《多元统计学》，其中比较常用的是bayes判2R$R/别法和逐步判别法3、注意事项：判别分析主要针对的是有监督学习的分类问题。共有四种方法，这里重点注意其优缺点：0`7（1）距离判别方法简单容易理解，但是它将总体等概率看待，没有差异性；2H-A;V/}&K#g（2）Bayes判别法有效地解决了距离判别法的不足，即：其考虑了先验概率——所以通常这种方法在实际中应用比较多！（3）在进行判别分析之前，应首先检验各类均值是不是有差异（因为判别分析要求给定的样本数据必须有明显的差异），如果检验后某两个总体的差异不明显，应将这两个总体合为一个总体，再由剩下的互不相同的总体重现建立判别分析函数。（4）这里说明下Fisher判别法和bayes判别法的使用要求：两者对总体的数据的分布要求不同，具体的，Fishe要求对数据分布没有特殊要求，而bayes则要求数据分布是多元正态分布，但实际中却没有这么严格！（5）可以利用spss，sas等软件来轻松实现4、方法步骤这里以bayes判别法为例讲述（1）计算各类中变量的均值xj及均值向量xh，各变量的总均值xi及均值向量x(H:^:on-\*）（）2）计算类内协方差及其逆矩阵（3）计算bayes判别函数中，各个变量的系数及常数项并写出判别函数#?9g-](b$o-r6l1U#g3V（4）计算类内协方差矩阵及各总协方差矩阵做多个变量的全体判别效果的检验%s0k.y5r1b!_:k&g5）做各个变量的判别能力检验7B([8_&v9e:c#e/X（6）判别样本应属于的类别)|-L6S7Po.q4i1^^1.5主成分分析1、概述&T6X.S2l;U$b!{;o:Z,o主成分分析是一种降维数的数学方法，具体就是，通过降维技术奖多个变量化为少数几个主成分的统计分析方法。在建模中，主要用于降维，系统评估，回归分析，加权分析等等。J1Y$D;C&e8W+q$e;T9B&l2、分类（无）3、注意事项5i/R$s!b-b&d在应用主成分分析时候，应该注意：8V3d:U%R._J,|.}7^（1）综合指标彼此独立或者不想关（2）每个综合指标所反映的各个样本的总信息量等于对应特征向量的特征值。通常要选取的综合指标的特征值贡献率之和应为80%以上（3）其在应用上侧重于信息贡献影响力的综合评价6h[2^3L&c（4）当主成分因子负荷的符号有正也有负的时候，综合评价的函数意义就不明确！4、方法步骤-y;L0b+@&Y4l大家可以参考《多元统计学》这本书籍，在这里就不做阐述/`:{$O7ly5c0T7Z%L$t1.6因子分析*u3W3P.b(j0L3t8~1、概述%U*M'?Y7p7r:i&q其是也是将变量总和为数量较少的几个因子，是降维的一种数学技术！它和主成分分析,`)u&的最大区别是：其是一种探索性分析方法，即：通过用最少个数的几个不可观察的变量来说(v!k(I1];O(D6t,F明出现在可观察变量中的相关模型（有点类似于前面讲述的分类和聚类的区别）9j3m'q2L7q3]提供了一种有效的利用数学模型来解释事物之间的关系，体现出数据挖掘的一点精神！他可以用来解决降维，系统评估，加权分析等方法。2、分类因子分析是R型，即对变量研究?*u.L,n4Q$q$yd-R!^3、注意事项(c9r9J;fE3f&B.f1\|（1）其不是对研究总体的变量的降维，而是根据原始变量信息构造新的变量，作为共L5w:e&F9a同因子)yP!t)_3gO0q#l:v/X（2）它通过旋转可以使得因子变量具有可解释性&R/i+t4K,`5v9Y,w8l'I3I（3）因子分析和主成分分析的区别和联系1两者都是降维数学技术，前者是后者的推广和发展&O1U2`%@9Z,\5o6~4S2主成分分析只是一般的变量替换，其始终是基于原始变量研究数据的模型'a!Y+e$V+R#h,I规律；而因子分析则是通过挖掘出新的少数变量，来研究的一种方法，有点像数据挖掘中的关联关则发现！6j$O4n1['w-@*q4、方法步骤（略）大家可以去论坛上下载相关电子资源，也可以参考《多元统计学》(j2u'^8l)`,[1.7残差分析4^0X/Z3n8f#{F2u9L5];b1、概述在实际问题中，由于观察人员的粗心或偶然因素的干扰。常会使我们所得到的数据不完C7p;全可靠,即出现异常数据。有时即使通过相关系数或F检验证实回归方程可靠，也不能排除数据存在上述问题。残差分析的目的就在于解决这一问题。所谓残差是指实际观察值与回归估计值的差。2、分类无3、应用（1）通过残差分析来排除异常数据（2）通过残差分析来检验模型的可靠性5a$R&F9[-}#c7Ki还有很多应用，大家在使用过程中据情况选取，灵活应用！&f$mz2s2MR:`#h;_-D&d0e&e1．8典型相关分析1、概述前面介绍的方法主要是一个变量和多个变量之间的关系，而典型相关分析研究的是多个1M变量和多个变量之间的关系，或者是一组变量和一组变量之间关系！其可以揭示两组变量之间的关系，从而供大家研究两个现象之间的关系，例如：蔬菜的产出水平和影响产出水平的:变量之间的关系！5D0l!X(l-|$V;w2、分类&h8h%a(a,A5K3M#t6q多对多的变量关系研究！3、注意事项（1）其可以很好地解决组合相关性的问题(C/M+\8D'O（2）其还局限于两组变量的研究，而且要求这两组变量都是连续变量且需服从多元正S+E&gy7}5态分布1.9时间序列1、概述7o6@'}7x'n'I时间序列预测法是一种定量分析方法，它是在时间序列变量分析的基础上，运用一定的数学方法建立预测模型，使时间趋势向外延伸，从而预测未来市场的发展变化趋势，确定变量预测值。其基本特点是：假定事物的过去趋势会延伸到未来；预测所依据的数据具有不规则性；撇开市场发展之间的因果关系。9_;V3L#L.M4X2、分类%|4[4{/_;~0@&u时间序列的变动形态一般分为四种：长期趋势变动，季节变动，循环变动，不规则变动。9u7n*]K8?7]&Y#C;方法分类：)k#W5O$q5V*V+ej（1）平均数预测（简单算术平均法，加权算术平均法，几何平均数法）.?Li$C#x