题目:基于Topsis、灰色预测和移动平均法的数学建模竞赛成绩的评价与预测问题的研究【摘要】近20年来,CUMCM的规模平均每年以20%以上的增长速度健康发展,是目前全国高校中规模最大的课外科技活动之一。本文对数学建模竞赛成绩的评价与预测问题进行了建模、求解和相关分析。对于问题一,已知某高校2006-2011年数学建模成绩,需要建立模型对该校数学建模工作开展情况进行合理的评价。首先将源数据获奖个数转换为获奖率确立统一公平的评判标准,由此就避免了每年参赛队数不同带来的影响。然后利用Topsis综合评价法建立评价模型,得出结果并对该校2006—2011年的建模工作开展情况作出评价,同时运用灰色预测的方法针对获奖率作时间轴上的分析,预测十二五期间该校数模竞赛成绩。对于问题二,需要对2007—2011年期间吉林省各高校的建模成绩进行合理的排序且预测十二五的建模成绩。排序模型采用线性加权法排序,先统计出吉林省各高校的获奖数,设定成绩指数=5*国家一等奖个数+4*国家二等奖个数3*省一等奖个数+2*省二等奖个数+省三等奖个数(该奖项没有出现的情况下默认为0个),求出各高校成绩指数后得出排序结果。成绩预测模型中,设定获奖率指数=3*省一等奖获奖率+2*省二等奖获奖率+省三等奖获奖率,分别采用灰色预测法、对数曲线拟合法、移动平均法进行建模分析,最后对比三种不同结果,确定了移动平均法是最佳方案,能够较为准确合理地预测成绩。对于问题三,需要对自数学建模竞赛活动开展以来全国各高校的建模成绩进行合理的排序,鉴于所给的建模成绩原始数据量非常冗杂庞大,故从中抽取2005年和2007—2010年的数据作为样本进行分析,求得本科组632所高校和专科组435所高校这五年中每年获得国家一等奖和国家二等奖的个数,然后根据第二问的设定线性加权得到成绩指数,从而对各高校建模成绩进行排名。对于问题四,选取国防科技大学、解放军信息工程大学、浙江大学、吉林大学、北京邮电大学等五所高校为例,充分利用第三问求得五所高校每年的成绩指数,运用移动平均法建立成绩预测模型,最终得出全国各院校十二五期间的建模成绩指数的预测值。对于问题五,除全国竞赛成绩、赛区成绩外,讨论了参赛人数、师资力量、学校的综合实力等因素对建模成绩评估的影响,并作出了预期中的评价方案和排序方案。最后对本文所建立的模型及使用的方法的优缺点进行了相关的讨论,并分析了在其他情况下的推广应用问题。关键词:Topsis灰色预测线性加权移动平均法建模成绩评价预测1111问题重述问题重述问题重述问题重述1.11.11.11.1问题背景问题背景问题背景问题背景数学建模竞赛(MathematicalContestinModeling,缩写为MCM)于1985年最先出现于美国,1989年我国大学生开始参加美国大学生数学建模竞赛,1990年10月中国工业与应用数学学会(CSIAM)成立,CSIAM下属的数学模型专业委员会开始考虑创办我国自己的大学生数学建模竞赛。1992年11月27日到29日由CSIAM数学模型专业委员会组织举办了“1992年全国大学生数学模型联赛”,10个城市79所院校的314个队参加,从此我国有了自己的大学生数学建模竞赛(ChinaUndergraduateMathematicalContestinModeling,缩写为CUMCM)。1993年12月教育部(前国家教委)高教司正式发文,要求在全国普通高校中陆续开展电子设计、数学建模、机械设计和结构设计竞赛,并且于1994年3月成立了由教育部高教司和CSIAM成员共同组成的第一届全国大学生数学建模竞赛组委会,于是从1994年开始,CUMCM成为教育部高教司和中国工业与应用数学学会共同主办、每年一届、面向全国高等院校学生的一项课外科技竞赛活动。在数学建模活动开展20周年之际,有必要对以往的数学建模工作进行总结及对未来的发展进行预测。1.21.21.21.2待解决的问题待解决的问题待解决的问题待解决的问题利用附件所给的数据,完成下列问题:(1)已知某高校2006-2011年数学建模成绩,建立合理的评价模型,对该校十一五期间数学建模工作进行评价,并对该校十二五期间的数学建模成绩进行预测;(2)建立适当模型对吉林省十一五期间各高校建模成绩的进行科学、合理的排序,并建立模型预测吉林省各高校十二五期间的建模成绩;(3)建立排序模型,给出全国各院校的自建模竞赛活动开展以来建模成绩的科学、合理的排序;(4)建立成绩预测模型,预测全国各高校十二五期间的建模成绩;(5)除全国竞赛成绩、赛区成绩外,要对建模成绩进行科学、合理地评价和预测,还需要考虑哪些因素?2222模型假设和符号系统模型假设和符号系统模型假设和符号系统模型假设和符号系统2.12.12.12.1模型假设模型假设模型假设模型假设针对本问题,建立以下合理假设:(1)题目提供的数据真实准确可靠;(2)假设每年的建模试题难度大致相同;(3)假设每年参加比赛的学生的学习力都差不多;(4)不考虑意外偶然或其它反常的情况;(5)设定成绩指数=5*国家一等奖个数+4*国家二等奖个数3*省一等奖个数+2*省二等奖个数+省三等奖个数(该奖项没有出现的情况下默认为0个);(6)设定获奖率指数=3*省一等奖获奖率+2*省二等奖获奖率+省三等奖获奖率。2.22.22.22.2符号系统符号系统符号系统符号系统符号定义n评价对象个数m评价指标个数Xij,Xij'评价指标ZTopsis中归一化矩阵Z+最优方案向量Z-最劣方案向量Di+,Di-评价对象与Z+和Z-的距离Ci与最优方案的接近程度3333问题一的建模与求解问题一的建模与求解问题一的建模与求解问题一的建模与求解3.13.13.13.1问题一的分析问题一的分析问题一的分析问题一的分析问题一中已知某高校2006-2011年数学建模成绩,需要建立模型对该校数学建模工作开展情况进行合理的评价,鉴于各年度参赛队数并不一致,单纯对获奖情况进行分析有失偏颇,为了确立一个公平合理的评判标准,首先对源数据进行建模前的预处理,求出各年度各奖项的获奖率,通过获奖率来评判就能够很好地反映该校数学建模的整体情况。然后利用Topsis综合评价法建立评价模型进行分析,得出该校2006—2011年的建模工作开展情况,同时运用灰色预测的方法来预测十二五期间该校数模竞赛成绩。3.23.23.23.2数据预处理数据预处理数据预处理数据预处理为了使评价指标更加合理,对该校建模工作的开展情况作出更为准确的评估,因此将原始数据表格中的各年度每个奖项的获得数除以当年参赛队数,得出各年度的获奖率,建立新的表格如下表3.2—1所示:表3.2—1某高校2006—2011年获奖率统计表年份国家一等奖国家二等奖省一等奖省二等奖省三等奖参赛队数200600.11110.11110.33330.277818200700.18180.18180.09090.18182220080.06670.20000.13330.23330.20003020090.03330.16670.16670.30000.233330201000.26670.16670.23330.200030201100.26670.23330.26670.133330求得获奖率后,就能排除各年度参赛队数不一致带来的影响,从而能够较好地反映当年该校学生数学建模的整体水平。3.33.33.33.3TTTTopsisopsisopsisopsis综合评价法的引入综合评价法的引入综合评价法的引入综合评价法的引入Topsis方法(Techniquefororderpreferencebysimilaritytoidealsolution)是有限方案多目标决策分析的一种常用方法,可用于效益评价、卫生决策和卫生事业管理等多个领域。本法对资料无特殊要求,使用灵活简便,应用广泛。本方法的基本思想是:基于归一化后的原始数据矩阵,采用余弦法找出有限方案中的最优方案和最劣方案(分别用最优向量和最劣向量表示),然后分别计算各评价对象与最优方案和最劣方案间的距离,获得各评价对象与最优方案的相对接近程度,以此作为评价优劣的依据。基本步骤:设有n个评价对象,m个评价指标,原有数据形式为:(1)指标属性趋同化处理可将低优指标和中性指标全转化为高优指标'ijx,方法是:'1ijijijijxxxMMxM⎧⎪⎪=⎨⎪⎡⎤+−⎪⎣⎦⎩高优指标低优指标中性指标(2)趋同化的数据归一化()()()()21'2'1ijnijiijijnijixxZxx==⎧⎪⎪⎪⎪=⎨⎪⎪⎪⎪⎩∑∑原高优指标原低优指标或中性指标由此得到归一化后的矩阵:111212122212mmnnnmzzzzzzZzzz⎡⎤⎢⎥⎢⎥=⎢⎥⎢⎥⎣⎦⋯⋯⋯⋯⋯⋯⋯(3)确定最优方案和最劣方案最优方案Z+由矩阵Z中每列中的最大值构成:()12max,max,,maxiiimZZZZ+=⋯最劣方案Z-由矩阵Z中每列中的最小值构成:()12min,min,,miniiimZZZZ−=⋯(4)计算每一个评价对象与Z+和Z-的距离D+i和D-i()21maxmiijijiDZZ+==−∑,()21minmiijijiDZZ−==−∑(5)计算各评价对象与最优方案的接近程度Ci,01,1,iiiiiiDCCCDD−+−=≤≤→+表明评价对象越优(6)按Ci大小排序,给出评价结果3.43.43.43.4评价模型的建立与求解评价模型的建立与求解评价模型的建立与求解评价模型的建立与求解如表3.2—1所示,运用Topsis方法将各项数据归一化,得出转换指标归一化的Z矩阵如下表3.4—1所示:表3.4—1转换指标值的Z矩阵年份国家一等奖国家二等奖省一等奖省二等奖省三等奖200600.21990.26700.53420.5422200700.35980.43690.14570.354920080.89440.39570.32040.37390.390420090.44720.32980.40050.48080.4555201000.52770.40050.37390.3904201100.52770.56070.42740.2603由表3.4—1可得出,最优方案Z+和最劣方案Z-分别为:()0.8944,0.5277,0.5607,0.5342,0.5442Z+=()0,0.2199,0.2670,0.1457,0.2603Z−=计算每一个评价对象与Z+和Z-的距离D+i和D-i,求出各评价对象与最优方案的接近程度Ci,按Ci大小排序,给出评价结果如下表3.4—2所示:表3.4—2D距离表和排序从表3.4—2中可以很明显地看到,该校2006—2011年每年数学建模工作的取得的成果,其中,2008年取得的成绩最优,2009年次之,2007年取得的成绩最差。在这六年中,前期成绩较差,中期成绩很好,到了后期大幅下滑后又有回升,建议该校应加大对学生数学建模活动的支持力度,鼓励学生积极参与。年份D+D-Ci排名20060.99050.48000.3264420071.01470.23960.1910620080.35200.95020.7297120090.52460.61670.5403220100.93510.42610.3131520110.94390.51020.350933.53.53.53.5成绩预测模型的建立与求解成绩预测模型的建立与求解成绩预测模型的建立与求解成绩预测模型的建立与求解如表3.2—1所示,可以看到该校2006—2011年每年各个奖项的获奖率,因而,分别针对每个奖项的获奖率作时间轴上的分析,利用灰色预测法求出其内在联系,从而对该校十二五期间数学建模的成绩作出较为准确的预测。下面以该校十二五期间省一等奖的获奖率预测为例进行分析说明,省一等奖获奖率的灰色预测MATLAB程序如下:clearsymsab;c=[ab]';A=[0.1111110.1818180.1333330.1666670.1666670.233333];B=cumsum(A);n=length(