数学建模竞赛成绩的评定摘要本文主要采用统计学方法,结合EXCELMATLAB、等数学统计工具解决了数学建模中成绩的评定等一系列问题。关于问题一,如何补缺缺失数据,我们将各个老师对数学建模队的评分视为随机事件,算出各分数发生的概率,最后用其数学期望代替缺失的分数,得出结果为:9号队缺失的分数是77;25号队缺失的分数是80;58号队缺失的分数是80。关于问题二,考虑到各个老师的打分方式有异,根据加权平均分给出了101个队列的排名,结果详见表5.2.1。关于问题三,利用统计学方法,通过比较每位老师评分的方差大小,得出各老师打分严格程度的差异,最后得出老师甲最严格,老师丙最宽松,其余三位老师的严格程度相差不大。关于问题四,先将参加队的平均分数从大到小排序,然后其中有48个队参加复评。关键词:成绩评定成绩排名数学期望统计学MATLAB加权平均一、问题重述在某高校一次数学建模竞赛中,5位评阅老师分别独立地为101个参赛队打分,最终依据某种方式对各参赛队进行排序、确定所获的奖项。(见附表),请你运用数学建模方法解决下列问题:(1)补齐表中缺失的数据。(2)给出101个参赛队的排名顺序。(3)建立模型对5位老师进行分类,评价5位老师中哪位老师打分比较严格,哪位老师打分比较宽松(4)通常还会对一部分平均分在80分以上的参赛队进行复评,你认为应该对哪些队进行复评?二、问题分析此问题是关于五位老师对101个参加队进行评分的问题。根据问题要求首先我们采用数学的方法对该题进行分析,补全附表中缺失的三个分数。再根据已补全的数据排列出参赛队的排名。然后确定哪位老师打分比较严格,哪位打分比较松,并给出可以给予复评机会的参赛队的序号。三、问题假设1、假设所有老师的评分都是客观、公平公正的。2、假设所提供的数据都是真实可靠的。3、假设参赛队是否有复评机会对其所打的分有关和其他因素无关。四、变量说明E老师甲对101个参赛队打分的数学期望F老师乙对101个参赛队打分的数学期望G老师丙对101个参赛队打分的数学期望0五位老师对101个参赛队打分的平均值向量r五位老师打分的权重向量ix参赛队ix的加权平均分jDX第j位老师对101个参赛队打分的方差ixn某位老师打的分数为ix的频数五、模型的建立与求解5.1问题一5.1.1问题分析该问题要求我们根据已有的数据,利用数学知识分析并补全缺失的数据。显然均值替换法,热卡填充法等都可以解决问题,但是综合分析一下,该问题属于统计类问题,所以我们最终选择应用统计学的方法,给出的评分最合理的替代应为这个老师给所有参赛队打分的数学期望。5.1.2模型的建立根据数学统计的方法,我们将一位老师的评分视为自变量x,其发生的概率为()px。由于样本空间够大,所以其发生的频率可近似视为其发生的概率。即:()(),1,2,,101;101ixiinpxfxiNNL而其数学期望为所有自变量的取值与其发生概率的乘积的和,即:(),1,2,,101iiEXxpxiL由此算出的数学期望的值即为此老师所缺评的分数的替代。5.1.3模型的求解按上述方法,代入数据后得出老师甲的评分分布表(表5.1.1)与其散点图(图1.1.1):02040608010012050556065707580859095100图5.1.1老师甲对参赛队的评分分布图分数频数频率分数频数1频率5110.017620.025310.017840.045520.027910.015610.018010.015820.028140.045920.028220.026040.048310.016130.038430.036210.018530.036370.078660.066420.028720.026530.038840.046610.019050.056720.029120.026830.039240.046920.029340.047020.029450.057120.029710.017420.029810.017520.02表5.1.1老师甲对参赛队评分的统计表再将表5.1.1中数据代入期望公式即可求出甲老师对101个参赛队打分的数学期望:1EX=76.55≈77,同样的方法我们可依次求出第二位老师对参赛队打分的数学期望:2EX=79.83≈80,第三位老师对参赛队打分的数学期望:3EX=80.09≈80,由此我们即可确定9号参赛队缺失的分数是77,25号参赛队缺失的分数是80,58号参赛队缺失的分数是80。5.2问题二5.2.1问题分析该问题要求我们根据已补全的数据对参赛队按分数的高低进行排序。可以将五位老师对各个参赛队的评分相加得总分,然后求其平均分再根据所得平均分的高低进行排序;也可以考虑到有些老师可能因为主观原因对参赛队打得分偏高或者偏低,因此可以选用对每个参赛队采取去除最高分和最低分之后再对其求平均分的方法,这样相对直接求平均分更具有公平性。但是考虑每位老师的评分标准、方式不同,所以我们选择先根据所有数据算出五个老师各个评分的权重,然后将参赛队的分数加权平均后排序,即得录取顺序。5.2.2模型建立首先根据算出五个老师所打分的平均值向量012345[,,,,]wbbbbb,其计算公式为:,1,2,,5;1,2,,101;101ijijxbjiNNLL归一化后得五个老师打分的权重向量112345[,,,,]wccccc,其计算公式为:,1,2,,5jjjbcjbL参赛队ix的加权平均分为:1,5mijjjixcxmm而后根据由此得到的分数排序。5.2.3模型求解(1)在EXCEL中根据各位老师对每个参赛队的打分计算出每位老师评分的平均值向量0w0[76.55446,79.86139,80.08911,79.26733,79,9802]w(2)据此用MATLAB软件计算每个老师对参赛队评分的权重向量为[0.1934,0.2018,0.2024,0.2003,0.2021]r(3)将上述数据代入公式后得参赛队的排名为下表(表5.2.1):排名得分序号排名得分序号117.8352395215.893788217.7467195315.876581317.5952515415.837831417.5629475515.834435517.530555615.825858617.20545715.780430717.1793665815.740478817.1604405915.734356917.1466876015.7216731017.0453916115.7011241117.0315646215.6997421217.0304696315.6364371316.95751006415.585631416.8686186515.5805481516.8656866615.5495341616.8299166715.5141991716.8283536815.491551816.7967826915.4226751916.7955227015.3718252016.7939777115.3089172116.757457215.297822216.7468977315.2589462316.71081017415.2211892416.5112987515.2201742516.5062157615.1593942616.4838497715.0604272716.4607147814.9049542816.4518847914.8985282916.4348118014.8868963016.3473438114.8706603116.3409728214.799773216.3063508314.7987933316.3058798414.7809653416.2652768514.7525623516.2457638614.709523616.2274678714.703203716.1634128814.7001923816.160888914.6833263916.1561299014.6083234016.1007109114.4615684116.0982389214.46854216.0877959314.4334904316.041999414.4274574416.0384329514.4266134516.0319719614.3792214616.018619714.345664716.0111709814.2174834815.9922339913.9759614915.96238010013.8094445015.95083610113.2742595115.939415.3问题三5.3.1问题分析该问题要求我们对五位老师给各个参赛队的所有评分进行分析比较,给出哪位老师的打分比较严格,哪位老师打分比较宽松。易知,对于不同的参赛队,打分严格的老师对优劣比较分明,于是打出的分数也会波动比较大;反之,打分宽松的老师则给予参赛队的分数波动较小。而波动程度大小的比较可以通过分别统计高、低分段的人数来观察出,高、低分段人数都多的则打分严格,只有高分段或低分段人数多或者高、低分段人数都较少的则打分宽松。但考虑到这样做的误差可能比较大。所以又采取计算其样本方差,通过其值比较大小来验证上面所得结论(方差越大,波动程度越大)。5.3.2模型的建立(1)由于所有的评分都处于[50,100]之内,所以,我们可以取[50,60]为低分段,[90,100]为高分段。(2)设X是一个随机变量,若2[()]EXEX存在,则称2[()]EXEX为X的方差,记为()DXVarX或。即2[()]DXEXEX称为方差,即用来衡量一组数据的离散程度的统计量。方差刻画了随机变量的取值对于其数学期望的离散程度。(方差越大,离散程度越大;反之则越小)若X的取值比较集中,则方差DX较小;若X的取值比较分散,则方差DX较大。因此,DX是刻画X取值分散程度的一个量,它是衡量X取值分散程度的一个尺度。换而言之,方差就是和中心偏离的程度。用来衡量一批数据的波动大小(即这批数据偏离平均数的大小)并把它叫做这组数据的方差,记作DX。在样本容量相同的情况下,方差越大,说明数据的波动越大,越不稳定。方差的值的计算公式:101;5,...,2,1;101,...,1,)(12jNjixxNDXijij其中:,101ijijxxNN5.3.3模型求解02040608010012050556065707580859095100图5.3.1老师甲对参赛队的评分分布图020406080100120556065707580859095100图5.3.2老师乙对参赛队的评分分布图020406080100120556065707580859095100图5.3.5老师戊对参赛队的评分分布图根据上面的图3.1~图3.5得出各老师给出的评分的高、低分段的分布表如下表(5.3.1):老师甲老师乙老师丙老师丁老师戊50~6013404490~1002226262425表5.3.1由表5.3.1得出打分最严格的是老师甲,最宽松的是老师丙,老师乙、老师丁、老师戊打分方式相对老师甲、老师丙而言较为居中。但是在理论上这样的结论说服力不够,所以再将数据代入方差的值的计算方程,得出结果如下表(表5.3.1):老师甲老师乙老师丙老师丁老师戊DX163.1495130.5806115.622131.1178118.7596由表5.3.2中数据看出,老师甲给出的评分的方差最大,老师丙给出的评分的方差最小,而老师乙、老师丁和老师戊给出的评分的方差则居前两者之间。所以得出结论如下:老师甲打分比较严格,老师丙打分比较宽松。5.4问题四5.4.1问题分析该问题要求根据已知的数据和前几问的结果,确定哪些参赛队应该给予复评的机会。显然这是关于数学建模竞赛时选取哪些参赛队参加复试的问题,根据平均分的排名,起初,我们确定出了49个参赛队得到复评机会。但是考虑到参赛队的能力不同,需要着