统计与决策2016年第18期·总第462期群决策论文名次的优化模型郭东威1,丁根宏1,毛俊诚1,陈玉磊2(1.河海大学理学院,南京211100;2.北京科技大学数理学院,北京100083)摘要:文章对评委打分、群决策的特点研究分析,发现在带有主观性且评分缺损系统中,由于不同评委打分习惯的差异,使得直接取均值法及T分数法的排名结果存在较大误差。为提高排名的准确性提出了论文交叉分配的数学模型,根据成对比较矩阵,利用最小平方和法确定了评委的权重。实验表明,新方法明显提高了论文排名的重合度,降低了乱序度。通过计算评委打分及论文得分的欧氏距离,证明了新方法中评委打分的误差度、论文的争议度都有明显降低。关键词:群决策;残缺评分矩阵;交叉分配;成对比较矩阵;最小平方和;权重中图分类号:O29文献标识码:A文章编号:1002-6487(2016)18-0080-03基金项目:中央高校基本科研业务费专项资金资助项目(B12020128)作者简介:郭东威(1987—),男,河南开封人,硕士研究生,研究方向:应用数学、优化与控制。丁根宏(1962—),男,江苏泰州人,副教授,研究方向:运筹学优化与控制。0引言在考生众多的论文型竞赛中,由于论文数量较多,评委较少,通常情况下是将每篇论文随机分配给某几位评委进行评阅。设xik表示第i个评委对第k篇论文的评分,则评委打分矩阵x=(xik)是有缺损的,由于评分矩阵的不完整性及评委打分习惯的不同,比如一些评委习惯打高分,而一些评委习惯打低分,一些评委打分方差较大,而一些评委打分方差较小等,就会使得最终排名结果与真实水平误差较大。为有效解决这些问题,国内外专家学者做了相关研究,提出了不少有效的方法,如T(或Z)分数法[1],填补残缺数据法[2,3],加权T分数法[4,5]等。但是,填补的方法一般适用于缺失率小并且数据之间有显著的相关性的情形,对于数据缺失率较高或数据之间没有显著相关性的情况,填补数据的方法就很难保障结果的准确性。由于每个评委所评阅的论文都不完全相同,甚至没有重复,因此每个评委评阅的论文总体水平有一定的差异,而T分数法缺乏对这种差异性的考虑。本文给出了一种论文充分交叉分配模型,将评分转化为T分数,应用最小平方和法求出各评委的权重,最后对T分数矩阵进行处理得出排名结果。通过100次模拟试验比较分析,证明本文方法更具科学性。1论文充分交叉分配的数学模型设某次竞赛共收到m份参赛论文,将参赛论文编号为1-m;设参加此次阅卷的评委有n位,评委编号分别为1-n。每份论文由随机的t(tn)位评委评阅打分。系统符号:(1)xik=1or0,xik=1表示第k篇论文由第i位评委评阅,否则xik=0;(2)ui、di分别表示第i位评委最多、最少评阅任务量;(3)Qij表示分给i,j两位评委论文的重合数量,Qij=åk=1m(xikÙxjk)。xikÙxjk=1or0,xik=xjk=1时,xikÙxjk=1,表示第k篇论文由i和j两个评委共同审阅,否则xikÙxjk=0。论文交叉分配的数学模型[6,7]目标函数min{z=(maxQij-minQij)}目标函数说明:使得任意两个评委所评阅论文交叉量的最大值与最小值之差(极差)的最大值最小,即保证评委所评阅的论文尽量交叉。约束条件s.t.ìíîïïïïïïïïïïïïdi£åk=1mxik£uiåi=1nxik=tQij=åk=1m(xikÙxjk)xik=0or1约束说明:(1)di£åk=1mxik£ui:第i号评委阅卷数量的限制。通过限制ui、di的大小,可以保证每个评委的工作量尽量均衡;(2)åi=1nxik=t:每份论文由t位评委评阅。2评委权重及排名的数学模型2.1常用排名方法简介常用排名方法有以下两种:传统方法和T分数法[4,5]。传统方法是指按照得分平均分排名的方法。方法应用DOI:10.13546/j.cnki.tjyjc.2016.18.021802016-09-2112:22:33统计与决策2016年第18期·总第462期T分数法是指先将分数按公式yik=σ´xik-xˉiσi+μ变为T分数,然后取T分数的平均值作为最终得分进行的排名。其中,xˉi是第i号评委阅卷打分的平均值,σi是第i号评委阅卷打分的标准差。通常可以取μ=70σ=10。2.2评委权重及排名的数学模型假设:(1)每位评委阅卷经验丰富、水平较高,即在没有错误判断情况下,各评委对某组论文评阅结果和该组论文的真实名次基本一致。(2)各评委都是无私、公正的,阅卷时没有感情因素,即对于两篇论文A和B,如果该评委认为A较B水平高,则有A得分高于B的得分。基于以上两点假设,事实上主观评分中评委权重的大小并不代表评委水平的高低,而是为了减小评委之间评分的系统误差。尤其是在残缺评分矩阵中,如果按照T分数法处理,是可以消除评委之间均分及方差不等的误差,但是考虑到每个评委所评阅的论文都不尽相同,所评阅论文的整体水平也存在差异,因此将每个评委的均分及方差都平移到同一值,是不太合理的。合理的做法是,先对原始评分进行T分数处理,再利用成对比较矩阵求出各评委的权重[8,9]进一步调整。具体求法如下:将分数按公式yik=σ´xik-xˉiσi+μ变成T分数yik,取μ=70σ=10。设aij=yˉji/yˉij,其中yˉji,yˉij分别表示评委i,j交叉论文的均分,比如评委i,j共同评阅了编号为k1k2kr的r份论文,则yˉji=1råt=1ryikt,yˉij=1råt=1ryjkt。因此矩阵A=(aij)n´n就表示评委均分成对比较矩阵[10,11]。对于评委i,j共同评阅的编号为k1k2kr的r份论文,从客观上来说,如果两个评委打分标准完全相同,则应该有yikt=yjkt(t=12r)成立,但是由于评委打分系统误差及随机误差的存在,上式往往不能完全成立。为解决这个问题,设评委i的评分权重为wi,则应该有yˉjiwi»yˉijwj,即aij=yˉji/yˉij»wj/wi。所以A=éëêêêêêêùûúúúúúúa11a12a1na21a22a2nan1an2ann»éëêêêêêêùûúúúúúúw1w1w2w1wnw1w1w2w2w2wnw2w1wnw2wnwnwn上式中的符号“»”表示左右两侧近似相等,因此一般aijwi-wj的值并不为零,但我们可以选择一组{}w1w2wn使其误差平方和最小,即:min{z=åi=1nåj=1n(aijwi-wj)2}为了保持评分的百分制,价值系数{}w1w2wn受约束于:åi=1nwi=nwi0(i=12n)评委i对论文k的最终评分为y′ik=yikwi,取论文k的平均分yˉ′k=1tåp=1ty′ipk作为其最终的得分。按-y′k(k=12m)排名就得到了该次竞赛的名次。3仿真试验及比较分析3.1成绩的生成相关文献资料[6,13-16]表明,在考生较多时,所有考生的成绩及每个评委的打分一般都服从偏态分布或正态分布。为了说明本文所提方法的有效性,做了100次仿真试验,试验中论文的真实(客观)成绩及各评委的打分都来自于正态总体[2,3,12],具体操作如下。由公式xk=60+8´randn(1n)随机产生一组论文的客观成绩,则该组论文(n篇)的成绩服从正态总体N(6082),由客观成绩可以得到各篇论文的客观(真实)名次。则样本均值xˉ=1nåk=1nxk,样本标准差σ=1n-1åk=1n(xk-xˉ)2。由公式xik=round(μi+σixk-xˉσ)随机生成第i号评委对第k篇论文的评分,并四舍五入取整,则评委i的打分服从正态分布N(μiσi)。μiσi的取值反应了评委i打分的特点。3.2检验排名结果好坏的指标按论文得分排名的名次称为主观名次[4,5]。显然主观名次与客观名次越一致越好,因此这里用文献[4-5]中定义的重合度和乱序度作为本文方法排名结果好坏的指标。重合度是指所有论文的主观名次与客观名次相同的个数;乱序度是指所有论文的主观名次与客观名次差的绝对值之和。因此,论文的排名结果能够使得重合度越高乱序度越小就越好。3.3评委打分及论文得分的欧氏距离某评委打分的总体误差情况和评委对某篇论文水平评价的一致性可以由欧氏距离来测量[4,5],即第i号评委打分的欧式距离为:Di=åk=1m(fik-fˉk)2×xik第k篇论文得分的欧式距离为:Hk=åi=1n(fik-fˉk)2×xik其中,fik是i号评委评给第k篇论文的打分,fˉk是第k篇论文的得分平均值;xik的含义与论文分配数学模型中的一致。Di的大小,反应了第i位评委评分误差度的大小;Hk的大小,反应了第k篇论文争议度的大小,Hk越大,说明评委对第k篇论文的水越不确定,争议越大。3.4具体试验及结果分析每次仿真试验的论文数n=40,参评评委数m=5,进行N=100次仿真试验,并将三种方法所得结果列表比方法应用81统计与决策2016年第18期·总第462期较,见表1所示。表1100次试验结果传统方法T分数法本文方法平均重合度4.519.8524.75最大重合度82932最小重合度11518平均乱序度187.533.3621.41最大乱序度2524432最小乱序度1281411从表1中的具体数据可以明显看出本文方法排名更准确。本文方法与T分数法相比较,100次试验中只有5次T分数法的重合度大于本文方法的重合度,并且只相差2。论文编号12345678910111213141516171819202122232425262728293031323334353637383940评委权重重合度乱序度分数182(1)73(2)77(1)74(3)72(1)73(1)77(1)66(2)75(1)56(2)72(1)71(1)69(1)71(2)74(1)82(3)60(2)77(1)74(1)66(2)73(1)73(1)58(2)73(1)76(3)62(2)70(1)65(2)68(1)76(1)75(1)82(3)68(2)63(2)74(2)73(1)71(1)77(1)73(1)72(1)分数285(2)65(4)93(3)47(4)65(2)66(2)91(3)80(3)64(4)66(3)79(3)63(2)59(2)86(3)84(3)58(4)44(4)68(4)70(2)80(3)82(3)55(4)68(3)66(2)49(4)74(3)61(2)52(4)66(3)74(2)71(2)57(4)82(3)50(4)90(3)67(2)50(4)93(3)80(3)64(2)评委1—5分数386(4)73(5)80(5)49(5)57(5)80(3)68(4)59(5)72(5)37(4)54(4)52(5)70(3)69(5)66(5)63(5)46(5)77(5)61(4)54(4)63(5)59(5)40(4)55(4)52(5)50(5)73(3)56(5)38(4)75(5)86(3)63(5)62(5)53(5)67(4)56(4)54(5)71(4)60(5)55(5)1.0314成绩_名次客观83.264_166.602_871.032_251.535_3456.251_2657.82_2168.787_557.777_2265.612_943.585_4057.169_2553.411_3147.384_3764.064_1162.256_1360.268_1449.331_3669.02_462.801_1257.607_2460.183_1557.904_2045.998_3857.715_2353.349_3252.166_3350.749_3555.732_2743.979_3967.714_764.160_1059.840_16