1高校硕士研究生招生指标分配问题第十八组张飞鹏张振宇王华彬摘要高等学校研究生招生指标的分配问题,对研究生的培养质量、学科建设和研究成果的取得由很大影响,本文主要针对高校硕士研究生招生指标分配的问题运用数学建模的方法进行研究,并得到了一系列的研究结论。对于问题一,考虑到教师数量和教师岗位主要决定指标分配,同时不同学科之间的岗位等级划分对指标的决定程度不同,我们将所缺少的十个岗位数据对应到所在的学科,利用Fisher判别分析的方法得到了缺少的的统计数据依次为6、7、7、4、3、2、6、5、7等,并通过得到的对应关系去检验已知岗位等级的准确率,依次为92.1%、92.1%、100%、80%、100%、94.1%、93.8%、84.7%、84.7%。对于问题二,由于历年硕士研究生名额都是以导师岗位级别进行分配,其中影响岗位等级的因素有招生人数、科研经费等,因此可以通过Matlab作曲线图、直方图,直观的看出和分析各因素在不同年份的数值与各岗位级别之间的统计规律。岗位等级越高,发表的中英文论文数、申请专利数等越多。同时我们结合相关统计规律的知识对得出的统计规律进行解释和分析,并结合当今的实际情况加以验证,足见统计规律的客观合理性。对于问题三,我们首先进行灰色预测,得到了2012年的招生人数为746人。基于问题一和问题二的分析结果,参考相关文献进行权重分配,用Excel法统计各因素对各岗位级别招生人数影响以百分制表示的,通过将因素权重与岗位级别权重加成,对研究生指标分配按加成权重对2012年的名额预分配。对于问题四,要考虑学科的特点和学科的发展,本文主要令学科的特点体现为学科类型,学科主要分成学科重点学科,国家培育学科,省部级学科,一般学科。而学科的发展主要体现学科的报考情况、培养情况以及政策情况,再结合第二问的导师岗位级别和科研情况。就得出指标分配的调整方案中主要参考的六种影响因素,并参考文献[1]的第2,3页的层次分析法,得出六种影响因素的权重。最后对以上六种情况的具体参考因素,绘制相关层次结果图,进行参数假设,进行相关的参数计算得出具体的指标参数模型。应用于具体高校时,假设的参数都有具体数据作支撑,即可得出具体的分配方案。对于问题五,实现分配方案更加合理化,问题三、四主要考虑了硬性指标上的分配因素,而道德素质等综合因素在实际分配中也应占有一定比重,应纳入考虑之列,参考文献[3]对这些因素进行分析,绘制表格,统筹分析所有主要因素;同时,结合现代的国家政策以及未来发展需要,对招生类型调整提出方案,以提高方案对时代的适应性;最后,考虑到合理分配研究生名额需协调分析的因素非常多、数据复杂,如果直接应用,会导致实用性差的情况,所以需提出一种方案,能够简化其计算过程,使得模型实用性和有效性都得到保证。关键词:研究生名额分配相关性分析Fisher判别分析AHP层次分析法2一问题重述高等学校研究生招生指标分配问题,对研究生的培养质量、学科建设和科研成果的取得有直接影响。特别是2011年研究生招生改革方案中,将硕士研究生招生指标划分为学术型和专业型两类。这一改革方案的实施,给研究生教育的发展带来发展机遇的同时,也给研究生招生指标分配的优化配置提出了新的思考。附件的数据是某高校2007-2011年硕士研究生招生实际情况。研究生招生指标分配主要根据指导教师的数量以及教师岗位进行分配。其中教师岗位分为七个岗位等级(一级岗位为教师的最高级,七级岗为具备硕士招生资格的最低级)。另外数据表还列出了各位教师的学科方向,2007-2011年的招生数,科研经费,发表中、英文论文数,专利数,获奖数,获得校、省优秀论文奖数量等信息。请你参考有关文献、利用附件的数据建立数学模型,并解决下列问题。1.由于统计数据的缺失,第18、103、110、123、150、168、274、324、335、352位教师的数据不完整,请你用数学模型的方法将这些缺失的数据补充完整。2.以前的硕士研究生名额分配方案主要参考导师岗位级别进行分配。请你以岗位级别为指标,分析每个岗位的招生人数、科研经费、发表中英文论文数、申请专利数、获奖数、获得优秀论文数量的统计规律,并给出合理的解释。3.根据第二问的结论,提出更加合理的研究生名额分配方案,使得新方案既兼顾到岗位又能兼顾到其他因素,例如研究生的招生类型等,并要求用此方案对2012年的名额进行预分配。4.如果在研究生招生指标分配当中,考虑到学科的特点和学科发展的需要,进行差异分配,请你设计调整方案,并用你的方案给出2012年的调整方案。5.如果想把分配方案做得更加合理,你认为还需要哪些指标数据,用什么方法可以完成你的方案?请阐述你的思想。二问题假设1.假设国家政策无重大变化。2.假设已给数据中无重报和误报。3.假设该校无重大录取制度变化,报考生源稳定4.假设表格中(除岗位信息外)其余缺失的信息只均为零。5.假设2007年至2011年招生人数能够由指导教师的数量以及教师岗位决定,其他因素的影响可忽略。三符号说明:iC第i个二级指标的得分:ikC第k个招生学科各二级指标得分:各招生学科在整个招生单位内的相对重要程度kb:各招生学科招生得分a:灰色预测发展系数b:灰色预测灰作用量:矩阵特征根:分配权重:CI一致性指标ka3:RI随机一致性指标:CR一致性比率四问题分析对于问题一,教师数量和教师岗位主要决定指标分配。根据附件的数据信息,可以通过统计分析中的Fisher判别分析对教师数量、教师岗位及分配数量之间的关系分析对数据进行的补充。对于问题二,由于历年硕士研究生名额都是以导师岗位级别进行分配,由影响分配的有招生人数、科研经费等因素,因此可以通过Matlab作曲线图、直方图,直观的看出和分析各因素在不同年份的数值与各岗位级别之间的统计规律,并结合相关统计规律的知识对得出的统计规律进行解释和分析,并结合当今的实际情况加以验证。对于问题三,先通过2007-2011的硕士研究生的招生人数进行灰色预测2012的招生人数,兼顾各项因素,参考相关文献进行权重分配,用Excel法统计各因素对各岗位级别招生人数影响以百分制表示的,通过将因素权重与岗位级别权重加成,对研究生指标分配按加成权重对2012年的名额预分配。对于问题四,要考虑学科的特点和学科的发展,本文主要令学科的特点体现为学科类型,学科主要分成学科重点学科,国家培育学科,省部级学科,一般学科。而学科的发展主要体现学科的报考情况、培养情况以及政策情况,再结合第2问的导师岗位级别和科研情况。就得出指标分配的调整方案中主要参考的六种影响因素,并参考文献[1]的第2,3页的层次分析法,得出六种影响因素的权重。最后对以上六种情况的具体参考因素,绘制相关层次结果图,进行参数假设,进行相关的参数计算得出具体的指标参数模型。应用于具体高校时,假设的参数都有具体数据作支撑,即可得出具体的分配方案。对于问题五,实现分配方案更加合理化,问题三、四主要考虑了硬性指标上的分配因素,而道德素质等综合因素在实际分配中也应占有一定比重,应纳入考虑之列,参考文献[3]对这些因素进行分析,绘制表格,统筹分析所有主要因素;同时,结合现代的国家政策以及未来发展需要,对招生类型调整提出方案,以提高方案对时代的适应性;最后,考虑到合理分配研究生名额需协调分析的因素非常多、数据复杂,如果直接应用,会导致实用性差的情况,所以需提出一种方案,能够简化其计算过程,使得模型实用性和有效性都得到保证。五模型的建立及求解5.1缺失数据的补充教师数量和教师岗位主要决定研究生名额指标的分配。根据附件所给的数据信息,可以通过统计分析中的判别分析(Fisher判别分析)对教师数量、教师岗位及分配数量之间的关系进行分析,从而对缺失的岗位数据信息进行补充。5.1.1判别分析的原理判别分析是根据所研究的个体的观测指标来推断该个体所属类型的一种统计方法,在自然科学和社会科学的研究中经常会碰到这种统计问题。例如,在地质找矿中我们要根据某异常点的地质结构、化探和物探的各项指标来判断该异常点属于哪一种矿化类型;医生要根据某人的各项化验指标的结果来判断该人属于什么病症;调查了某地区的土地生产率、劳动生产率、人均收入、费用水平、农村工业比重等指标,来确定该地区属于哪一种经济类型地区等等。4判别问题用统计的语言来表达,就是已有q个总体12,,,,qXXX它们的分布函数分别为12,,,,qFxFxFx每个iFx都是p维函数.对于给定的样本X,要判断它来自哪一个总体.当然,应该要求判别准则在某种意义下是最优的,例如错判的概率最小或错判的损失最小等。Fisher判别的基本思想是投影,即将表面上不易分类的数据通过投影到某个方面上,使得投影类与类之间得以分离的一种判别方法。仅考虑两个总体的情况,设两个p维总体为12,,XX且都有二阶矩存在。Fisher的判别思想是变换多元观测x到一元观测y,使得由总体12,,XX产生的y尽可能的分离开来。设在p维的情况下,x的线性组合Tyax,其中a为p维实向量。设12,,XX的均值向量分别为12,(均为p维),且有公共的协方差矩阵0。那么线性组合的Tyax均值为12112212)TyTyEyxXaEyxXa()(其方差为2(3)TyVaryaa考虑比12222122(4)TTyyTTyaaaaaa其中12为两个总体均值向量差,根据的Fisher的思想,我们要选择a使得(4)式达到最大。定理1x为p维随机变量,设Tyax,当选取1,0acc,为常数时达到最大。特别当1c时,线性函数112(5)TTyaxx称为Fisher线性判别函数。令121121212111+-+(6)222TTTyyKaa定理2利用上面的记号,取112TTa,则有120,0(7)yyKK由定理2我们得到如下的Fisher的判别规则:11121212,-(8),-TTxXxxKxXxxK当使得当使得定义判别函数111212121(9)2TTWxxKx则判别规则可改写成512,0(10),0xXxWxxXxWx当使得当使得当总体的参数未知时,我们用样本对12,及进行估计,注意到这里的Fisher判别与距离判别一样不需要知道总体的分布类型,但两总体的均值向量必须有显著的差异才行,否则判别无意义。5.1.2模型的求解以第18号教师岗位的级别判定为例(其余见附录),借助SPSS软件进行计算得各个岗位Fisher判别函数的系数如下表表1各岗位等级判别函数的系数分类函数系数因素岗位等级1.002.004.005.006.007.00硕士招生人数合计12.0066.5083.5013.0592.935.933横向项目数量1.9847.6951.532-.683.059.200横向项目到账经费合计-.016-.156-.034.009-.005.007发表英文论文篇数合计-17.277-3.617-4.064-5.168-4.464-.147年均影响因子22.3761.9545.7446.8705.681-.176中文期刊论文篇数合计-.322-.981-.461.164.072.020获得校优硕论文篇数7.4374.8511.2664.4893.797.295(常量)-157.076-66.639-15.779-12.658-11.569-3.072Fisher的线性判别式函数将以上不同岗位的Fisher判别函数系数带入(10)式计算得第18号教师的岗位级别判定如下表表2第18号教师岗位的判别对分类结果a岗位等级预测组成员合计1.002.004.005.006.007.00初始计数1.0050000052.0004000044.000000