2013高教社杯全国大学生数学建模竞赛承诺书我们仔细阅读了中国大学生数学建模竞赛的竞赛规则.我们完全明白,在竞赛开始后参赛队员不能以任何方式(包括电话、电子邮件、网上咨询等)与队外的任何人(包括指导教师)研究、讨论与赛题有关的问题。我们知道,抄袭别人的成果是违反竞赛规则的,如果引用别人的成果或其他公开的资料(包括网上查到的资料),必须按照规定的参考文献的表述方式在正文引用处和参考文献中明确列出。我们郑重承诺,严格遵守竞赛规则,以保证竞赛的公正、公平性。如有违反竞赛规则的行为,我们将受到严肃处理。我们授权全国大学生数学建模竞赛组委会,可将我们的论文以任何形式进行公开展示(包括进行网上公示,在书籍、期刊和其他媒体进行正式或非正式发表等)。我们参赛选择的题号是(从A/B/C/D中选择一项填写):A我们的参赛报名号为(如果赛区设置报名号的话):所属学校(请填写完整的全名):西南科技大学参赛队员(打印并签名):1.李扬2.王佐泽3.汪婧婷指导教师或指导教师组负责人(打印并签名):郭晓波胡波文林军日期:2013年8月12日赛区评阅编号(由赛区组委会评阅前进行编号):2013高教社杯全国大学生数学建模竞赛编号专用页赛区评阅编号(由赛区组委会评阅前进行编号):赛区评阅记录(可供赛区评阅时使用):评阅人评分备注全国统一编号(由赛区组委会送交全国前编号):全国评阅编号(由全国组委会评阅前进行编号):摘要本文利用统计学知识,结合软件spss、excel、matlab对招聘中各问题,模型进行求解。关于问题一,如何补齐缺失数据,我们知道此数据样本为大容量样本,不完全数据集中数据的缺失依赖于完全变量,这种缺失模式为随机缺失。且本文缺失数据极少,我们采用均值填充。由于均值填充需要满足服从正态分布的前提,所以我们首先检验甲、乙、丙三组数据是否服从正态分布。利用软件spss正态性检验后证明服从,故用均值法填充。最终得到甲组第9个数据为77;乙组第25个数据为80;丙组第58个数据为80。关于问题二,如何给出101位应聘者的录取顺序,我们考虑到不同才的专家对同一应聘者的欣赏程度不同,所打的分数也会不同,因此不同专家所打每1分的贡献值也不同。为了调节每位专家所打一分的贡献值在同一水平线上,我们将每位专家所打的分数进行方差压缩,而这个水平我们选取五位专家方差的均值,然后对所有专家的分数进行调节,经过调整后,所有专家的均值相同,方差也相同,从而不同专家打分产生的干扰就会被最大程度地清除。进行排序后录取顺序也会公正合理。具体录取顺序见下表。关于问题三,如何比较五位专家中哪位打分比较严格,哪位比较宽松,我们将五位专家打分用spss进行两两显著性差异分析,得出除甲-丙外p值都0.05,显然只有甲-丙专家组打分有显著性差异。再计算五位专家打分方差,方差越大,分数波动越大,打分越严格。结合可得专家甲打分最为严格,专家丙打分最为宽松。关于问题四关于问题五一、问题重述某单位组成了一个五人专家小组,对101名应试者进行了招聘测试,各位专家对每位应聘者进行了打分(见附表),请你运用数学建模方法解决下列问题问题一:补齐表中缺失的数据,给出补缺的方法及理由。问题二:给出101名应聘者的录取顺序。问题三:五位专家中哪位专家打分比较严格,哪位专家打分比较宽松。问题四:你认为哪些应聘者应给予第二次应聘的机会问题五:如果第二次应聘的专家小组只由其中的3位专家组成,你认为这个专家组应由哪3位专家组成。二、符号说明三、问题假设1.假设题目所提供的数据准确无误,具有可靠性。2.假设甲、乙、丙、丁、戊五位专家的打分都保持客观、公平公正。3.假设应聘者录用与否只和专家对其所打的分有关,不考虑外界因素。4.假设应聘单位对每位专家打分的重视度相同。5.假设第四问中,二次应聘分为两种情况。四、模型分析4.1问题一的分析根据题目附件我们知道甲、乙、丙、丁、戊五位专家对101位应聘者每人的打分。由于特殊情况,甲、乙、丙三位专家在101位应聘者中各有一个数据缺失。问题一要求我们补齐表中缺失的数据。处理缺失数据前首先要判别缺失机构,此文不完全数据集中数据的缺失依赖于完全变量,这种缺失模式为随机缺失。此题样本30,大样本容量我们可以选用均值填充。均值填充是用已观测到的数据作为缺失值的代替值,但前提条件是变量服从正态分布或近似服从正态分布。所以我们第一步应该检验变量甲、乙、丙组打分是否服从正态分布。由软件spss分析统计箱在置信度为95%的条件下,甲组P值略小于0.05,但由于数据的随机性以及大样本变量,可将甲组近似看做正态分布;乙组p=0.200.05,服从正态分布;丙组p=0.1540.05,服从正态分布。综上,我们用spss软件以均值填充的方法得出甲组均值为77.37,四舍五入后得到甲组第9个数据为77;乙组均值为79.86,四舍五入后得到乙组第25个数据为80;丙组均值为80.42,四舍五入后得到丙组第58个数据为80。4.2问题二的分析题目要求我们给出101名应聘者的录取顺序。根据问题一,补齐缺失数据后得到5位专家对101名应聘者的打分的完整数据。在处理好的数据中,每一位专家所给的分数会出现最高分和最低分,而最高分和最低分不能直接去掉,也不能简单地取平均值。考虑到不同专家对同一应聘者的优劣程度会有所不同,所打的分数也会不相同,因而每位专家给出1分的贡献值也就不同。为了最大程度地消除不同专家打分产生的干扰,我们将分数进行调整。4.3问题三的分析第三问题目要求我们比较五位专家中哪位专家打分严格,哪位专家打分宽松。由题目含义可知,五位专家中个别专家打分有明显差异。首先我们可以进行差异显著性分析,显著性差异(p),是统计学上对数据差异性的评价。当数据之间具有了显著性差异,就说明参与比对的数据不是来自于同一总体(Population),而是来自于具有差异的两个不同总体。我们将甲、乙、丙、丁、戊五组数据用spss软件进行两两差异性分析,结果得到除甲-丙外,其余两两一组之间p值皆0.05,可见除甲-丙外其余专家之间无显著性差异。同时我们又采取计算五位专家分数样本方差,通过其值比较大小来验证上面所得结论,方差越大,波动程度越大。由下文模型可解得专家甲最严格,专家丙最宽松。4.4问题四的分析通过查阅资料【1】,我们了解到:大多数公司招聘的人数与应聘的人数呈1:3的比例。所以为了方便计算,我们假设这所单位需要招聘的人数为30人。题目要求我们找出应给予第二次应聘机会的应聘者,查阅资料【2】后了解到:大多数公司招聘职员都会进行不少于两次招聘测试,但也有少数急需用人的公司招聘职员仅进行一次招聘测试。为了不将问题太过复杂化,我们决定仅讨论这所单位的招聘测试进行一次和两次这两种情况。4.5问题五的分析题目要求我们判断第二次应聘的专家小组应由哪三位组成。根据查阅资料及分析得出,为了保证所招职员的质量,因此参加第二次应聘的专家应该比较严格。由第三问了解到,专家甲打分最为严格,专家丙打分最为宽松,由于第二次招聘是要选取真正的优秀者,所以首先将专家甲列入专家小组、专家丙不予考虑。然后比较剩余三位专家打分权重(重是一权个相对的概念,针对某一个指标而言,某一个指标的权重是指指标在整体评价中的相对重要程度。)。五、模型的建立与求解5.11问题一的建立经过分析得出,第一步用spss软件进行正态分布检验:若随机变量服从一个位置参数为尺度参数为的概率分布,且其概率密度函数为)2)(exp(21)(22xxf则这个随机变量就称为正态随机变量,正态随机变量服从的分布就称为正态分布,记作),(~2NX,读作服从),(2N,或服从正态分布。首先根据函数图像直观地判断甲、乙、丙三组数据是否满足正态分布,再根据spss正态性检验sig值进行判断。若p值0.05,则服从正态分布,反之,则不服从。第二步:根据均值填充计算方法算出缺失数据。naaaaXn)......(321__5.12问题一的求解根据上述方法,分别检验甲、乙、丙三组数据是否服从正态分布。应用spss软件analysis中得出甲组打分直方图如下:从下图看出专家甲在70到80分段分数频率较小,但由于样本容量远30,且p值略0.05,可近似看做服从正态分布。在满足正态分布的条件下,用spss计算出均值为76,5544554,四舍五入后填入第9个缺失数据为77。相同原理可得乙组数据的直方图如下:从图中可直接观察到分数大致满足正态分布,又由spss软件检验出p=0.0780.05,服从正态分布。在满足正态分布的条件下,用spss计算出均值为79.8613861,四舍五入后填入第25个缺失数据为80。同理可得丙组数据的直方图如下,从图中可直接观察到分数大致满足正态分布,又由spss软件检验出p=0.0820.05,服从正态分布。在满足正态分布的条件下,用spss计算出均值为80.0891089,四舍五入后填入第58个缺失数据为80。5.21问题二的建立经过分析,我们决定将每位专家打的分数进行整体的平移,调至一个基点,这个基点就选择专家打分的均值(记为iX,i1,2,3,4,5)。为了调节每位专家所打一分的贡献值在同一水平线上,我们将每位专家所打的分数进行方差(记为i,i1,2,3,4,5)压缩,而这个水平我们选取五位专家方差的均值(记为0)。然后对所有专家的分数进行调节,记ija为第i个专家对第j位应聘者的打分,那么调整后的分数'ija为:00'*xxaaiiijij这里0x表示所有专家评分均值的均值,经过调整后,所有专家的均值相同,方差也相同,从而不同专家打分产生的干扰就会被最大程度地清除。5.22问题二的求解利用excel计算出调整后的101个数据,再进行分数的高低排序,可得到101位应聘者最终的录取顺序,具体结果见下表:5.31问题三的建立经过分析可得,第一步对甲、乙、丙、丁、戊五组数据用spss软件进行两两差异性分析,得出有显著性差异的两组数据,可初步判断这两位专家可能就是较严格和较宽松的两位。再根据假设我们可以认为打分的宽松度是由专家对优劣应聘者区分度大小即所打分数的波动性决定的,也就是说较严格的专家对优秀的应聘者的打分会明显高于劣者。因此我们可以用专家所打分数的方差来表示波动性,方差大的专家就比较严格。方差刻画了随机变量的取值对于其数学期望的离散程度。方差越大,离散程度越大;反之则越小。若X的取值比较集中,则方差DX较小;若X的取值比较分散,则方差DX较大。因此,DX是刻画X取值分散程度的一个量,它是衡量X取值分散程度的一个尺度。换而言之,方差就是和中心偏离的程度。用来衡量一批数据的波动大小,即这批数据偏离平均数的大,并把它叫做这组数据的方差,记作DX。在样本容量相样本方差:1)(122nxxsnii5.32问题三的求解由上述方法用spss软件进行配对样本T检验,分别对两两数据显著性差异对比分析后得出甲-乙之间p值为0.062;甲-丁之间p值为0.140;甲-戊之间p值为0.057;乙-丙之间p值为0.893;乙-丁之间p值为0.712;乙-戊之间p值为0.939;丙-丁之间p值为0.579;丙-戊之间p值为0.947;丁-戊之间p值为0.674;上述组别间p值皆0.05而甲-丙间p值为0.0300.05,说明甲-丙专家之间打分有明显差异。进一步在excel中对甲、丙两组进行均值方差计算对比专家甲专家乙专家丙专家丁专家戊平均值76.55479.86170.08979.26779.98方差161.534129.288114.477129.82117.584由上表知:甲的平均值大于丙的平均值,而甲的方差最大,丙的方差最小,专家所打分数的方差来表示波动性,方差大的专家就比较严格,所以专家甲最严格,专家丙最宽松。5.41问题四的建立1、这所单位招聘测试进行两次的情况。在第一次招聘测试过后,表现优秀的应聘者直接拥有第二次的应聘机会,这种情况即拥有第二次应聘机会的人就是通过第一次测试的那些人。由第二问的结果可得,前30位的