1榆林学院第五届大学生数学建模竞赛承诺书我们仔细阅读了中国大学生数学建模竞赛的竞赛规则.我们完全明白,在竞赛开始后参赛队员不能以任何方式(包括电话、电子邮件、网上咨询等)与队外的任何人(包括指导教师)研究、讨论与赛题有关的问题。我们知道,抄袭别人的成果是违反竞赛规则的,如果引用别人的成果或其他公开的资料(包括网上查到的资料),必须按照规定的参考文献的表述方式在正文引用处和参考文献中明确列出。我们郑重承诺,严格遵守竞赛规则,以保证竞赛的公正、公平性。如有违反竞赛规则的行为,我们将受到严肃处理。所属院系(请填写完整的全名):能源工程学院我们参赛选择的题号是(C)参赛队员:队员名系别学号联系电话是否队长李泽辉2011级电气110523011618729948170否张新江2011级电气110523014518091712229是温新鹏2011级电气110523014615319652616否日期:2013年5月18日2一、问题重述C题:面试考核打分问题某市统计局在公开招考面试环节中,组成一个六人专家小组,对51名应试者进行了面试考核,各位专家对每位面试者进行了打分(见附表),请你运用数学建模方法解决下列问题:(1)补齐表中缺失的数据,给出补缺的方法及理由,并给出录取顺序。(2)六位专家中哪位专家打分比较严格,哪位专家打分比较宽松,并对六位专家的打分质量进行排序。(3)作为人事部门主管,你认为哪些面试者应给予第二次面试的机会。在今后的面试工作中,如何合理安排面试工作。数据附表序号专家1专家2专家3专家4专家5专家6170638188767828767646672723837668667371472688393839458372907981886746172526563776786668727385591628175789659472777975108190687478731176599181746312528377687584138981737982831481707659769115875587637789166366885372851788687180767518908053937980196270859472512051706669646121778173747878227188585768653238280826675572471615176719025526278887280265382706872802772719463767328587363847385295880875873773076738768725031858763537686326082747676783358927564747534558785587793357374786275873661946588808137829673778388388371809178683983896471787340866982707353417385826377894261797060677243879382738369448670668875674588819469848746539078887665478088797378714888737881776449*85787873565073*64867778516885*837669注:*表示专家有事外出未给应聘者打分二、问题分析这个问题属于数类统计学随机性模型,可采用画图形、逻辑运算、数值运算等各种数学方法和计算机技术。三、模型假设专家意外情况导致的数据缺失是一种完全随机缺失。专家打分公平公正公开,不受任何人际关系影响并且在整个过程中保持一致用人单位对每一位专家打分的重视程度相同。四、符号说明4ix(i为1、2、3)表示专家所打分数的的平均数;1ix给每位面试者的得分;is(i为1、2、3、4、5、6)表示各位专家所打分数的方差;1=),,,(211nXXXg,2=),,,(212nXXXg,12ˆˆ和称为置信限;四、模型建立统计学的思想是对随机事件的现象进行统计分析,将随机性归纳于可能的规律性中。而且也可以从差异中发现趋势。因为该题有着统计学的本质特征:数据的随机性,在该题我们将应用到统计中的统计数据分析和统计推断。将经收集好数据进行分析,得出及推断内中的趋势。均值插补根据辅助信息数据将样本分为若干组,使组内各单位的主要特征相似。然后分别介绍各组目标变量的均值,将各组均值作为组内所有缺失数据项的替补值。505150148111iiiiiiXXx;508549122iiiXx;5050133iiiXx。K-S检验法原理:K-S检验是统计学中在对一组数据进行统计分析是所用到的一种方法。它是将需要做统计分析的数据和另一组标准数据进行对比,求得它和标准数据之间的偏差的方法。一般在K-S检验中,先计算需要做比较的两组观察数据的累积分布函数,然后求这两个累积分布函数的差的绝对值中的最大值D。最后通过查表以确定D值是否落在所要求对应的置信区间内。若D值落在了对应的置信区间内,说明被检测的数据满足要求。反之亦然。为了更直观的说明专家所给分值服从正态分布,本文运用MATLAB软件绘出了专家1、专家2、专家3相对应所给分值的直方频率图、Q-Q图(见四、模型求解)。区间估计模型:区间估计指对总体中的一维参数,构造两个统计量:1=),,,(211nXXXg和2=),,,(212nXXXg,满足对于预先给定的很小的概率,有12ˆˆ()1P,这时,称区间12ˆˆ,为的置信区间,称12ˆˆ和为置信限,概率称为显著水平(或置信度),1称为置信水平(或置信概率)。5方差:方差是各个数据与平均数之差的平方的平均数。在概率论和数理统计中,方差(英文Variance)用来度量随机变量和其数学期望(即均值)之间的偏离程度。在许多实际问题中,研究随机变量和均值之间的偏离程度有着很重要的意义。502501111iixxs;502501222iixxs;502501333iixxs;512511444iixxs;512511555iixxs;512511666iixxs。Q-Q图:Q-Q图是一种散点图,对应于正态分布的Q-Q图,就[1]是由标准正态分布的分位数为横坐标,样本值为纵坐标的散点图.要利用QQ图鉴别样本数据是否近似于正态分布,只需看QQ图上的点是否近似地在一条直线附近,而且该直线的斜率为标准差,截距为均值.用QQ图还可获得样本偏度和峰度的粗略信息.Q-Q图可以用于检验数据的分布,所不同的是,Q-Q图是用变量数据分布的分位数与所指定分布的分位数之间的关系曲线来进行检验的。P-P图和Q-Q图的用途完全相同,只是检验方法存在差异。由于P-P图和Q-Q图的用途完全相同,只是检验方法存在差异。要利用QQ图鉴别样本数据是否近似于正态分布,只需看QQ图上的点是否近似地在一条直线附近,而且该直线的斜率为标准差,截距为均值.用QQ图还可获得样本偏度和峰度的粗略信息.五、模型求解6(1)补齐表中缺失的数据,给出补缺的方法及理由,并给出录取顺序。①补齐表中缺失的数据,给出补缺的方法及理由。(补齐后数据见附表)由SPSS软件求解:局部数据,其中专家1第49号数据未得出用00表示,其他专家同理。依次对专家1、2、3、4、5、6的其他数据进行分析,得出如下结果,如下图所示:7专家1的频率分布直方图专家1的标准Q-Q图专家2的频率分布直方图专家2的标准Q-Q图专家3的频率分布直方图专家3的标准Q-Q图8专家4的频率分布直方图专家4的标准Q-Q图专家5的频率分布直方图专家5的标准Q-Q图专家6的频率分布直方图专家6的标准Q-Q图9如图表可知:专家1的置信区间在[69.3,76.2],均值72.8,修正后的均为72.9均在置信区间内,所以可估计专家甲的缺失值为73。同理得出专家2的置信区间在[74.7,80.1],均值77.7,修正后的均值77.8均在置信区间内,所以估计专家乙的缺失值为78。专家3的置信区间在[72.0,77.9]均值74.9修正后的均值75.1均在置信区间内,所以估计专家丙的缺失值为75。(说明:5%修整均值就是把排在最前面和最后面5%的数据都删掉,之后再计算的均值,这样就使得均值不容易受均值影响,更能代表)②给出录取顺序表一序号平均分总分4583.85033783.2499482.2493582.24931381.24874381.24871879.24753878.54713678.24694178.24694778.24691077.3464977.04622176.84614876.84611576.34581776.34583976.34585176.0456176.04565076.04563475.84551475.54534475.34523175.04504675.04502774.84493574.84493274.34461174.04444973.8443873.74422373.74421273.24393373.0438372.84372872.74361972.3434772.24332972.24334072.24332572.0432271.34281671.24273071.04262670.84252470.04204268.24092267.8407664.53872063.538110(2)六位专家中哪位专家打分比较严格,哪位专家打分比较宽松,并对六位专家打分质量进行排序。再根据SPSS软件中的方差可推断出,对于所有的应聘者,专家打分的均值可以作为衡量专家打分的一个重要标准,在均值相同时,专家打分方差越大说明打分越严格。据图表中数据,我们可得出专家中依严格到不严格的顺序为:专家1→专家4→专家6→专家2→专家3→专家5(3)作为人事部门主管,你认为那些面试者应给予第二次面试机会。在今后的面试工作中,如何合理安排面试工作。因为专家评分标准不同,我们对面试者进行重新排名,先去掉6名专家中的最大值和最小值再求和,求平均数,表如下:表二序号专家1专家2专家3专家4专家5专家6总分平均数45888184873408547283938333182.7558379818833182.75378277838833082.5189080798032982.25138179828332581.25438782738332581.25417385827731779.25158787637731478.5366588808131478.5388371807831278318563768631077.5478079737831077.5487378817730977.25217774787830776.75348785587730776.75467888766530776.75108174787330676.5507378777830676.51117081767830576.25398371787330576.2532747676783047697277797530375.75128377687530375.75148170767630375.75238082667530375.75517583766930375.75177180767530275.5497378787330275.5357374787530075448670756729874.586281757829674117681746329473.5406982707329473.5287363847329373.25256278728029273277271767329273267068728029072.577668727328972.25196270857228972.25307673687228972.25376687371288722980587377