2012年4月西安电子科技大学学报(自然科学版)Apr.2012第X卷第X期JOURNALOFXIDIANUNIVERSITYVol.XXNo.X数学课程的成绩分析张翰宗,陈朴越,帘凯雄摘要:本文讨论了B题中给出的对大学数学课程的成绩分析的一种分析方法,根据题目中提供的甲乙两专业4门数学学科的成绩,对成绩进行分类汇总,再通过数理统计的方法进行对成绩的分析,运用Excel、Matlab绘出图表,直观的分析甲乙专业,各数学学科的一些统计量。再查找数学教育的相关资料,建立合理的数学水平评价模型。最后建立数学学科之间的相关回归模型,利用Matlab进行回归检验,从而讨论各个数学学科之间的关系。关键词:层次分析法统计回归方法一元线性回归数学水平评估模型1问题重述附件是甲专业和乙专业的高等数学上册、高等数学下册、线性代数、概率论与数理统计等三门数学课程的成绩数据,请根据数据分析并回答以下问题:(1)针对每门课程分析,两个专业的分数是否有明显差异?(2)针对专业分析,两个专业学生的数学水平有无明显差异?(3)高等数学成绩的优劣,是否影响线性代数、概率论与数理统计的得分情况?(4)根据你所作出的以上分析,面向本科生同学阐述你对于大学数学课程学习方面的看法。2模型假设和符号说明2.1模型假设1)甲专业24号同学高数I成绩433,不属于0-100分,所以当无效数据处理,不考虑它的影响。2)考试成绩反映的是学生的真实水平。3)高数成绩和线性代数、概率论与数理统计有相关关系。4)将高数成绩定义为将高数I的成绩和高数II的成绩取平均。5)两个专业的老师教课水平是一样的。6)学生本科前的数学水平是相近的。7)两专业的人数可以真实反应学生水平。2.2符号说明x:把高数成绩作为一元线性回归模型的自变量。1y:把线性代数成绩作为一元线性回归模型的因变量1。2y:把概率论与数理统计成绩作为一元线性回归模型的因变量2。3210、、、:一元线性回归模型的回归系数。3210ˆˆˆˆ、、、:一元线性回归模型的回归系数的估计值。:随机误差(均值为0的正态分布随机变量)西安电子科技大学学报(自然科学版)第XX卷:相关系数的平方。3问题分析3.1问题(1)分析问题要求针对每门课程分析两专业的分数差异,因此分成4门课,每门课再分甲乙专业,然后用Excel制表,画图,算出其中的数理统计量,最后通过比较各个统计量和比较图表来得到结论。3.2问题(2)分析将成绩按照专业分开进行对照比较,定义一个模型来评估学生的数学水平,建立数学水平评估模型后再将两专业的成绩、各个统计量带入模型中,然后求出结果再经行比较得出结论。3.3问题(3)分析将高数成绩分别与线性代数成绩和概率论与数理统计成绩进行相关性分析,建立一元线性回归模型,利用Matlab处理数据,求出相关系数、回归系数的点估计和区间估计并检验回归模型的可靠性,进行残差分析。3.4问题(4)分析结合问题(1)至问题(3)然后对其结果进行总结分析。4模型建立与求解4.1问题(1)求解将附件数据中甲乙专业按照数学学科分开,用Excel统计出每科甲乙两专业人数、最高分、最低分、极差、众数、中位数、平均分、标准差、及格率、优秀率等统计量,再统计甲乙各个分数段的频数,作出频率分布直方图,再根据平均分和标准差作出成绩的正态分布图,观察比较两者是否基本吻合,一般情况下成绩会遵循正态分布,由此可以判断试卷出的题目有无过难或过易。4.1.1甲乙专业高数成绩的差异分析表1甲乙专业高数I成绩统计结果人数最高分最低分极差众数中位数平均分标准差及格率优秀率甲专业高数I15295095607271.5115.1194.74%28.29%乙专业高数I1081000100606669.3413.8995.37%21.30%表2甲乙专业高数II成绩统计结果人数最高分最低分极差众数中位数平均分标准差及格率优秀率甲专业高数II153964056606770.1210.2396.73%18.95%乙专业高数II10897097646565.4314.3389.81%12.04%通过表1分析发现:甲专业高数I的均分要高于乙专业,但标准差也大于乙,说明离散程度甲要大一些,既分数分布更为分散些,再比较及格率和优秀率,及格率基本差不多,但优秀率上甲要高于乙。再分析表2发现:甲乙专业的极差差距比较大,均分还是甲专业要大于乙专业,标准差是甲要小于乙,说明乙的分数分布更为分散,甲专业的及格率和优秀率普遍要比乙专业的高。因此仅由表1和表2的统计结果可以得出一个结论:综合来看甲专业的高数成绩要好于乙专业的高数成绩。第X期张翰宗等:数学课程的成绩分析乙专业高数I成绩的频率直方图和正态分布图0.00%1.00%2.00%3.00%4.00%5.00%6.00%051015202530354045505560657075808590951000.00%0.50%1.00%1.50%2.00%2.50%3.00%3.50%图1甲专业高数I成绩频率分布直方图和正态分布示意图图2乙专业高数I成绩频率分布直方图和正态分布示意图利用Excel作出甲乙专业关于高数成绩的频率直方图和正态分布图,根据图1分析:甲专业学生落在60-65分数段的频率最大,再比较甲乙专业高数I成绩的频率分布直方图和正态分布曲线,发现频率最高的分数段都要落后于平均分一点,都是在60-65分这个分数段,而图中50-60分这个分数段频率为0,由此分析可能是老师把一些不及格的同学拉到及格了,使得图上显示的结果不太符合一般考试的成绩分布状态。甲专业高数II成绩的频率直方图和正态分布图0.00%1.00%2.00%3.00%4.00%5.00%6.00%051015202530354045505560657075808590951000.00%0.50%1.00%1.50%2.00%2.50%3.00%3.50%4.00%4.50%乙专业高数II成绩的频率直方图和正态分布图0.00%1.00%2.00%3.00%4.00%5.00%6.00%7.00%8.00%051015202530354045505560657075808590951000.00%0.50%1.00%1.50%2.00%2.50%3.00%图3甲专业高数II成绩频率分布直方图和正态分布示意图图4乙专业高数II成绩频率分布直方图和正态分布示意图分析图3和图4:发现甲乙专业高数II成绩的频率分布直方图基本上落在正态分布曲线内,说明成绩的分布还是比较理想,甲乙专业都是在65-70这个分数段频率最大,从图中可以清楚观察出,甲专业分数的分布更为集中些,这与表2的分析结果是相符的。最后通过图1-图4可以得出结论:甲专业的学生高数成绩要好于乙专业的。分数的分布也更为平均。4.1.2甲乙专业线性代数成绩的差异分析表3甲乙专业线性代数成绩统计结果人数最高分最低分极差众数中位数平均分标准差及格率优秀率甲专业线代15398098607270.6814.6195.42%24.84%乙专业线代1081000100606970.1913.1695.37%20.37%通过表3分析发现:乙专业有满分的,并且两个专业的均分也相差不大,标准差是甲专业大于乙专业,甲专业的成绩相对于乙要分散些,及格率两专业也相差不大,优秀率甲专业要好于乙专业。因此仅由表3的统计结果可以得出一个结论:综合来看甲专业的线代成绩和乙专业的线代成绩相仿。西安电子科技大学学报(自然科学版)第XX卷乙专业线代成绩的频率直方图和正态分布图0.00%0.50%1.00%1.50%2.00%2.50%3.00%3.50%4.00%051015202530354045505560657075808590951000.00%0.50%1.00%1.50%2.00%2.50%3.00%3.50%图5甲专业线代成绩频率分布直方图和正态分布示意图图6乙专业线代成绩频率分布直方图和正态分布示意图分析图5和图6:发现甲专业线代成绩的频率分布直方图基本上落在正态分布曲线内,说明成绩的分布还是比较理想,而乙专业线代成绩的频率分布直方图和正态分布曲线还是有些差距的。甲专业在55-60分数段频率最大,而且在55-90分数段中成绩的分布较为均匀,乙专业是在55-60分数段和65-70分数段频率最大。4.1.3甲乙专业概率论与数理统计成绩的差异分析表4甲乙专业概率论与数理统计成绩统计结果人数最高分最低分极差众数中位数平均分标准差及格率优秀率甲专业概率153972275907675.0914.0494.12%39.22%乙专业概率10897097607574.4514.1196.30%38.89%通过表4分析发现:甲乙专业的最高分相同,但乙专业有0分的学生,甲乙专业的均分相近,标准差相近,及格率是乙专业好于甲专业,但优秀率是甲专业好于乙专业。因此仅由表4的统计结果可以得出一个结论:综合来看甲专业的概率论与数理统计成绩和乙专业的概率论与数理统计成绩相仿。甲专业概率成绩的频率直方图和正态分布图0.00%0.50%1.00%1.50%2.00%2.50%3.00%3.50%051015202530354045505560657075808590951000.00%0.50%1.00%1.50%2.00%2.50%3.00%乙专业概率成绩的频率直方图和正态分布图0.00%0.50%1.00%1.50%2.00%2.50%3.00%3.50%4.00%4.50%051015202530354045505560657075808590951000.00%0.50%1.00%1.50%2.00%2.50%3.00%图7甲专业概率成绩频率分布直方图和正态分布示意图图8乙专业概率成绩频率分布直方图和正态分布示意图分析图7和图8:发现甲专业概率成绩的频率分布直方图和正态分布曲线还是有微小的差距,乙专业概率成绩的频率分布直方图基本上落在正态分布曲线内。甲专业在60-70分数段和75-90分数段的分布比较平均,乙专业在85-90分数段频率最大。4.2问题(2)求解4.2.1数学水平评估模型建立建模背景:基于我们学校对这三门课程的一个学分安排——高数I为6学分,高数II为6学分,线性第X期张翰宗等:数学课程的成绩分析学分,概率论与数理统计为3学分。总共为18学分,因此建立一个加权平均的模型来定义学生的数学水平。建立如下模型:616131II31I学生概率成绩学生线代成绩成绩学生高数成绩学生高数学生数学水平4.2.2数学水平分析求解将甲乙专业分开,分别计算各个学生的数学水平,得到相关统计量,并绘制表格:表5甲乙专业数学水平统计结果人数最高分最低分极差众数中位数平均分标准差及格率优秀率甲专业数学水平15294.5045.5049.0070.6770.6771.559.5194.74%16.45%乙专业数学水平10895.330.0095.3367.5067.8369.0311.7093.52%13.89%从表5可以看出甲专业极差小于乙专业,众数、中位数、均分都要高于乙专业,而起标准差要小于乙专业,说明数学水平分布更为集中,并且甲专业的及格率和优秀率都要