学生成绩评价及预测模型

整理文档很辛苦,赏杯茶钱您下走!

免费阅读已结束,点击下载阅读编辑剩下 ...

阅读已结束,您可以下载文档离线阅读编辑

资源描述

1学生成绩评价及预测模型摘要学生学业成绩的分析和评价,是教学工作的重要环节,也是学校常规管理的重要内容。科学地分析评价学生的学业成绩,不仅可以使教师准确掌握学生的学习状况,还可以使学生了解到自己的学习情况,也能为教学管理、改进教学提供必要的依据分析。为了全面、客观、合理地评价学生的学习状况,本文通过在对基础数据进行统计分析的基础上,采用聚类分析中的k-均值聚类分析法对612名学生的成绩进行分类评价,建立了成绩评价模型。首先,根据统计学知识,通过对附表所给的数据进行统计和整理,对612名学生的整体成绩情况进行了详细分析说明。同时运用Excel软件画出学生成绩波动图、成绩等级饼状分布图等,并对各图进行了相关分析和说明,最终得出学生总体成绩分布属于负偏态分布,绝大多数学生成绩分布在60-90分之间的结论。最后还运用非参数检验方法Kolmogorov-Smirnov检验、Shapiro-Wilk检验以及图示检验法(直方图、标准Q-Q图以及箱式检验图)对结论进行检验,使用SPSS软件进行绘图与计算,最终验证了学生成绩分布为非正态分布,且为负偏态分布的结论是正确的。然后在数据分析的基础上上建立了基于快速聚类(k-均值聚类)分析的成绩评价模型。在确定分类数为5类后,利用SPSS进行快速聚类分析计算,结果显示其聚类中心均值依次为:62.223755、89.029319、54.237350、34.400759、14.932222,各类人数分别为231、286、84、8、3,分类结果科学合理。为了对612名学生后两个学期的学习情况进行预测,本文采用灰色预测理论中基于时间序列的GM(1,1)一阶一元微分方程模型建立了成绩预测模型,为了保证建模方法的可行性,先对数据列进行了必要的检验处理,并且通过残差检验和级比偏差值检验两种方法对灰色预测GM(1,1)模型进行检验,结果显示模型的预测结果能达到较高的要求。最后利用Matlab编程得出预测函数,计算每个学生第5、6学期的成绩预测值以及前四个学期的拟合成绩,并且运用Kolmogorov-Smirnov检验、Shapiro-Wilk检验以及图示检验法对对第5、6学期成绩预测值的正态性分布进行检验,得出学生成绩的总体分布不服从正态分布,而是负偏态分布,与前四个学期的分析结果相吻合,因此可以判定预测结果是合理可靠的,具有较高的可信度。本文还就学生的学习状况,对学校管理部门提出相关的建议。最后讨论了GM(1,1)模型的推广问题,通过添加平衡因子改进模型级比数列的计算方法,以及添加上限条件修改输出函数的方法改进了模型,使得模型具有更强的适应性和更广的适用范围。关键字:成绩预测描述统计k-均值聚类分析灰色预测GM(1,1)负偏态分布21.问题重述评价学生学习状况的目的是激励优秀学生努力学习取得更好的成绩,同时鼓励基础相对薄弱的学生树立信心,不断进步。然而,现行的评价方式单纯的根据“绝对分数”评价学生的学习状况,忽略了基础条件的差异;只对基础条件较好的学生起到促进作用,对基础条件相对薄弱的学生很难起到鼓励作用。附件给出了612名学生连续四个学期的综合成绩。1.请根据附件数据,对这些学生的整体情况进行分析说明;2.请根据附件数据,建立数学模型,全面、客观、合理的评价这些学生的学习状况;3.试根据你的模型,预测这些学生后两个学期的学习情况。4.根据你的模型分析,试给学校的管理部门写一篇短文,提出对学生学习状况评价的建议和改进方案。2.模型的假设与符号说明2.1模型的假设1.假设每个学期的成绩满分为100分;2.假设每位学生所处的学习考试环境相同;3.假设每位学生的学习能力基本保持不变;4.假设每次考试试卷的难度都是相同的。2.2符号说明表示第i个学生的初始成绩数列表示第i个学生一次累加成绩数列表示第i个学生第k个学期数列级比表示第i个学生第k个学期数列均值表示第i个学生的预测成绩数列表示第i个学生的预测的一次累加成绩数列表示第i个学生第k个学期的残差表示第i个学生第k个学期的级比偏差(注:其他符号在相关位置再作假设。)3.问题分析3.1背景分析学生成绩评价原则是指对学生成绩评价活动的共同的、理性的认识。它是学生成绩理论与学生成绩评价实践活动的纽带。学生成绩评价理论从科学角度对学生成绩的评价3进行研究,通常包括假设、概念、原理和原则等。学生成绩评价实践是评价学生成绩实践中所使用的原则、程序和方法。随着社会的发展,办学规模的不断扩大,教学质量的保证和提高的问题日益凸显,各种教学研究和教学实践层出不穷,但是学生学习状况的评价作为提高教学质量和激励学生努力学习的重要手段,却没有得到应有的重视,显然传统的评价方法忽略了学生基础条件的差异,并不能对学生的学习状况进行全面、客观、合理的评价,建立一种科学的评价方法势在必行。3.2问题一的分析:基本数据分析根据统计学中描述统计方法,对这612名学生的整体成绩情况进行详细分析。其中包括每个学期整体成绩的平均值、最大值、最小值、方差、标准差、差评率、优秀率等多项指标。通过对附表所给的数据进行统计整理并作出相应的波动图、直方图、饼状图等,可以更为直观地了解四个学期成绩的分布情况。最终对学生的整体情况进行全面、客观、科学的分析说明。3.3问题二的分析:成绩评价模型的分析传统方法中,对个体学生的成绩进行评价的方法主要是基于基本的统计计算,比如均值、排序等。事实上,这些方法单从成绩本上来讲基本能够反映学生的学习状况,但是其中也有很多局限性,比如排序评价,A学生与B学生的成绩可能相差0.5分,但是经过排序后,就认为A学生比B学生优秀,这显然不是很合理。本文主要从实际出发,以学生心理接受程度为依据,提出依据学习成绩的实际分布情况进行分类的方法对学生学习状况进行评价。然而究竟以什么标准进行分类呢?分成多少级好呢?分好的级别能够反映怎样的学习状况呢?目前对于已知数据进行已知分类数或者未知分类数的方法有很多,常用的有聚类分析法。聚类分析是一种探索性的分析方法,在分类的过程中,不必事先给出一个分类的标准,聚类分析能够从样本数据出发,自动进行分类。聚类分析所使用方法的不同,常常会得到不同的结论。不同研究者对于同一组数据进行聚类分析,所得到的聚类数未必一致。聚类分析中的k-均值聚类法,又叫迭代聚类法或者快速聚类法,可以事先给出分类数,聚类的结果也比较科学和合理,本文采用该方法作为成绩评价模型的主要方法。采用该方法进行聚类时,先给对象集一个粗糙的初始分类,然后用某种原则进行修改,直到分类比较合理为止。其具体步骤如下:1.原始数据的预处理:通过损失函数计算合理的分类数K2.将数据分成K个初始类,并计算各初始类的中心坐标3.通过合适的距离计算将数据重新分类,分类的原则是将样品划入离中心最近的类中,然后重新计算中心坐标4.重复步骤3,当聚类满足算法终止条件时停止计算3.4问题三的分析:成绩预测模型的分析现实中,预测问题有很多种求解模型,比如BP神经网络模型、一元线性回归模型、灰色预测模型等。对于问题三,已知一批学生的前四个学期的成绩,预测其第五六学期的成绩,非常类似于灰箱过程。在灰色系统中,灰箱是已知部分数据,进而推测其他数据的一种模型。4灰色预测是灰色系统的一个重要方面,它通过鉴别系统因素之间发展趋势的相异程度,即进行关联分析,并对原始数据进行生成处理来寻找系统变动的规律,生成有较强规律性的数据序列,然后建立相应的微分方程模型,从而预测事物未来发展趋势的状况。灰色预测是指利用GM模型对系统行为特征的发展变化规律进行估计预测,同时也可以对行为特征的异常情况发生的时刻进行估计计算,以及对在特定时区内发生事件的未来时间分布情况做出研究等等。这些工作实质上是将“随机过程”当作“灰色过程”,“随机变量”当作“灰变量”。本文采用的是灰色系统理论中的GM(1,1)模型。3.4.1灰色建模可行性检验:对原始数据进行预检验与预处理为了保证建模方法的可行性,需要对已知数据列做必要的检验处理。设第i个学生第j个学期的成绩为计算数列的级比如果所有的级比都落在可容覆盖,即(0.67032,1.39561)(在本文中,)范围内,则数列可以作为灰色模型GM(1,1)的数据进行灰色预测。否则,需要对数列做必要的变换处理,使其落入可容覆盖内。3.4.2建立GM(1,1)灰色模型对数列做一次累加生成1-AGO数列:其中,均值数列则于是可建立灰微分方程转化为白化微分方程记5则由最小二乘法,求得使达到最小值的(8)于是可求解白化微分方程(7)得到预测值为(9)且3.4.3预测值检验3.4.3.1残差检验计算残差值如果残差则可认为预测结果达到一般要求;如果残差则可认为预测结果达到较高要求;3.4.3.2级比偏差值检验计算级比偏差如果级比偏差则可认为预测结果达到一般要求;如果级比偏差则可认为预测结果达到较高要求;利用Excel计算得到级比偏差检验数据(详细计算结果如表5(详细数据见附件9)所示),从学期2到学期4三个学期的级比偏差均值为依次为0.0093441、-0.02402和0.0119905,表明绝大部分级比偏差值都满足因此,可以说模型的预测结果能达到较高的要求。64.模型的建立与求解4.1学生成绩整体情况的总体分析4.1.1对学生成绩的描述统计分析及结果说明本文采用统计学中描述统计的方法对学生总体成绩的原始数据进行详细分析,得到了学生成绩的基础数据,如表1所示:表1学生成绩整体情况的描述统计学期1成绩学期2成绩学期3成绩学期4成绩总数612612612612均值72.5574.3773.1775.06中值74.3276.6474.1976.54众数59.48*78.33*83.2416.50*标准差9.5010.609.0110.24方差90.25112.3181.24104.90偏度-1.24-1.92-1.94-2.93偏度的标准误0.100.100.100.10峰度2.507.048.1414.48峰度的标准误0.200.200.200.20极小值24.340.0016.250.00极大值89.4590.8590.6289.63百分位数2567.9469.4468.8970.955074.3276.6474.1976.547579.4181.8579.2081.55(其中*表示存在多个众数,显示最小的)从描述统计结果可以知道,由于偏度值都为负值,因此可以判断学生每个学期的总体成绩分布都属于负偏态分布,即其波峰偏向于成绩较高的右侧,说明学生的总体成绩偏向于高分,且每个学期的偏度值的绝对值逐渐增大,因此偏态程度越来越严重。峰度值为正值,且每个学期逐渐增大,说明高分层的学生数量逐渐增多。均值分数都在72-76分之间,可以判断学生的总体成绩状况良好。极大值普遍保持在90分左右,说明高分层波动不大。为了更直观地观测成绩分布情况,作出学生成绩波动图:7图1学生成绩波动图从图1可以清楚地看到,学生成绩基本分布在七八十分之间。不过仅仅以此图进行分析说明过于笼统,因此为了更精确地刻画成绩分布,本文依据现实情况,把学生成绩按照如下评定方法划分为四个等级:I.90-100分优II.75-90分良III.60-75分中IV.60分以下差据此可以做出成绩等级饼状分布图:图2成绩等级饼状分布图从图2可以准确地知道,90%以上的学生成绩都集中在良和中(即60-90分)两个等级之间,其中等级为良的人数占46%-57%,等级为中的人数占35%-48%,而差评的学生为数不多,在4%-10%之间。然而成绩占优的学生比率非常低,且第一和第四学期一个都没有。具体数值如图3所示:8图3成绩等级分布柱状图综合以上,可以总结出学生成绩整体情况的分析说明:A.学生总体成绩分布属于负偏态分布;B.学生总体成绩良好;C.绝大多数学生成绩分布在60-90分之间;D.90分以上的学生数量甚少,每学期只有1-2个,有两个学期甚至一个都没有。E.差评的学生为数不多,平均每学期只有43个,占总人数的6.9%4.1.2对结论的检验首先,本文采用非参数检验方法Kolmogorov-Smirnov检验(

1 / 24
下载文档,编辑使用

©2015-2020 m.777doc.com 三七文档.

备案号:鲁ICP备2024069028号-1 客服联系 QQ:2149211541

×
保存成功