教育测验的常模及其建立方法第一节教育测验常模的意义与类型一、测验常模的意义•原始分数(rawscore):将被试的反应与标准答案相比较而获得的测验分数。原始分数本身没有多大的意义。•原始分数的两个缺陷–原始分数的起点0没有明确意义;–分数并不能说明考生对知识掌握了多少1.概念:(测验的)常模,指一个有代表性的样组在某种测验上的表现情况,或一个与被试同类的团体在相同测验上得分的分布状况与结构模式。(1)有代表性的样组;(2)针对某种人群的身心特征;如智力常模、记忆常模等2.常模的用途和导出分数(1)获取一个有代表性的常模团体(2)常模资料的统计学描述(3)导出分数(derivedscore):按照一定的规则,针对原始分数进行统计处理后获得的分数。导出分数具有一定参照点和单位,可以相互比较。二、测验常模的主要类型•发展常模(DevelopmentNorm)–某一年龄或某一年级心理发展的平均水平–导出分数:已经达到的发展水平–如:年龄常模、年级常模、顺序量表、比率智商、教育商数•组内常模(Within-groupNorm)–具有同一身份的人的平均水平–导出分数:在某一特殊团体中的相对位置–如:百分等级常模、标准分数常模、离差智商等1.年龄常模(1)取平均值作为指标基于不同年龄组测试所得的平均分,并与相应的年龄当量联系起来构成年龄常模资料(2)用一组题目作为指标用一批能使某年龄组大多被试都能通过的题目来代表该年龄组的发展水平2.年级常模–概念:不同年级学生在某种测验上的正常的一般的表现方法–建立方法:利用某年级学生在某一测验上的平均分和相应的年级当量之间的对应关系来描述该测量的年级常模–年级当量通常用两位表示,第一位为“年”,第二位为“月”–利用年级常模表将原始数据转化为年级当量,如此可以通过测验来了解和评价学生的发展例:假定某学生四年级中期的算术、语文、阅读、外语四门学科成就测验的年级当量如下:算术-5.5、语文-5.0、阅读-6.0、外语-4.5–在建立年级当量常模或年龄当量常模时,由于受到条件限制,使得各年级样组间的年月跨度较大,为了得到更加细化甚至连续性的常模表,可以采用插值计算和曲线拟合的方法。第二节百分等级常模及建立方法一、百分等级常模的意义与应用•百分等级是一个地位量数,能够反映某个测验分数在一个次数据中的相对地位。它是把学生的原始分数放在学生所在群体的成绩中进行比较,以确定该学生在群体中的相对地位之高低。•百分等级常模就是基于某个常模团体,为某种测验的原始分数与百分等级之间建立起对应关系的组内常模类型。•在能力测验和学业测验中得到广泛的应用二、百分等级常模的建立方法1.基于未归类数据建立百分等级常模的方法第一步:把观测数据从大到小依次排列;第二步:按不同的数据逐个地统计次数;第三步:从低分开始向高分方向,计算各个得分点数据以下的累积总人数;第四步:计算各得分点数据的“以下累积相对次数”即比例数;第五步:确定各得分点数据的百分等级PR,计算方法是把各数据的“以下累积相对次数”乘上100;第六步:把原始分数与百分等级有关数据取出来列表,形成该测验的百分等级常模表2.基于分组归类数据建立百分等级常模的方法(1)根据测验所欲使用的对象,科学地选择常模团体,即有代表性的被试样本;(2)把测验施测于该常模团体,取得实测数据;(3)编制实测数据即常模团体实测分数的次数分布表第一步:查找数据中的最大值与最小值,其差数称为全距;第二部:决定组数、组距和组限;第三部:把所有数据逐个进行归类,然后统计次数并加以检查,最后把有关结果用一个规范的表格加以整理,即为次数分布表。组距X所在组的次数X所在组别的组下线小于Lb的各组次数之和•百分等级常模的优缺点–易于理解,用途广–由于是等级量表,所以百分量表的分数不能进行加减乘除的运算,许多统计方法都无法使用。第三节标准分数常模及建立方法一、标准分数的基本定义•标准分数是以标准差为单位表示测验成绩与平均分数之间的距离•标准分数是以平均数为参照点,标准差为单位的一种量表分数,它将原始分与平均数的距离以标准差为单位来表示•把原始分数转换成标准分数是一种线性的转换,所以转换后的分数能保持原始分数准确的数量关系和分布形态例:甲、乙、丙、丁四人在某次语文考试中分别获得72分、60分、48分和90分,而全体学生的语文平均成绩为60分,标准差为12分,求这四个人相应的标准分数。•Z分数的转换(1)教育与心理测验中的T分数:T=50+10Z(2)韦氏智力量表中各分测验的量表分:T=10+3Z韦氏智力量表智商(离查智商):IQ=100+15Z(3)美国大学入学考试报告分数:CEEB=500+100Z(4)为出国人员举行的英语水平考试:EPT=90+20Z(5)美国教育测验中心举办的“托福”考试:TOEFL=500+70Z二、标准分数常模建立的方法所谓标准分数常模,就是以常模团体在某一测验上的实测数据为基础,把原始分数转换成基本标准分数Z或转换到更大的标准分数T量表上,能够揭示每个测验分数在常模团体测验分数中的相对地位的一种组内常模。XZT简单式常模转换表复合式常模转换表三、正确理解与使用标准分数•标准分数Z的性质与特点–任何一批原始分数,转化成Z分数后,这批Z分数的平均值为0,标准差为1。Z大于0,表示测验成绩在平均数之上;Z小于0,表示测验成绩在平均数之下。–标准分数Z量表的单位是相等的,其零点是相对的。–Z分数本身是关于原始分数X的一种线性变化,因此,Z分数不改变原始分数的分布形态。–在一般情况下,标准分数Z的取值范围在-3到+3之间。•正态分布下若干种评分体系之间的关系(1)标准九分(stanine)是基于百分等级形成的另一较常用的评分量表,该评分量表是9点评分形式,取值为1至9的整数。(2)其他多点评分量表如:标准十分、标准十五分、标准二十分量表等•在一定条件下(正态分布)使用标准分数(1)根据常模团体的测验分数次数分布表,建立起原分数Xi与百分等级PRi之间的一一对应关系(2)利用正态分布表,从已知的每一个百分等级PRi反查其对应的标准分数Zi,从而间接实现了从Xi到Zi之间的变换。(3)根据需要选择a与b的常数,实现Zi到Ti之间的线性变换,从而建立正态化标准分数常模•标准分数的优缺点–优点•可以进一步运算•可以比较两个不同测验的分数–缺点•计算依据比较复杂的统计原理,使用的人需要有一定的统计知识基础;•有负数,应用不便;•单位太大;•原始分数如果畸变,标准分不能使分布有所改进第四节标准分数在我国高考中的试点运用一、建立标准分数制度是高考标准化的重要环节•第一阶段(1985-1992)引入“标准化考试”的概念:命题标准化、考试管理标准化、评阅试卷标准化、分数的解释和使用标准化•第二阶段(1993-现在)分数解释和使用标准化二、在高考中使用原始分数的局限性•原始分数未能反映考试分数相对于团体的位置信息•不同科目或同一科目不同次考试之间分数可比性较差•各科标准差不一影响对科目权重的设计三、高考标准分数制度的内容•高考标准分数制度是根据教育统计、教育测量、教育评价等科学原理,按照一定规则把原始分数转化为具有相同意义、相同单位和共同参照点并能刻画考试分数在总体中位置的分数制度。•高考标准分数制度由常模量表(包括全国常模和省常模)、等值量表分数组成。•标准分数制度在全国实施是一个长期而曲折的过程。四、高考标准分数转换方法•单科标准分数转换方法(1)将同类考生的学科原始分数从大到小进行排序;(2)计算每一个分数Xi以下的考生占考生总数的百分比Pi,或百分等级PRi(3)由每个原始分数所对应的百分比Pi或百分等级Pri,利用正态分布表,经过简单的计算,即可确定所对应的正太分数Zi,从而得到每一个原始分数所对应的正态化标准分Zi(4)进行线性变换,我们确定的量表平均分为500,标准差为100,那么线性变换公式为:•高考综合分的转换方法以各科标准分的简单和或加权和为起点,仿照上述单科标准分的转换方法,再转换一次,得到综合标准分,简称综合分。考生各科分数和综合分数的取值范围均为100-900。—完—