教育测量与评价课件(7)(第七章-教育测验“标准”及其建立方法)

整理文档很辛苦,赏杯茶钱您下走!

免费阅读已结束,点击下载阅读编辑剩下 ...

阅读已结束,您可以下载文档离线阅读编辑

资源描述

第七章教育测验的“标准”及其建立方法教育测验标准的含义标准参照测验分数的解释标准参照测验的定性标准——测验内容领域规范标准参照测验的定量标准——合格分数线标准参照测验的定义心理学家波帕姆对“标准参照测验”的定义是使用最为广泛的。他认为,标准参照测验是依据事先明确规定的知识能力标准而制定,并据此标准可以对被试的测验成绩作出解释的一类测验。标准参照测验主要关心的问题是要获得严格而精确的领域规范或行为领域规范。对于波帕姆的这个定义,我们需要从以下几个方面作进一步认识。①在这个领域规范中像目标、能力及技巧这样的术语可以互相换用;②标准参照测验所测的内容、行为目标或能力技巧等,必须是规定明确而详细的;③在一次测验中测量几种不同的能力时,通常更好、更科学的解释应当是分别按每种能力进行;④波帕姆的标准参照测验定义并不以某个切断分数为参照,通常是将标准参照测验的每项能力定出一个最低的要求,然后把被试的成绩同这最低要求进行比较。但是,在利用标准参照测验成绩进行“掌握—未掌握”或“合格—不合格”分类决策时,那么,提供个合宜的切断点是很必要的。如何理解“标准参照测验”的概念?思考题标准参照测验是依据事先明确规定的知识能力标准而制定,并据此标准可以对被试的测验成绩作出解释的一类测验。标准参照测验主要关心的问题是要获得严格而精确的领域规范或行为领域规范。对于这一定义,我们需要从以下几个方面作进一步认识:(1)在这个领域规范中像目标、能力及技巧这样的术语可以互相换用;(2)标准参照测验所测的内容、行为目标或能力技巧等,必须是规定明确而详细的;(3)在一次测验中测量几种不同的能力时,通常更好、更科学的解释应当是分别按每种能力进行;(4)这一定义并不以某个切断分数为参照,通常是将标准参照测验的每项能力定出一个最低的要求,然后把被试的成绩同这最低要求进行比较。答:教育测验标准的含义教育测验的“标准”指的是教育测验的成就标准,它对于编制标准参照测验以及解释标准参照测验的分数具有重要的意义。从对波帕姆“标准参照测验”的定义的分析来看,我们可以从以下两个方面来认识“标准”一词的含义:①从定性方面讲,“标准”一词指的是测试的内容或行为的范围,而这个范围是测验分数所参照的,它将通过“内容领域规范”得到明确。②从定量方面看,每当人们利用标准参照测验成绩进行有关评价决策时,难免从客观上需要确定一个切断点作为分类决策的依据。当然,这里的切断点可能是分数连续尺子上的一个切断分数点,也可能是采用正确作答题目数量的百分比。不管是哪一类切断点,它在一定程度上体现“标准”一词的在测量评价功能的定量标准。几个与标准参照测验相关的概念领域参照测验领域参照测验是建立在一套完善的题目汇编或内容领域规范汇编基础上用以检查被试的素质及发展水平的测验。如果按照波帕姆提出的标准参照测验的定义,那么标准参照测验和领域参照测验这两个概念和术语没有本质的区别。目标参照测验目标参照测验是包含和目标相适应的一组题目所构成的测验。如果对于事先确定好的测量目标,测验设计者能够为每一测量目标定出许多能充分体现该目标的内容范围或题目领域,然后分别从各个目标名下的内容领域中进行科学抽样来设计测验,那么,在这种情形下的目标参照测验实际上和标准参照之间并没有本质区别。但是,如果目标测验的设计者随意地编写题目并组成测验,尔后再分析题目所测的行为目标,那么,这样的目标参照就不能看作是标准参照测验。掌握测验掌握测验是建立一组教学和行为目标上的测验,主要用于判断学生是否掌握某组给定的教育目标。掌握测验的题目要根据它们与目标的一致性和对教学处理的灵活度来加以选择。这种以目标为出发点来选择题目、构建试卷的测验,其内容范围相对不够精确。从这个意义上讲,掌握测验类似于目标参照测验,均可用于某一行为目标或教学目标的形成性评价。正确百分数是以学生在标准参照测验中答对题目的比例来解释测验分数或描述学生取得成就的方法。正确百分数的计算公式:使用正确百分数时,要注意以下几个问题:①测验所要测定的内容(成就)范围必须明确,而且测验题目组能够成为这个内容(成就)范围的代表性良好的样本。②在标准参照中,可以针对整个测验为每一个学生确定其答案的正确百分数,对学生的内容掌握程度作出判断。③在课堂教学评价及其他有关资格证书测验中,为了对多层次的测验结果分别做出解释和描述,就需要分别对每一教育目标或内容板块去选择题目组,构成总测验。在解释测验结果时,既可以针对整个测验确定一个正确百分数,也可以根据测验的内容层次,分别计算不同内容层次的正确百分数。④在许多情形下,测验中不同内容的题型是不一样的,用公式()计算出正确百分数有些情况就不够客观。因此,我们可以利用公式()来计算学生个人的得分百分数。标准参照测验分数解释方法之一:正确百分数100测验原始总分测验原始得数得分百分数100总题目数答对题目数正确百分数100总题目数答对题目数正确百分数无论是针对每一教学单元的形成性测验,还是针对一门课程的终结性测验,如果要了解与判断学生是否掌握所学的内容,我们就要编制一份有内容效度的教育测验,并且事先定出一个可接受的最低标准。这个标准是人为确定的,它可以是百分制评分量尺上的某一人点,也可以是80%-90%的正确反应所对应的分数,作为最低通过标准。这个分数就是所谓的掌握分数。以它作为判断标准,把所有的学生区分为掌握和未掌握两类。对于掌握分数,应注意以下几点:①“掌握”与“未掌握”是人为确定的。②从知识的掌握状态来讲,事实上更应该是一种连续模型。因此,把学生区分为“掌握”与“未掌握”两类,在许多情况下的确是迫不得已的办法。③“掌握”、“及格”或“合格”的概念类似,但有区别。④当利用测验的掌握分数给学生进行二分类时,对于不同的年级、不同的课题内容、不同的测验乃至同一测验中不同的分测验,人为规定的掌握分数也未必相同。标准参照测验分数解释方法之二:掌握分数为了更好地解释教育测验的分数,人们把内容参照和常模参照结合起来。在编制测验过程中,不仅要明确内容范围具体任务,而且把成就分成若干差别明显的等级水平,标明不同等级水平的成就特征与问题类型,建立起内容等级分数及其评定量表。这样,将任一学生的测验结果与内容等级评定量表相对照,不仅能给出学生等级分数,而且还能具体描述学生会做什么,不会做什么的问题。标准参照测验分数解释方法之三:内容等级分数标准参照测验定性标准的含义标准参照测验定性标准是指测试的内容或行为的范围,而这个范围是测验分数所参照的,它将通过“内容领域规范”得到明确。编写测验内容领域规范的方法(一)(1)汉布莱顿模式①说明:对能力所包括的内容和行为作简明的描述。②实例指导与题目样本:一个测验指导的例子和一个测量能力的典型例题。③内容范围:一个对能力测量中的内容和行为的详细说明以及一个关于试题库的结构和内容的详细说明。④答案范围:必须预先准备好备择的不正确的答案的说明。(2)美国IOX模式①一般描述:是对测量的领域进行一般性的、简明扼要的描述。②样本题目:是给出一个带有指导性与限制性的测验题目的具体例子。③刺激的界定:是对题目的内容、素材、难度、广度等因素作出更为明确的规定。④反应的界定:是对被试者如何作答题目的方式,包括正确答案与错误答案的区分准则等方面作出规定。⑤其他补充说明:若有必要时,对界定测验内容领域所涉及的有关问题作出交待或补充说明。(3)英国GCSE模式①简介或引言;②目的;③评价目标④内容或核心内容;⑤评价目标和内容的关系;⑥评价技术;⑦等级描述。编写测验内容领域规范的方法(二)(4)我国高中毕业会考标准的建立模式①制定各学科考试大纲;②使用参照试卷进行取样测试,建立高中毕业会考的标准分量表:;③根据分数,把高中毕业会考成绩确定为五个等级;④编制与参照试卷大体平行的会考试卷;⑤在保密的状态下,抽取有代表性的样本,随机分成两组,分别用会考试卷和参照试卷进行测试,取得数据;⑥在会考试卷原始分数和参照考试卷原始分数建立等值对应关系;⑦根据每位高中生的会考成绩,经分数转换表,便可得知会考的等级分数。(5)我国高等教育自学考试标准的建立模式①课程性质与设置目的;②各章节的课程内容与考核目标要求。这是考试大纲的主体部分,是自学考试标准的规定;③考试说明与实施的要求。包括对能力目标层次的界定与说明、选用教材版本及参考书的说明、自学方法的指导、对社会助学的建议以及命题考试方面的若干要求;④样题或样卷。ZT1585标准参照测验定量标准的含义标准参照测验定量标准是指测验成绩的最低合格分数线(切断点),它是人们利用标准参照测验成绩进行分类决策的依据。当然,这里的切断点可能是分数连续尺子上的一个切断分数点,也可能是采用正确作答题目数量的百分比。(1)基于题目分类下的经验判断方法基于题目分类下的经验判断方法,就是利用课任教师对成就测验标准的“格式塔”心理现象和教师具备的考评经验来分析测验题目并做出分类与判断的思想方法。具体一点讲,就是要求课任老师在编好测验之后,认真审察测验中的每一个题目,分别把测验中所有的题目按特定课程的教学要求分成三类,第一类称为“基本要求的”;第二类称为“中等要求的”;第三类称为“高要求的”。接着,要求课任教师假想一组“最低能力的且恰是可接受”的被试,对他们在作答以上三类题目时提出具体标准,即决定在第一类题目中他们每个人至少应答对多少(比如90%);在第二类题目中他们每个人至少应答对多少(比如60%);在第三类题目中他们每个人至少应答对多少(比如说30%)。最后,根据上述判断结果进行加权计算。(2)基于题目双基度指标下的经验评判法标准参照测验题目的双基度指的是题目的考查内容和测量目标对体现特定学科“基础知识、基本技能”双基教学要求的适切性程度。假设一份测验卷中有N个题目,它们的双基度值及其分数值可用(b1,x1),(b2,x2),…,(bN,xN)来表示,则该测验的合格线分数:确定标准参照测验合格分数线的方法(一)NNxbxbxbE2211(3)基于题目“目标—难度”层次评估法基于题目“目标—难度”层次评估法来确定一个测验的合格线时,其主要思想是根据对题目考查目标层次的认识以及对题目难易程度作出经验判断,把整个测验卷中所有题目按照两个特征进行双向分类;然后由任课教师给每一类题目指派一个临界概率,这个临界概率就是设想一个尚未可接受的最低能力的学生,能够正确回答该类题目的可能性大小,或者认为这一临界概率是对每一位被称为合格的学生提出至少应答对该类题目的比例大小(同概率值大小相等)。(4)基于已知“掌握—未掌握”效标组的统计分析法可选择两组学生样本,其中一组被课任教师公认为已经掌握了特定课程的内容,另一组则被公认为未掌握特定课程的内容。然后把有待确定合格线的测验,放在这两组学生中进行试测,分别统计两组学生的测验成绩分布,以此判定测验的合格线。确定标准参照测验合格分数线的方法(二)

1 / 15
下载文档,编辑使用

©2015-2020 m.777doc.com 三七文档.

备案号:鲁ICP备2024069028号-1 客服联系 QQ:2149211541

×
保存成功