第十二章教学成效的测量与评价教学成效的测量与评价是教学过程中的重要环节,也是教育心理学的重要组成部分。第一节教学测量与评价及其作用一、教学测量与评价的涵义(一)教学测量与教学测验教学测量是考核教学成效的一种方法,是一种收集资料数据的过程。它是借助于一定的教育测量工具及其操作,根据某种标准和一定的操作程序,将学生的学习行为与结果确定为一种量值,以表示学生对所测问题了解的多少。教学测验是测量一个行为样本的系统程序,即通过观察少数具有代表性的行为或现象来量化描述人的心理特征,为了减少误差,测验在编制、施测、评分以及解释等方面都必须遵循一套系统的程序。(二)教学评价教学评价是指有系统地收集有关学生学习行为的资料,参照预定的教学目标对其进行价值判断的过程,其目的是对课程、教学方法以及学生培养方案作出决策。具体而言,教学评价是一种系统化的持续过程,包括确定评估目标、搜集有关的资料、描述并分析资料、形成价值判断以及做出决定等步骤。教学评价主要包括以下两个方面的工作:1.教学评价必须对学绩测验数据所表明的教学成效作出确切的诊断。2.教学评价必须对教学的成败原因进行分析,并对今后教学工作的改进方面作出明确的规定。(三)教学测量与评价的关系教学测量与评价两者既有区别,又有密切的联系。一方面,教学测量是对学绩测验所得结果的客观描述(将结果予以数量化),并不考虑结果的实际意义。而教学评价是对学绩测验所得结果的主观判断(对结果进行分析解释),以了解结果的实际意义;另一方面,虽然教学评价是一种主观判断,但是这种主观判断必须以教学测量所得的客观描述为依据。否则,就是主观主义的判断。同样,教学测量也不能脱离教学评价,因为教学测量只是对学绩测验结果的客观描述,只有通过教学评价,才能判断这种客观描述的实际意义。不通过评价,测量所获得的结果也就毫无实际价值。二、教学测量与评价的作用和功能教学测量与评价是检验教学成效,确定学生学习结果和教学效果的有效手段,是有效教学所不可缺少环节。它的根本作用则在于了解学生的学习状况,改进教师教学,从而促进学习效果的提高。一般来说,教学测量与评价具有以下两个功能:1.反馈和调节功能2.激励和动机功能第二节有效教学测验的基本要求既然教学测量与评价是有效教学活动的一个必要环节,而教学测量是以科学的教学测验为工具施行的。那么,有效教学测验有哪些基本要求呢?一、测验的信度(一)信度与信度系数测验的信度又叫测验的可靠性,指的是测量的一致性程度。信度指标通常以相关系数表示,即用同一被试样本所得的两组资料的相关系数作为测量一致性的指标,称为信度系数。估计信度系数的方法很多,常见的有以下几种:①再测法;②复本法;③分半法;④同质法。(二)信度的影响因素要提高测验的信度,了解并掌握影响它的因素是十分必要的。信度的影响因素,主要来源于三个方面:即测验内容、被测对象和施测过程。1.测验内部因素(1)测验的长度,由于测验是测量的一个样本,因此取样的适当性必然影响到测验的信度。(2)测验难度。测验的难度和信度没有简单的关系。然而,如果测验对某团体过难或太易,则分数范围将缩小,信度也将降低。这表明,要使信度达到最高,能产生最广分数分布的难度水平方为合格。2.施测对象因素即使一个测验经过精心编制,题目取样具有代表性,由于受测者动机和焦虑的变化,也会给测验信度带来影响,这是最难控制的因素。一般说来,恰当的动机,适度的焦虑会使人的兴奋性提高,注意力增强,提高反应速度,从而对测试成绩产生积极影响。适当的动机和焦虑水平是保证测验信度的必要条件,过强或过弱的动机和焦虑水平都不利于测验信度的提高。3.施测过程因素测验的环境条件如通风、室温、采光等条件会影响到测试的稳定性,室内燥热、考场周围嘈杂,座位拥挤、考试秩序混乱等都有会导致测验信度下降。主试错误理解指导语,不按规定严格施测,或故意制造紧张气氛等也会影响测验的信度。二、测验的效度(一)效度的涵义测验的效度指的是测量的正确性和有效性,即它可能测出所要测量的心理特征和行为特征的程度。它是科学测量工具最重要的质量指标。效度不是绝对的,而是相对的。任何一种测验只是对一定的目的来说是有效的,对其他目的和用途却不一定有效。另外,由于测验是根据行为样本对所要测量的目标作间接推断,因此效度只能达到某种程度,不可能全有或全无。(二)效度的类型考察效度的方法很多,根据其侧重的问题不同,可将测验的效度分为三类,即内容效度、构想效度、实证效度。1.内容效度内容效度是指测验题目对有关内容或行为范围取样的适当性,也就是测验所选的项目是否符合所要测量的东西,其代表性是否适当。编制具有较高内容效度的测验,须注意两点:第一、要有一个定义完好的内容范围,即对测量目标应有一明确的界定。第二、测题对所界定的内容范围应是代表隆取样,也就是说要根据教学内容和教学要求的重要范围选择题目,以便使选出的题目能包含所测内容范围的主要方面,并使各方面题目的比例适当。鉴定学绩测验的内容效度最有用的方法是,请有关学科专家和有经验的教师对教学大纲和教科书作全面的考察,并与测试题目作系统比较,看测验题目是否适当地代表了所规定的内容。2.构想效度构想效度指测验对某种理论的合乎程度,其目的在于用心理学的理论观点对测验的结果加以解释及探讨。要建立具有构想效度的测验,必须先从某一理论出发,导出与这一理论构想有关的基本假设;据此设计和编制测验;然后由果溯因,审查测验结果是否符合特定的理论见解。检验构想效度的方法很多,比较简单和常用的方法有以下几种:一是利用测验的内容效度;二是将测验结果与另一个效度已知的且具有较高构想效度的同类测验结果进行相关分析。如果相关高,说明所编制的测验具有一定构想效度。3.实证效度实证效度又称效标关联效度,指测验对处于特定的情境中的个体行为进行预测的有效程度。一个测验预测得越准确就越有效。其中被预测的行为是检验效度的标准,简称效标。根据效标资料搜集的时间,实证效度可分为同时效度和预测效度。前者与用来诊断现状的测验有关,后者与预测将来结果的测验有关。检验测验的实证效度,最主要的难点在于找到合适的效标。好的效标应该是有效的、可靠的、客观的、实有的。实证效度一般可通过考察测验分数与效标的关系来确定的。常用的方法是求得两者之间的相关系数。相关系数高,说明该测验实证效度高。三种效度之间有着一定的内在联系:内容效度和构想效度既是实证效度的保证,又要得到实证效度的支持;考察内容效度和实证效度可以帮助确定构想效度;用于测量某种构想的测验可以作为实证效度的预测来源使用。总之,内容效度、构想效度和实证效度既相互区别,又相互联系。根据不同的需要,一个测验可以采用不同的效度。信度和效度都有是鉴定测验质量的指标,但两者并不是完全一致的。一般而言,效度高的测验,其信度也一定高;信度高的测验,其效度不一定高。也就是说,高信度是高效度的必要非充分条件。三、项目难度与区分度信度和效度是就整个测验而言的,难度和区分度则是就测验题目(简称项目)而言的。每个测验都包含有许多项目,每个项目都有它的难度和区分度。(一)项目难度项目难度指测验题目的难度程度,通常以答对或通过该项目的人数占应试总人数的百分比来表示。也就是用通过率来表示难度,通过率越高,难度越大。对于不同的测验题型,其计算有所不同。至于项目的难度多高合适,则取决于测验目的。总之,对项目的难度特征进行分析时,应考虑到测验的目的,不能一概而论。一般在0.3—0.7之间为宜。(二)项目区分度区分度又称鉴别力.是指试题对所要测量的心理特性的识别程度也就是项目的效度。因此项目效度越高,其区分度越大;鉴别力越强。但对于不同的测验题型,其计算也有所区别。总之,信度、效度、难度和区分度是鉴定测验质量的客观指标。一个良好的测验必须既有较高的信度又有较高的效度,并且每个项目都有一定的难度和区分度。广大教师在编制教学测验时,应该综合考虑这些要求。第三节教学测验的类型及应用一、常用的教学测验(一)标准化测验标准化测验是指在测验项目的选择,测验过程、评分手续及评分标准方面都是经过标准化的测验。标准化测验大多经过预测,它不仅规定了测验项目及项目的标准答案,并且规定了测验的指令、时间限制,测验情境,答题方法等等,使所有被试都有相同的被测条件。此外,许多标准化测验还为使用者提供根据标准化样组在测验中所取得的常模,供使用者解释测验得分时进行比较,使测验得分具有意义。标准化测验在计分方法上也有许多明确的规定,以减少评卷计分产生误差。它是评价学生学业成绩的重要工具之一。(二)教师自编测验教师自编的测验在学校中使用十分广泛,这是因为教师可根据教学过程不同阶段的不同任务,确定测验的不同目的,编制不同的测验。根据测验项目的形式教师自编测验可分成论文式测验与客观性测验两种:1.论文式测验,也叫传统测验,在我国各级各类学校中使用较为普遍。论文式测验一般题量不大,较容易编制,学生答题时,没有可供选择的答案,可以避免学生凭猜测作答,因此答案可以反映出学生对该问题所涉及的知识的记忆与理解的程度,思维水平,言语组织能力与表达能力。对于论文式测验的批评主要是由于它存在以下缺点:首先,测验项目相对较少,因而试题取样不广,缺乏代表性,对学科知识的覆盖面差,因而影响测验的效度;第二,论文式测验缺少统一的评分标准,评分费时费力。由于评分者主观因素的影响,使评分缺乏准确性与可靠性;第三,论文式测验,学生答卷时,花在构思言语表述方面的时间较多,可能影响学生对问题本身的充分解答;第四,论文式测验测验题目较笼统,答案范围指示不明确,使学生的答案不能符合测验项目的要求。2.客观性测验:客观性测验是仿照标准化测验编制的测验。客观性测验的题目形式主要包括多项选择题、是非判断题、匹配题、填空题,简答题、分类题、改错题等等。客观性测验的优点是测验项目较短,整个测验长度大,保证了取样广、代表性强;答案标准明确而固定,评分客观,评卷迅速。测验的得分还可以与标准测验及当地常模(团体平均分)进行比较,对得分进行解释。客观性测验也存在着缺点,主要是这种测验的编制难度较大,需要编制者有一定的水平及技巧。测验注重考察学生对知识的再认与回忆,在一定程度上限制了自由发挥,难以考察学生的思维能力与理解水平。此外,在学生作选择题时,有凭猜测作答的可能性。总之,论文式测验与客观式测验各有利弊,教师在使用时,应根据测验的目的及考试学科的特点选择采用。二、学业成绩评价的类型从不同的角度,根据不同的标准可以对学业成绩评价作不同分类。(一)相对评价、绝对评价和个人内差评价根据评价时的依据的参照点不同,可以将学业成绩评价分为相对评价、绝对评价和个人内差评价。1.相对评价相对评价即常模参照评价,是指评价时以学生所在团体的平均成绩为参照标准(即常模),根据其在团体中的相对位置(或名次)来报告评价结果。这种方法可以表明某一学生的得分在整个考生群体中所处的位置。相对评定的优点是可以通过Z分数与百分等级使学生间相互比较,从而辨别学生间的成绩差异,在限额选拔的测验中,特别适用。但是由于相对评价是建立在学习成绩的分布呈正态分布的假设的基础上,如果班级人数很少,或者以掌握为目标的学习测验就不适用。相对评价的另一优点是,这种评价是建立在与他人比较的基础上,所以特别容易激起学生的竞争动机,而伴随这一优点而可能产生的弊端是容易引导学生争名次。2.绝对评价绝对评价就是标准参照评价。是基于某种特定的标准,来评价学生对与教学密切关联的具体知识和技能的掌握程度。这是与完成教学目标的程度相对照所进行的评价。绝对评价—般要依据教学目标确定合格与不合格的标准。绝对评价的优点是根据分数评价,可以了解学生达到目标的情况,并根据需要进行指导,绝对评价还可以减少由于竞争心理而带来的自卑感与失败感。但其缺点是目标的制定与达到具体目标的标准较难掌握。此外,也难以完全杜绝竞争心理及由此而导目前,有许多专家主张把相对评价与绝对评价结合起来使用,使两者相容并互补。3、