《教育评价学》教案第一讲教育评价的历史反思教育评价起源于中国,发展在美国。反思教育评价产生与发展的历史,可以帮助我们更好地理解现代教育评价理念。一、教育评价研究的历史发展(一)目标分析研究时期(1933——1958)如前所述,随着教育测验运动的不断发展,人们认识到了教育测验的一些不足,如不能对人的全部进行测量。并且当时美国爆发了大规模经济危机,青少年市区工作纷纷涌进中学,而当时的课程设置主要是为了升大学,不适应社会和失业青年的需要。于是以泰勒为首的教育评价委员会经过八年研究,制定出一套评价目标达成程度的标准和方法。他们把评价过程划分为四个步骤:(1)确定教育目标;(2)设计评价情景,主要依据预先规定的教育目标;(3)选择和编制评价工具,必须使这些工具能够引发出教育目标所期望的那种行为;(4)分析评价结果。(二)多方位研究时期(1958——1980)在苏联1957年第一颗人造卫星升天之后,美国大为震惊。1958年,美国颁布了《国防教育法》,特别拨出专款来研究评价数学、自然科学、外语等课程的改革效果,于是教育评价的研究盛行起来。1、行为目标评价。其代表人物有克拉斯奥尔、哈罗和波帕姆等,主要是对前一时期泰勒和布卢姆教育评价方法的进一步完善与发展。这一评价方式和方法被称为目标评价模式。2、决策评价。这是60年代后期兴起的一种教育评价方法,斯塔弗尔比姆是这一方法的主要奠基者。他认为:“评价最主要的意图不是为了证明,而是为了改进。”教育评价不应单纯地以教学目标为中心,应以决策为代表的社会为中心,评价应为决策服务,为决策收集、组织、分析和报告有用信息,使这些信息通过决策者的决策产生社会效用。评价是“为决策提供有用信息的过程”。3、系统分析评价。这是里夫林在60年代提出的,他试图将系统理论的原理运用于评价领域,主张从系统的机能失调或存在的问题出发,有针对性地提出改革方案,强调用实验设计的方法去编制改革方案,把数量分析和计算机运用于评价中,运用几个定量的输出测量值与方案的差别来评价改革方案。4、目标游离评价。这是斯里克文在1972年提出的一种评价。他在评价的实践中,日益感到传统的预订的评价使评价者只注意到与预定目的有关的效应,而忽略了其他方面的负效应。事实上,有些方案虽以典型的方式实现了预定的目的,但常因产生有害的负效应而告吹;有些方案虽然在达到预期结果方面成效甚微,但却因取得了重要的没有预期好的负效应而被采用。因而,评价不能单纯依据预期的目的,而应把目的与负效应结合起来,以方案的实际效应来进行评价。所以有人称之为无目的评价。5、应答评价。这是斯塔克1975年提出的一种评价方法。这种方法的主要特点是强调评价要为一切与评价有关的人员提供有用的信息。他界定为:“如果教育评价更直接地指向方案的活动而非方案的内容,如果他能满足评价听取人对信息的需求,或者在反映方案得失、长短的评价报告中更能反映人们不同的价值观念,那么,这种评价即可称为应答评价。”应答评价不像其它评价方法那样先确定评价目标或先建立假设,而是首先确定评价问题,并在问题的基础上制定评价计划。6、阐释性评价。这是1972年帕洛特和汉密尔顿提出的。它是基于传统的评价方法侧重于定量分析,不能说明和解释方案实施过程中的复杂现象的性质以及为什么存在这些问题,从而提出了阐释性评价方法。他们从教育实际出发,注重从整体上把握评价对象,强调对评价过程中的复杂现象加以解释,说明这些现象与周围事物之间的关系、产生的原因与它们之间的因果关系。7、CSE评价。这个名字来源于加利福尼亚大学洛杉矶分校的评价中心。认为评价分为五个阶段:(1)与一种特定的决策相联系,以确定教育的需要和目的;(2)与教学大纲的选择相联系,即选择可以用来弥补已发现差距的教学大纲;(3)评价者提供教学大纲按计划执行情况的信息,任何偏离都必须加以注意;(4)评价者要注明教学大纲各个部分的相对成功率,帮助人们克服不足之处;(5)确定目标实现程度的信息,帮助决策者决定是否要对教学大纲加以修正、撤销、保留或推广。8、费用——效果分析评价。这是列文1981年提出的。他认为,采用和实行某种方案,必须同时考虑它们所需的费用和产生的效果,以费用少、效果大的方案为最好。费用效果分析必须满足两个条件:一是存在备择决策;二是每种备择决策既有费用分析,又有效果评价。此外,还有艺术鉴定评价、对手评价等,在此就不再一一学习。(三)成为独立学科时期(1980——)随着教育评价活动的广泛开展和教育评价研究成果的日益丰富,整理评价研究成果、统一评价思想、培训评价工作人员以提到历史发展的日程。美国在80年代以来,已在许多大学开设了评价课程,如斯坦福大学、波士顿学院、洛杉矶加利福尼亚大学等,都给研究生开设了评价课程。美国还在各地成立了评价研究中心,如洛杉矶加利福尼亚大学评价研究中心、斯坦福评价联合会、伊利诺斯大学的教学研究和课程评价中心等。在这一时期,美国出现了一种自称“第四代教育评价”的教育评价理论,它是由印第安大学教育学院教授枯巴和维德比尔特大学副教授林肯创立的。他们把教育评价划分为四个发展阶段:第一阶段是“测量”理论的形成和大量运用为标志,时间在1900——1930年左右,是“测量时代”;第二阶段是以泰勒为首的“八年研究”为标志,以对测量结果的描述为特征,时间在1930——1940年前后,是“描述时代”;第三阶段是以“判断”为评价理论的特色,时间在1950——1970年,是“判断时代”;他们把自己的评价理论构建称之为“第四代教育评价”,1989年出版了名为《第四代教育评价》专著。目前世界各国对教育评价都很重视,教育评价研究已经发展成为教育三大研究(教育理论研究、教育发展研究、教育评价研究)之一。二、教育评价的特点(一)在评价的目的上,强调促进教育的发展。(二)在评价的过程上,注重自评方法的应用。(三)在评价的方法上,重视定性与定量的结合。(四)在评价的内容上,重视立体评价和全面评价。(五)在对待评价结果上,重视全面的解释和慎重的处理。(六)在评价的手段上,强调科技与智能化。(七)在评价的目标上,实行多元化与整合化。(八)在评价的取向上,注重个性与差异性。三、关于教育评价本质的争论及其分析(一)关于教育评价本质的争论1、泰勒的评价观教育评价就其历史发展来说,它的起源与对学生学力检测测验活动的发展有着紧密的联系。在19世纪下半叶和20世纪最初的30年,教育工作者在对学生学力测验的研究和教育成就量化、客观化、标准化方面取得了很大成绩。但是由于当时测验都是围绕教科书,以教科书为中心编制的,测验的内容只是要求学生记诵教材的知识内容,是很片面的,并不能反映学生的发展和他们的实际需要。在这种情况下,美国俄亥俄州立大学教育科学研究所教授泰勒受卡内基基金会的资助,于1934年开始历时8年,进行课程与评价的研究,这就是教育评价史上著名的“八年研究”。在尖锐批评以往的课程和测验设计的基础上,泰勒提出了一套以教育目标为核心和依据的课程测验编制的原则,试图以此把社会的要求、学身的需要反映在课程与测验中。为了把这一思想与早期的测量区别开来,泰勒和他的同事正式提出了“教育评价”的概念。泰勒说:“评价过程实质上是一个确定课程与教学计划实际上达到教学目标的程度的过程。”2、克龙巴赫的评价观自20世纪30年代以来,泰勒的评价理论一直占据着主导地位。虽然泰勒在其描述中很强调评价应借助信息的反馈,帮助教育者达成预期的目的。但是,由于泰勒的目标的概念与结果的概念紧密相关,这就使人们更易于把注意力集中到对结果的评价上。因此,人们更多地把泰勒的评价看成是一种对结果的总结性评价。客龙巴赫认为,用于改进工作的形成性评价的作用,远比总结性评价重要得多。他强调:“评价能完成的最大贡献是确定教程需要改进的方面。”并把评价广义地界定为:“为作出关于教育方案,收集和使用信息。”3、斯塔弗尔比姆的评价观斯塔夫尔比姆的评价观,也是出于对有人把评价仅仅看作“对不法行为所做的严密调查”而提出的,因此与克龙巴赫的评价观有很大的一致性。他强调:“评价最重要的意图不是为了证明,而是为了改进。”为此,他在1969年对评价进行了重新界定:“为决策提供有用信息的过程。”在1978年的一篇未公开发表的论文中他重新界定为:“为满足决策和教育效能核定的需要,描述、获得和运用有关客体的目的、计划、过程和成果价值的过程。”到1985年,他进一步提出:“评价是一种核定、获取和提供叙述性和判断性信息的过程。这些信息涉及研究对象的目标、设计、实施和影响的价值及优缺点,以便指导如何决策,满足教学效能核定需要,并增加对研究对象的了解。”4、美国教育评价标准联合委员会的评价观。受斯塔弗尔比姆评价观的影响,这个由12个于教育评价有关组织的联合机构,在1981年对评价作了一个简要的界定:“评价是对某些现象的价值,如优缺点的系统调查。”(二)教育评价本质争论的主要问题教育评价概念发展的历史表明,人们对评价的理解,始终同对教育评价的基本目的和功能的理解联系在一起的。因为,从克龙巴赫开始,教育评价学界就试图突破把评价仅仅看作总结性评价的狭隘观点,强调了形成性评价在教育评价中的作用。然而在这一争论中,涉及到一个重要问题:平价是否属于一种价值判断的过程。由于总结性评价更多地和对教育结果的判断联系在一起,因此,在反对把评价仅当作总结性评价的时候,克龙巴赫气质鲜明地拒绝把评价仅看作一种判断过程。因为:1、“一个表明判断性的定义,也许会引起潜在评价者的许多忧虑和评价对手们的抵制。”相反,如“为决策提供信息”也许会更顺利地被评价者和使用者采用。2、一个判断性的评价要确定判断的依据。在西方有的教育流派认为,教育乃是个人自我实现的过程,个人就是自己生活的创造者,因此,用一个统一的价值标准去限制个人的发展,去评价教育的结果,从根本上来说是不可接受的。并且判断的标准也是难以达到科学化。四、教育评价的概念(一)什么是教育评价教育评价是美国的教育家泰勒在1929年首次提出的。但由于人们看问题的角度、方法不同,更由于教育评价在理论和实践上都处于探索和研究阶段,对教育评价至今还没有形成一个确切的、严谨的、被一致接受的科学定义。但认为至少包括以下三个方面的特点:一是教育评价是一个活动过程;二是教育评价是有目的有计划的活动过程;三是教育评价活动中的评价者与被评者是统一的;四是教育评价注重对资料的解释,不仅仅是资料的收集;五是教育评价是一种反馈—矫正系统;六是教育评价要涉及到对教育价值的判断,不仅仅是对教育情景或现象的描述。定义:教育评价是对教育活动满足社会与个体需要的程度作出判断的活动,是对教育活现实的或潜在的价值作出判断,以期达到教育价值增值的过程。(二)与教育评价密切相关的几个概念1、教育评价于教育测量测量在一般字典上被定义为“对….赋予一个数值”。教育测量就是用某些规则或程序给被测个体的某些属性分配数值,从而使这些数值代表着些属性的量。教育上所关心的很多智力项目或其他变量,必须用间接的方式测量。测量很少是为了自身的目的而进行,它可以包含在一项评定或评价之中,更多地被看成是一种基本的研究手段。正因为如此重要,产生了心理测量学、教育测量学。(1)教育测量不同于教育评价测量是查明事实真相,而评价是对事实进行价值判断。在教育上,要了解学生的学习情况,用量表实施并以分数表示,这是测量。通过对测量结果的分析、指出问题,促进学生的发展是评价。(2)教育测量是教育评价的基础因为教育测量常常作为教育评价的第一步出现,教育评价常常是根据教育测量的结果进行的,教育评价是教育测量的深化。2、教育评价与教育评定评定一词一直是用于对人,它包括分等、考试、证明合格等。我们可以评定学生学习某门课程的成绩,可以对某人的职务履行情况进行评定。在美国就有一个庞大的监测机构——全国教育进步评定协会。(1)教育评定不同于教育评价教育评定和教育测量一样,其目的在于说明真相,它是对人或人的群体某些属性较为系统、全面地描述,因此它只是在说明真实情况,而不进行价值判断,不对被评对象提出建议和咨询,只是得到确切的资料和结果。(2)教育评定是教育评