表现性评价的利弊及其启示张咏梅、孟庆茂这份资料节选自张咏梅、孟庆茂发表在《教育理论与实践》2002年第7期上的一篇文章,题为“表现性评定及相关问题”。在选编过程中,我们将文中的“表现性评定”都改为“表现性评价”,以保持概念的统一。这是一篇理论性较强的文章,可以帮我们从更高层次上理解和认识表现性评价。表现性评价的应用在很大程度上会对高中的教学产生积极的导向作用,有利于素质教育的实施与推进,但如果使用不当,没有扬其长避其短,还可能对当前的教学与评价产生某种消极的影响。一、表现性评价的优势表现性评价受到众多的欢迎,与选择测验相比,其优势主要体现在以下几个方面:(一)有助于测查高级思维能力表现性评价有助于更直接、更真实地考查学生的学习结果,特别是高级思维能力,这一点已为倡导表现性评价的国外教育学或测量学专家所认同。我国学者黄光扬也提出表现性评价能较好地展示学生的口头表达力、文字表达力、随机应变力、想象力、创造力、操作演示技能。但是,我们认为那种将学生在标准化选择测验中成绩的取得看作是完全建立在以高级思维为代价的对于孤立知识的记忆上观点,似乎也有失公允,因为客观化的选择测验并非完全不能测查高级思维能力。许多研究者指出,两种方法很难说哪一种更优?只是他们测量的层面不同。具体运用哪一种,视评定的目的、需要来定。美国教育心理学家布鲁姆曾将认知领域的教育目标划分逐渐升高的六个层次,分别为知识、领会、运用、分析、综合与评价,这六个层次同时也是我们进行评价的理论依据。我们认为与选择测验相比较,表现性评价在测查高级思维能力即运用、分析、综合与评价方面的优势是极为明显的;而就知识与理解层面如对知识与领会的考查而言,标准化选择测验的优势又不言而喻,两种形式缺一不可,可互为补充,相得益彰。(二)有助于测查综合运用所学知识解决实际问题的能力传统标准化测验之所以受到批判还在于其是对知识与能力的间接测量,造成测验情境、内容与现实生活不相符合,测得的结果往往与实际生活相脱节。表现性评价优势则在于此,它强调在模拟真实或完全真实的情境中运用所学的知识解决实际问题,它反映的是问题解决与学习的真实面貌。课程与测量专家认为将建构完好的表现性评价,嵌入一个真实的、可引发人兴趣的场景中,将会给学生们提供一个其运用所学知识于真实实践的机会,唤起复杂的认知行为。值得一提的是,重视培养和考查学生综合运用所学知识解决实际问题的能力是近些年来许多国家实施考试改革的特点。课程标准与考查形式都十分强调学生特别是高年级学生应当把学科的学习与其他学科联系起来,鼓励学生把新学的内容与社会、政治、经济和环境相结合,强调知识的实际应用。我国在此方面也进行了许多尝试,近年来我国高考综合能力测试方案的提出与实施就是这种趋势的一种集中体现。(三)有助于优化教学过程,使学生的潜力尽可能得到发展日常教学中的表现性评价应是教学过程不可分割的一部分,特别是处于当前时期。教师在教学过程中不断采用此种方式,给予学生充分展示的时间与空间,来说明自己对于知识技能的掌握与运用情况。在此过程中,不仅可以给予学生们及时性、鼓励性与适性性反馈,还可以采用合作学习等诸多形式。由此可以看出,表现性评价在校内评价中一方面可以整合教学过程,另一方面优化与促进教师教学与学生成长。我们认为理想的教学应促进学生表现的变化性,那么不难看出采用表现性评价的教学中,这种变化确定无疑会增长。在此过程中,也评价本身的功能从只重视掌握结果向既重视掌握结果又重视发展过程转变,从教学的检验者向教学的促进者转变。(四)有助于激发学生的学习动机,为终身学习打基础在日常的校内评价中,当教师以作品集、轶事记录、展览、报告等表现性评价的形式汇集学生成长点滴的时候,当学生从“自己能做什么”中体会到成长的快乐时,就会感到表现性评价多么富于建设性。它为学生创造一种积极的学习氛围和积极的自我形象,增强了他们对于自己的信心,使得他们对于学习具有浓厚的兴趣及责任感,从而来鼓励了进一步的学习,并最终促进终生学习。这一点对于当前的儿童更为重要,因为与三、四十年前的儿童相比,现在的儿童将要生活在一个要求更为复杂、巧妙的思维形式的世界中,他们必须不断地去学习新的知识与技能,不断地面对并解决新的问题,而这些都以积极的学习动机为前提。二、表现性评价的不足表现性评价以其接近现实、突出个性的鲜明特征有时也被称作真实评定,这种称谓具有一定的迷惑性,似乎就是对作业、表现进行真实的测量。实际上,在运用的过程中,许多测量学家对其提出置疑,问题主要集中在以下四个方面:(一)信度问题对于表现性评价的信度问题置疑最多的是评分者信度。评分者信度是测量两个或两个以上的评分者对于某领域内一个或多个行为观察后评判的一致性程度。由于评分过程中,表现性评价标准的执行可能存在很高的主观性,所以测量专家对这种信度格外关注。来自于许多研究所报告的具体分值之间存在很大的差异,但都处于较低的水平(0.6)。有研究(Dunbar、Koretz&Hoover,1993)表明,通过对评分者进行认真训练及制定评分规则,评分者信度可以提高,并提出与经典测量理论不同的计算公式。与此相比,对于重测信度则较少受到关注。有些测量专家指出,重测信度低于评分者信度。我们认为这可能是由于表现性评价任务的高度特殊性,实际的任务情景设置、评定方法等导致在表现上的变化所造成的。这些问题可以通过增加在评定任务数量比及增加评分者人数进行适当解决。(二)效度问题心理与教育测量中,效度是另一个经常运用的指标。表现性评价效度问题集中在表面效度、结构效度方面。表现性评价具有高表面效度是公认的,从而提高了公众对于评定的接受性。但是,仅有表面效度远远不够,我们更关注的是评定本身的结构效度。结构效度是指测验对某一理论或特质测量的程度。对所要测量的理论或特质进行准确的界定是任何测量的前提,这正是表现性评价遭受批评最多的地方。教育测量专家提出(Popham,1993),在研究表现性评价的效度问题时,必须认真地考虑需要评定的领域,是否对其进行完好界定、进行完好抽样、是否可以通过抽样来对整个领域进行推论?由于表现性评价花费时间长,所以与以多项选择题为代表的标准化测验相比,题目较少,因而,结构效度问题更为重要。许多研究者认为许多表现性评价是任务驱动型而非概念驱动型,并尖锐地指出一些测量的实践者只集中注意于“特定表现”却用“概括的语言”来推论分数的意义,从而忽视领域的覆盖性及类推性问题。Haerte(1992)则针对此问题,提出可以通过调查学生实施任务时所经历的过程来加强表现性评价的结构效度的研究,例如在评定期间让学生谈论任务,或运用任务后座谈的方法来探究完成任务所运用的技能。也有研究者(Linn,1993)主张为了提高类推性,必须增加任务并保证对于领域的综合覆盖,建议评定时必须采取结构性强的任务与结构性不强开放性任务相结合的方式。(三)实用性问题与有着宽覆盖面、容易评分、造价低廉的标准化选择测验相比,表现性评价覆盖面较窄、提供关于特定技能或领域的多维度信息,评分过程十分繁琐,且造价高昂。因此从传统意义上来讲,表现性评价实用性较差。尽管表现性评价存在着上述问题,但我们还是以发展的眼光来看待它,并从理论与实践中努力探索解决问题的方法,使其不断地完善。三、表现性评价对当前考试及评价改革的启示我国正处于前所未有的教育大变革时期,这将是一场涉及教育观念、教育体制、用人机制的深刻变革,其根本目的在于实施素质教育即培养具有创新精神和实践能力的高素质的人才,考试与评价的改革只是这场变革对于教学评价领域的渗透。表现性评价的兴起不仅丰富了现有评价与考试的方式与手段,还给我们带来很多思考与启示:(一)树立正确的评价观念,逐步实现从“考试观”到“评价观”的过渡从标准化多项选择测验(test)到表现性评价(assessment)的转变,并非仅仅是形式上的转变,更是一种观念上的转变,是从“考试观”到“评价观”转变。当今的考试已成为一种社会现象,涉及方方面面,但考试本身并不是评价,而是评价的手段,只为评价提供量化资料。只有当评价的主体运用一定的价值观综合解释考试所提供的资料、判断评价对象的实际水平达到何种程度时,这才构成评价。可以看出,评价是以价值观、定量、定性的资料及多种评价方式为前提的。当前,教育资源十分有限,我们往往只以考试分数为指标对学生质量、教学质量及学校办学绩效进行评价,教育教学的成功或失败只以考试分数来说明。在教育改革的用语中,提高考试分数与提高教育系统质量也仿佛是同义词。这种将考试当作评价,与真正的评价观相背离的做法又怎么会不造成“应试教育”的局面?在推进素质教育、培养具有创新精神和实践能力的高素质人才的进程中,必须尽快地转变这种观念,将各种可行的评价方法创造性地运用于学校教学及人才选拔过程中去,全方位地对于学生进行评价,积极尝试、勇于探索,实现观念与实践的根本转变。(二)尽快建立包括表现性评价在内的多元化评价系统“多元化”既指知识与能力的多重性,又指评价手段的多样化。一个测验质量再高,也难以完全测查出学生的真实水平。一种评价方式再有效,也难以对学生的能力进行全面的测查,况且智力本身就是多维度的。美国心理学家Gardner认为人至少拥有七种智力:语言、数理逻辑、视觉空间、身体运用、音乐节奏、人际与自我等。每个人在智力的发展方向及水平方面存在着个别差异。因此我们认为以单一的评价方式、从单一的维度来评定学生的成就与能力是不科学的,也无法使学生们感受到学习与成长的快乐与动力。只有超越单一的评价模式,集中多元评价于广泛的能力范围之内,反映技能发展的多重维度,并根据需要与实际情况,建立包括表现性评价在内的多元评价系统,即以多重变通的方式来展现特定学习内容的表现、呈现学生的成长,如生态评定、档案评定、动态评定、形成性评定,甚至是以多项选择题为代表的标准化测验,让这些评定手段相互取长补短,相得益彰,赋予学生在各方面学习的完整写照,才有助于素质教育的真正实施,让学生们从学习中找回信心。与此同时,多元化评价体系应有助于增加学生间个别差异,用测量用语来讲就是“在提高平均数同时也增加了标准差”。(三)发挥评价对于教学的促进作用,为课堂教学评价提供新的思路表现性评价应用集中于两个领域,一是大模型的测验领域;二是课堂教学评价领域。比较而言,表现性评价在课堂教学评定领域的优势更为明显。学校不是跑马场而是培养学生各种能力、教会学生如何学习、如何思考的地方,所以重要的不是通过课堂教学与评价进行“谁好、谁坏、谁快、谁慢”的判断,而是将评定作为促进学生发展,培养学生才能的手段。目前,国家与各省市的基础教育课程改革已进入实施阶段,这意味着今后的课程将更加系统化,更加社会化、生活化,更加个性化、多样化,那么与此相对应的评价方式也必然要发生变化。美国六十年代课程改革的受挫经历已经明确地告知我们,评价方式的改革本应是课程改革的一部分,必须与课程方向的变化相符合。否则,将旧的评价方式运用于评定当前我国基础教育课程改革的成果就仿佛以一把旧尺子来衡量新事物,结果只能是失败。以表现性评价为代表的许多新评价方式由于其天然的侧重实践能力与高级思维能力考查的特点终将成为今后学校课堂教学评定的主流。在接受表现性评价这种新型的评价方式的同时,我们虽然认识到考试与评价的改革将对课程与教学产生重要的导向作用,但后者的改革仍旧为“本”。如同标准化测验一样,以表现性评价为代表的新评价方式将会对课堂教学产生重要的导向作用是不言而喻的,但是如果这种导向是指向对高级思维技能、创新精神及实践能力的提高,指向于对学习过程的重视而不仅仅是分数的重视,那么就是成功的。需要清醒认识的是,表现性评价并不是治疗现在应试教育的良方,如果其对于课堂教学的导向性作用表现在“为任务而教”,则无疑又会产生新一轮的应试教育,将课程与教学改革引入歧途。仅仅以表现性评价或其他形式的新题目来代替以多项选择题目为代表的标准化测验并不是解决应试教育的根本办法。表现性评价虽然是当今潮流,并不意味着可以用表现性评价代替一切,充诉各种评价与考试。表现性评价虽然具有许多优势,但是也还存在着许多有待于解