第七章教学评价一、教学评价的概述1、教学评价的定义评价、评估与教学评价的含义评什么?谁来评?依据什么评?考试(examination),是指由主试根据一定社会的要求,在一定场所,采取一定的方式方法,选择适当的内容,对应试者的德、学、才、识、体诸多方面或某一方面进行有组织、有目的测验和识别的活动。测验(test),是指在相同的条件下,通过施测同一套问题来测量一个行为样本的工具或系统的方法。学生学习评价(Evaluation)与评估(assessment),是指在系统、科学以及全面地搜集、整理、处理和分析学生信息的基础上,评定学生个体学习与发展质量。教学评价教学评价是一种在收集必要信息的基础上依据一定标准对教学系统进行价值判断的活动。它既是教学工作的一个环节,也贯穿在教学活动之中。教学评价是对教师的教与学生的学相统一的教学活动收集事实信息并进行价值判断的过程。换言之,教学评价一般包括对教学过程中教师、学生、教学内容、教学方法手段、教学环境、教学管理等诸因素的全面评价,但主要是对学生学习状况和教师教授质量的评价。2、教学评价的历史发展古代考试。传统的考试时期(20世纪前)科举制(606—1905)。特点:以人才选拔为主教育测量时期(1905—1930)。桑代克。间接测量、量化评价。常模参照评价教育评价时期(1930~)。目标中心时期(1930~50年代中叶)泰勒。依据教育目标进行评价,描述教育结果与目标的一致性;准则参照评价标准研制时期(20世纪50年代中叶—80年代末)根据布卢姆的教育目标分类学说,研制评价标准,重在分析教学方案、方法的优点、价值;提出评价是为了改进(形成性评价)。结果认同时期(20世纪80年代—今)关注评价结果的认同问题,提出“让被评价者最大程度地接受评价结果,就是评价的最大效益”;关注评价的过程,重视评价双方在评价进行中的沟通、理解和让步;提出评价内容多元化,重视个体化目标和评价对个体发展的建构作用,又称为“个体化评价时期”。一、传统测验及其问题(一)评价的早期发展1.传统考试阶段科举考试(606年)大学考试口试(1219年)中学在1599年采用笔试论文式的毕业考试1787年法国文官考试制度(1791年)2.教育测验阶段1905年,桑代克:“凡存在的东西都有数量,凡是有数量的东西都可以测量”。1909年他又发表了“书法量表”。桑代克被称为“教育测验之父”,他拉开了美国教育史上著名的测验运动的序幕。桑代克的弟子斯通制定出了“算术标准学力测验。3.教育评价阶段1933年,美国“进步教育协会”发起了著名的“八年研究”,旨在从根本上改革美国中学的课程。1942年评价委员会发表“史密斯-泰勒报告”,第一次系统地提出了评价的基本思想和方法,从而奠定了现代教育评价的基础。泰勒认为,评价必须建立在清晰地陈述目标的基础上,根据目标来评价教育效果,促进目标的实现。二、教学评价的类型1、以评价作用为依据的分类:诊断性评价、形成性评价、终结性评价案例:小王和小李是同班同学。英语单元考试,小王考了97分,小李考了87分。同学们私下议论说:“小王肯定又是第一,小李估计在十几名去了!”运用教学评价分类理论,你怎么看待?评价的解释标准以教育目标为参照以自身发展为参照以同辈为参照2、以评价标准为依据的分类:相对评价、绝对评价、个体内差异评价1.相对评价(常模式参照评价)相对评价是指以评价对象群体的平均水平或其中的某一对象的水平为参照点,确定评价对象在群体中的相对位置或与群体中某一个体之间的差距的一种评价。这种评价的优点是:不受集体整体水平的限制。其缺点是:判据会随集体的不同而发生变化,因而不同集体中的个体就难以比较。2.绝对评价(目标/标准参照评价)绝对评价是指在评价对象群体之外,以某一预定的目标或标准为客观参照点,确定评价对象达到标准绝对位置的一种评价。优点是:其标准比较客观,可直接鉴别各项目标完成情况,明确今后工作的重点。缺点是:其客观标准很难做到客观,在制定和掌握评价标准时,容易受到评价者的教育价值取向和经验的影响。3.个体内差异评价(自我参照评价)个体内差异评价是把评价对象群体中每个评价对象个体的过去与现在进行比较,或者把个体的有关侧面相互进行比较,从而得到评价结论的评价类型。优点是:有利于自我发现差距,但由于被评价者不与他人相比较,这就难以找出自己在群体中的真正差距。案例:小王在一中念高一,小李在三中念高一。英语考试,小王考了97分,班上排名第一;小李考了87分,班上排名第十。小李妈妈失望地说:“小李的英语能有小王那样好就好了!”运用教学评价分类理论,你怎么看待?3、以评价方法为依据的分类:定性评价、定量评价4、以评价主体为依据的分类:自我评价、外部评价5、测验根据编制、实施程序的标准化程度,可被分为标准化测验和非正式测验。6、测验按照题目类型的特点可分为客观测验与论述测验。三、教学评价的实施(一)教学评价的原则(二)教学评价的过程(一)教学评价的原则1.客观性原则2.科学性原则3.公正性原则4.可行性原则5.发展性原则。以未来为导向,有教育意义6.多元化原则。个人化小学生雷人爱情作文该打几分?(2008年12月7日《成都商报》)“她是一个很漂亮很朴实的女孩子,我很喜欢她,从第一次见面我就爱上她。……她住在我家和我一起睡,一天夜里她抱着我,我一下子被傻醒。……”这是摘自一篇题为《我对她的爱情》作文中的话,作者是杭州一所小学一名六年级男生,此文是在语文期中考试时写的。怎么评分?三种意见:四五十岁的老教师认为,文章的主题思想存在严重问题,应该零分处理;男孩的语文老师表示:“单从文笔上看,这是他有史以来写得最好的作文了。可以得分。”;校长认为,写出真情实感,可给90分。(二)教学评价的过程1、明确评价目的2、确立评价指标和标准3、收集评价信息4、分析评价信息5、反馈评价信息6、调整与改进四、教学评价的发展趋势1、我国教学评价实践存在的主要问题(1)评价内容——仍然过多倚重学科知识,特别是课本上的知识,而忽视了实践能力、创新精神、心理素质以及情绪、态度和习惯等综合素质的考查;(2)评价标准——仍然过多强调共性和一般趋势,忽略了个体差异和个性化发展的价值;不顾学生发展的多样性和不平衡性,将所有学生放在同一评价尺度上相互比较,一方面造成对学生的误评价,另一方面又严重挫伤学生的自尊心。(3)评价方法——仍以传统的纸笔考试为主,仍过多地倚重量化的结果,而很少采用体现新评价思想的、质性的评价手段与方法;(4)评价主体——被评价者仍多处于消极的被评价地位,基本上没有形成教师、家长、学生、管理者等多主体共同参与、交互作用的评价模式;(5)评价重心——仍过于关注结果,忽视被评价者在各个时期的进步状况和努力程度,没有形成真正意义上的形成性评价,不能很好地发挥评价促进发展的功能。2、教学评价的发展趋势(1)教学评价的功能从重视鉴定质量、区别优劣、选拔淘汰转向重视诊断、反馈、激励、改进(2)教学评价的着眼点,从教师教的怎么样转向学生学的怎么样(3)教学评价的多元化趋势(4)从注重纸笔测验的传统评价走向真实性评价(5)教学与评价融为一体,重视过程评价与结果评价的结合五、学生学业成绩评价(一)教师自编测验(二)标准化考试(三)日常考查与学生评语改革(四)学生评价的新方法(一)教师自编测验纸笔测验:客观性试题与主观性试题客观测验主要包括——反应类型:填空题、完形填空题——选择类型:是非判断题、多项选择题、匹配题等。主观性题目主要包括——名词解释、简答题、论述题、作文题、材料分析等客观性题目有唯一的正确答案,对学生的反应有严格的限制,评分规则清楚明白、容易掌握,对答案的评分比较客观。客观性题目编写时难度较大,但评分时比较简单,评分的信度高,也可以有较高的区分度。客观性题目能够大量取样,大范围覆盖学习内容,因此可以对学习效果进行较全面的考查。客观性题目一般能考查事实性知识的记忆,在精心设计编制的前提下也能考查记忆、分析、鉴别、推理、理解、判断和应用知识的能力;但由于答案固定,无法测量组织材料的能力和创造力。主观性题目主观性题目没有唯一的或标准的答案,允许、鼓励学生自己组织、表达各种材料和观点,对学生的反应没有严格明确的规定,因而学生的反应是开放多样的,而评分规则一般比较模糊,可操作性不强,评分的主观性、随意性比较大。主观性题目不可能数量过多,只能检查几个重点内容的学习效果。主观性题目非常适合考查学生分析、综合、应用知识的能力、创造能力,以及组织表达观点和写作的能力。非常适合考查学生分析、综合、应用知识的能力、创造能力,以及组织表达观点和写作的能力。能考查事实性知识的记忆,在精心设计的前提下也能考查记忆、分析、鉴别、推理、理解、判断和应用知识的能力;但由于答案固定,无法测量组织材料的能力和创造力。题目数量比较少,只能检查几个重点内容的学习效果能够大取样,大范围覆盖学习内容,可以全面考查学习效果主观性题目编写比较容易,但评分比较复杂,评分的信度低,区分度也比较低客观性题目编写时难度较大,但评分时比较简单,评分的信度高,有较高的区分度.没有唯一的或标准的答案,对学生的反应没有严格明确的规定,评分规则比较模糊,可操作性不强,评分的主观性、随意性比较大。有唯一的正确答案,对学生的反应有严格的限制,评分规则清楚明白、容易掌握,对答案的评分比较客观。主观性题目客观性题目学习被“碎片化”和“原子化”。“当这样一种不幸的时代到来时,我们的教育就会遭受不可避免的损害。这意味着我们的教学会完全碎片化,被分解成毫无联系的片段,科学会成为高度浮夸的语言表达,计算、操作和思考被最小化,语言教学的目的就是语词技能而没有文学价值,英语只教阅读,写作上的实践和训练消失。——布里格汉姆鼓励学生掌握事实性知识,鼓励再生他人的观点,激励“肤浅的学习”,限制了对“高等级的思考技能”的学习。一些消极甚至不合伦理的实践成为学生学习中的常态:记住过去的试题及其答案、猜测可能的题目,甚至作弊。纸笔测验的局限性无法评定学生的非认知因素的发展水平,如情感、态度、体验等。很难评定知识应用能力、问题解决能力等包含“做和实践”的成分的能力,对有关学习策略、学习监控的元认知能力也很难评定。纸笔测验的改进学生理解了哪些知识学生还不理解哪些知识对分析、综合等思维能力的考查对内容记忆情况的考查科学和社会概念、原理的理解和应用单纯的事实性知识具有良好结构的知识零散的知识核心内容枝节内容命题时应强调命题时不必过分强调多一把尺子,多一批好学生(语文、数学评价为例)山东宁阳的改革:自主选择考试(中国教育报20041024)“一试多卷选择”:分别命制A、B、C三种由难到易的试卷,并且每种试卷都命制两套试题,作为期末考试的试题。“多项选择”:多个考查项目,包括听力、书写、朗读、课文背诵、课外古诗文背诵、课外阅读汇报和即兴演讲七项,学生自选。“不定时多次选择”:学生自定考试时间和次数。“语文素质发展学分”:考试分*0.4+考查分*0.4+特长分*0.2。一份调查报告“以某班学生家庭近十年消费水平的变化”为题,按要求设计一份调查提纲。(1)调查目的;(2)调查内容;(3)调查方法;(4)调查中需要一个“调查对象基本信息库”、请写出该库的库结构(包括学生姓名、家庭人口、家庭收入/月和家庭电话等。)试题设计的改革方向变知识立意为能力立意,着重考查学生对知识的综合、灵活运用,而不是知识死记硬背。打破传统封闭的学科观念,在考查学科能力的同时,适度考查跨学科的综合能力。联系社会实践和社会生活,关注社会重大问题和热点问题,考查学生综合运用知识解决现实问题的能力。设计真实而有意义或有趣味的情境,题型多样,能引起学生的兴趣,激发学生解决问题的内在动机。变封闭性试题为开放性试题,给学生提供更多的思维空间,考查创新精神。以问题为中心串连多种材料,考查学生从材料中辨认问题并解决问题的