试论影响评分误差的主要因素清徐县教师进修学校常美华评分误差是影响考试质量的主要因素之一。一般而言,评分误差在1-3分之间是可以容许的。但很多调查研究表明,有些教师在评改试卷时,学生的卷面得分和真实分数有可能相差5-10分,甚至更多。评分误差太大不仅影响学生的学习积极性,更重要的是它导致不能正确地为教学提供诊断和改进的信息,这是我们教育工作者应该重视的问题。引起评分误差的原因我认为主要有以下几个方面:一、光环效应也叫晕轮效应。指在人际相互作用过程中形成的一种夸大了的社会印象。表现为在个体的社会知觉过程中,将对方的最初印象不加分析地用来判断、推论其他品质。如一个人最初被认为是好的,他就被一种积极的光环所笼罩,人们易将好的品质赋予他。相反,一个人被认为是最坏的,就会被消极的光环所笼罩,人们易将不好的品质赋予给他。日常生活中,人们常常会因为一个人勤奋耐劳而忽略其能力不足的缺点,或由于性情急躁而掩盖了工作中的其他优点,而作出或肯定或否定的判断。这种以点概面、以偏概全的情况,在考试评分中也屡见不鲜。表现为评卷人员由于答卷某方面的优点长处(或不足)非常明显,容易对此产生清晰明显的知觉,因而忽视其他方面的缺点不足(或优点),被局部的个别信息所左右,产生片面主观的判断,造成评分误差。如论述式试题中,会由于注重答卷基本理论阐述确切详备而忽视其举例说明的例证不典型乃至例不对题的不足。作文卷中表现尤为突出,评卷人员常会因为考生文章辞藻的华美结构的独特而忽视其内容的缺陷而不见甚至自觉不自觉地人为赋予答卷并不存在的优点;反而又会由于作文中几个错别字的影响而使评卷人员产生不良印象。在这种光环笼罩作用下,答卷的优点(缺点)不断泛化,其评出的分数自然大大高(或低)于实际成绩水平,影响评分的准确性和客观性。2、顺序效应评分中的顺序效应是指评卷中对出现于不同次序位置试卷评分的不一致性,或出现的评分过严或过松的不一致的倾向。初始效应使评卷人员对考试标准掌握前后不一致,出现前紧后松或前松后紧的现象。其中又以前紧后松居多。这是因为评卷人员开始阅卷时对考试标准的掌握没有底,大多数都有从严掌握标准的心态,而评阅一部分试卷后,标准掌握逐渐趋于稳定,因而呈现前紧后松的趋势。加之一些重大考试如高考常常意味着接连数天的连续作战,而评卷本身又是一种脑力消耗很大的劳动,评卷人员容易出现身体和大脑疲劳。在这种情况下,势必影响考试标准执行的统一性和连续性,出现前紧后松、宽严不一致的现象。另外,有些评卷人员也会在开始时感到无所适从时掌握考试标准过松,待到后来出现有的考卷得分有超过规定最高分数的趋势,或高分集中优劣难分时又从严掌握,因而形成“前松后紧”。3、对比效应又称反差效应,是指评卷人员区分不同答卷正误优劣时产生的一种反差心理。这是由于人们在事物的对照比较中,常会由于选取的参照对象不同而作出不同的判断。当参照对象“完美无缺”时,其他的便有黯然失色之感;反之在某个较差的参照对象的衬托之下,会使人对比较的对象产生良好的印象。这种心理反差对比效应在评卷中表现为:A.对首次出现的解答方式,评卷人员常会认为其”“新颖独特”,“有创造精神”;而后出现的解答与第一次相当,甚至稍有高明之处的,评卷人员也会产生“雷同”、“没有新意”之感,结果评分便有高低之别,产生尺度偏差。B.当评卷人员在连续评了几份质量较高的答卷后,见到一份较差的试卷,给分就可能偏低;反之,在评阅了几份质量较高的答卷后见到一份稍好的试卷,则可能给分偏高。有时候,一道试题如果连续有考生交白卷,而碰到个别考生进行了解答,那么这道题的得分就可能高出实际应得的分数。对比效应的结果常偏离考试评分标准,影响其稳定性,造成评分不公正、不客观。4、首因效应对某事物产生的第一印象或看法对人们再次认识这一事物时所产生的影响或作用,称为首效应。在社会交往中,两个素不相识的人第一次见面所留下的印象会对以后的交往产生一定的影响。考试评分过程中也存在这种现象,评卷人员对试卷产生的第一印象会对其评分产生一定作用和影响。主要表现在:首先,试卷的整洁与否、字迹书写工整规范优美与否都会对评卷员评分产生影响。一般来说,除专门的书法考试以外,卷面的整洁和书法的水平并非考试测量的目的。但在实际的评卷中,试卷的整洁、字迹的优美流畅、排列有序会给评卷人员较好的印象,大多可以得到较好的分数;而答卷涂改污损较多、行列歪曲、字迹潦草则给人不佳的印象,即使解答正确,得分也将被打折扣。其次,考生在开始部分答题情况的好坏也会评分产生影响,如一道题许多回答都是正确的,其中有一些回答的正确性不如另一些回答的那么明显,评卷人员在评阅那些不那么正确的答案时,往往会根据前面一些试题上的成绩来评分。比如作文题的评分,文章开头部分写的好坏,给评分者的影响如何对评分影响很大,有时有个好的开头,甚至一个用得巧妙恰当的词语就会使评分者给出较高的分数。控制方法是采取分项分等、流水作业的方式。5、风格偏好效应不同的人其受好兴趣好也有不同,在考试试卷的评阅上,这种爱好兴趣上的差异往往使评分者形成各具特色的评卷偏好和评卷风格,从而影响评分的客观性和一致性。例如对论文式试题的评分,有的评卷人员只接受与标准答案完全相同、毫无偏差的解答(表述),有的评分者则只要求“八九不离十”,能回答出大意就给予高分。从作文来说,有的评分者喜欢华丽秀美的词藻、有的则偏爱朴实无华的语言、有的欣赏文章严谨的逻辑、有的看重文章的结构、而有的则又注重内容的深刻性。因此,同样一篇文章在不同评分者的评阅下,自然会得出不同的分数。其他类型的主观性试题如计算题、论证题、推理题等也是如此,有的评分者注重周密机巧的推理、有的则习惯于根据公式运用与结果的正确性来评分、有的偏重于教材内知识内容的应用、有的则赞赏考生的独创性……。这种评分者独有的习惯、偏好无疑会给评分带来不同程度的误差。6、情绪效应情绪对人的认识活动无时无刻不在发生着作用和影响。评分者情绪对评分的影响主要表现在:A当评卷人员心情高兴时,工作起来有干劲,思维敏捷注意力集中、评分认真细致;而当其心绪烦闷时,不仅注意力分散、评分随意粗率,而且可能借评分来发泄心中的不快。B当评分人员烦燥不安、忧郁不满时,他们满眼看到的都是答卷的错误、缺漏,不容易看到答卷的长处,因而给分就会较低;而如果心情较好,则在评分中就会不自觉地对错误表示宽容,评分就会高些。从而使评分宽严失当,失去客观性。因此,为保证考试的公平、公正性,我们应创造一种宽容、和谐、舒适的阅卷氛围和环境,增强阅卷教师的责任心,互相提醒,多一份责任,少一份粗心,并采取回复返照、分题评分、多人评分以及多次评分等办法。我们相信,评分误差是可以减少甚至避免的。