试卷编制的方法及其命题技术南通市教育科学研究中心袁亚良主要内容一、教育测量学的基本概念二、衡量试卷质量的主要指标三、试卷测试结果的分析指标四、试卷的命制技术南通数学网一、教育测量学的基本概念要搞好命题工作,我们的教师必须具有一定的教育测量学的知识和专业知识。1.教育测量教育测量有广义和狭义之分.从广义上说,教育测量泛指运用测量手段对教育活动所进行的量的测定.从狭义上讲,教育测量专指按一定规则对学生的知识、智能、个性发展、思想品德等所进行的量的测定.通常所提及的多是狭义上的教育测量.2.测验测验是指对通过一定的仪器和试题所引起的受测者的行为样本进行测量的系统程序.3.测验的种类按测验的功用分类(1)学绩测验.测量个人(或团体)经过一定形式的学习活动后对知识和技能的掌握程度.(2)能力测验指一般能力测验、特殊能力测验、潜在能力测验(又称能力倾向测验).(3)人格测验测量动机、兴趣,态度,气质,情感、信念、价值观等除能力以外的个性特征和倾向.按测验的目的分类(1)诊断性测验(也称作配置性测验)是指在教学活动的一定阶段,如学年、学期或教学某一课程章节之初进行的测验,其目的在于了解学生的知识基础和情感发展状态,对即将学习的内容的准备状况,使教师、管理人员心中有数,以便合理编班、组织教学、恰当处理教学内容.(2)形成性测验是指在教学活动的进程中所实施的、以改进教学为目的的测验,这种测验形式灵活,师生可以通过形成性测验了解前段教与学的状况,以便采取措施及时矫正.(3)终结性测验是指在学期学年或某一门课程终了时举行的测验,其目的在于鉴定教师的教学和学生的学习、甚至一门课程的编制.诊断、形成、终结性测验对照表种类目的特点时间诊断性测验预测摸底比较正规教学开始形成性测验矫正改进灵活教学进程中终结性测验鉴定正规教学结束按测验的对象分类(1)个别测验每次仅以一个被试为对象.优点是主试对被试者的言语、情绪有较多的控制机会,能进行细致的观察.缺点是费时多,手续复杂,对主试专业素质要求较高.(2)团体测验是指在同一时间内由一位主试对多数人实施的测验.优点是时间经济而且不一定找专业素质高的人担任主试.缺点是对被试的行为不能有效的控制和细致观察.按解释分数和方法分类(1)常模参照测验指参照被测群体的实际水平解释分数的测验叫做常模参照测验.群体的平均分数一般可以反映群体的水平,称为常模.(2)目标参照测验参照被测达到目标的程度来解释分数的测验,叫做目标参照测验,也称作标准参照测验.常模参照测验和目标参照测验对照表种类参照系归属作用理想分布常模参照测验群体水平相对评价比较选拔全距大,正态分布目标参照测验教育目标绝对评价鉴定负偏态4.测量的要素测量的三要素:①参照点参照点分绝对零点和相对零点.教育测量所应用的参照点都是相对零点.②统一的单位③量具(测量工具)教育测量常用的工具是试卷.二、衡量试卷质量的主要指标1.难度难度是指试卷(题)的难易程度.一般用试卷(题)的得分率或答对率(P)表示,所以难度事实上是容易度.P值在0~1之间,数值越大,说明试卷(题)越容易.有关考试难度水平估计一览表最易容易适中题较难难很难难度0.950.850.700.500.300.10章节考试20%40%30%10%高考30%30%20%20%竞赛20%30%30%20%一般情况下,测验的平均难度接近0.50时,分数趋于正态分布,否则分数分布将出现偏态.就整个测验而言,当平均难度为0.5且题目组间的相关为零的情况下,分数呈正态分布,而难度值越小,则题目越难,低分段人数必然较多.难度值越大,题目越容易,分数将大部分集中在高分区.这样,在分数的分布上,就会呈现出两种不同的偏向,前者为正偏态,后者为负偏态.2.区分度是试题对不同考生的知识、能力水平的鉴别程度.如果一个题目的测试结果使水平高的考生答对(得高分),而水平低的考生答错(得低分),它的区分能力就很强.题目的区分度反映了试题这种区分能力的高低.一般认为,区分度的数值达到了0.3,便可以接受;达到了0.3以上为好的题目;在0.4以上为优秀题目;低于0.3的题目,区分能力差.3.信度信度是衡量测验分数一致性或可靠性的一个指标,即用一个或一组测验对同一被试群体施测多次,所得结果的一致性的程度,以及测验分数所反映被试真实水平(即真分数)的可靠性程度.1994~1996年高考数学(理科)试卷统计数据对比表项目1994年1995年1996年平均分83.1288.3682.79标准差25.5024.0025.30难度0.5500.5900.550分半信度0.83390.85060.8500α—信度0.75800.88670.88844.效度效度是反映一份试卷有效性或准确性的指标.每一种效度有其特定的适用范围,主要有:效标效度,内容效度,结构效度.由于客观上的种种原因,难以确定有效的效标,因此,效度的计算,采用求平均区分度代替,其计算公式是:kiiDkr11效内容效度测验的题目对所要测量的内容具有代表性的程度称作内容效度.它反映测验题目在所要测量的内容范围和教学目标内取样是否充分和确切的问题,主要用于学科成绩测验.内容效度一般不用数量化指标来表示,主要依靠在某种依据的基础上作出逻辑分析.三、试卷测试结果的分析指标1.算术平均数——平均分一组数值的总和除以数据的总频数所得的商称为算术平均数,简称平均数.nxxxxn212.标准差标准差是反映全体考生分数之间的离散程度和差异情况.它与平均分一起使用,决定了某次考试分数分布情况.s值越大,表示部分考生离平均分的“差距越大”,也就是分数分布较广;s值越小,则分数分布较窄或说“集中在平均分附近”.21()niixxsn3.差异系数标准差较准确地反映了一组分数的离散程度,它与原数据的单位相同,是一种绝对差异量数.如果各组数据单位不同,或虽然单位同但平均数相差甚远时,不能直接用标准差比较,这时应使用差异系数.差异系数是一组数据的标准差与平均数的百分比,用CV表示%100xsCV例题某市中考成绩英语的标准差S1=15,平均分85分(满分120分),政治的标准差S2=10,平均分50分(满分70分),试比较两科的差异情况.解:英语学科的差异系数为CV=15÷85=17.6%,政治学科的差异系数为CV=10÷50=20%.因此,政治学科分数的离散程度大.4.标准分数标准分数是以平均分为参照点,标准差为度量单位的分数.它具有重要理论价值和应用价值.不改变分布形态的标准分数,定义式为sxxzi例题某生高考物理成绩105分,所在省的物理平均分68.4分,标准差为28.9分,求他的标准分数.解:Z=(105-68.4)÷28.9≈1.266.四、试卷的命制技术1.1命题的意义1.2命题的依据1.命题1.3命题的原则1.4命题的操作2.1试题的功能2.2试题的题型2.试题2.3试题的质量2.4试题的编制3.1试卷的结构3.2试卷的设计3.试卷3.3试卷的编制3.4试卷的审校3.5试卷的难度1.命题1.1命题的意义命题的意义可以概括为:没有命题,测试就无法进行;没有科学、合理和高质量的命题,测试的质量就难以保证,测试就无法达到预期的目的,教育教学就难以得到健康的发展.1.2命题的依据依据测试性质和目标,并结合测试群体的实际情况进行命题,是命题的基本原则.我们日常教学中经常使用的随堂测验、单元测试、期中和期末考试等,是在学校范围内进行的测试,是教学过程中的一个组成部分.命题的依据应是课程标准规定的教学目标和教学要求.应由学校制定一系列的规章制度,组织命题和实施测试.初中毕业和升学考试是定期举行的大规模的统一考试.为了保证考试的公正和质量,应对考试进行法制化的管理,应制定相应的考试大纲(或考试说明),作为法规性的文件公布于众.既接受教育行政部门的指导,又接受广大师生和家长的监督.这种大规模的统一考试,考试大纲(或考试说明)就是命题的依据.考试大纲的作用制定考试大纲的作用主要有四个:1.指导和约束考试的命题,保持历届同类型的考试试题的稳定性和连贯性2.指导考生的复习和备考,使考生的复习和备考也有章可循,有法可依,增强复习和备考的针对性和实效性,减少盲目性3.发挥考试对教学的反馈作用和指导作用,促进教学质量的提高4.保证对考试进行法制化的管理,监督和评价考试,促进考试质量的提高考试大纲的内容1.考试的目的和性质、考试的宗旨、考生的资格等2.考试的内容、范围和要求3.考试的方式和方法4.有关应试注意事项1.3命题的原则(1)适纲性原则随堂测验、单元测试、期中和期末考试以及毕业会考的命题,必须以课程标准为依据;升学考试的试题必须以考试大纲为依据;试题的内容和形式要符合测试的目的;考查的知识和能力,不能超出课程标准(考试大纲)规定的范围;各种不同题型的题目的比例,各种不同难度的题目的比例,都必须符合考试大纲的规定,这就是适纲性原则.题型的选用、素材的选取、试题的立意、试卷的构成、试卷的长度等,都不能偏离课程标准或考试大纲.测试试题要切合考生的实际,也是适纲性原则的重要内涵.测试试题要注意思想性,也是适纲性原则的重要内涵.发挥测试试题对教学的导向作用,也是适纲性原则的重要内涵.为了更好发挥测试试题对教学的导向作用,命题时必须认真研究课程标准和考试大纲,不要超纲,不要出偏题、怪题,防止试题产生负面效应,引发不良导向,违背教学规律,打乱教学秩序.(2)适度性原则试题的难度、试题的数量和试卷的长度应当合适,试题对所考查的知识和能力的采样要有代表性,要有覆盖面.试卷的总体要求应适合考生的年龄特征与实际水平,试题的编排和试卷的梯度要与考生在测试过程中的心理状态相适应,以保证测试达到一定的信度、效度和必要的区分度.这就是适度性原则.按照不同性质和不同目的测试的不同要求,设计好每一道试题的难度和试卷的总体难度,是适度性原则的重要内涵.试题的数量和试卷的长度要适当,是适度性原则的重要内涵.(3)整体性原则试卷的布局应科学、合理,结构良好,充分运用各种题型的考查功能,取长补短,注意发挥每一道题目、各个题组和整卷的测试功能,实现测试的目标,这就是整体性原则.对于课程标准和考试大纲中规定的教学内容的考查,要做到既全面考查,又突出重点,这是整体性原则的重要内涵.组成试卷时,同一试卷中的各个试题应相互独立,有各自的考查目的,不要出现重复考查的内容,这也是整体性原则的重要内涵.强调试题的综合性,也是整体性原则的重要内涵.(4)规范性原则试题和试卷中,概念、术语、各种符号和计量单位以及各种说明和陈述使用的语言,都必须符合学科的标准和规范,不得杜撰,不能乱用和误用,这就是规范性原则.不出现科学性的错误,不出现逻辑性的失误,是规范性原则的重要内涵.试题的格式和陈述,务必清楚明确,不会引起歧义,不使考生误解,也是规范性原则的重要内涵.命题时,语言含义清楚,文字简明扼要,避免使用难以读懂、模棱两可的词语,也是规范性原则的重要内涵.对于大规模的统一考试,命题时力求做到在试题面前人人平等,也是规范性原则的重要内涵.对于大规模的统一考试,编制试题解答、参考答案和评分标准,应力求使阅卷工作便于操作、方便可行,也是规范性原则的重要内涵.1.4命题的操作(1)试卷各部分比重的确定围绕着同样的测试内容,可以编制出不同的测试目的和要求的试题和试卷,其主要的差别表现为考查重点的不同安排.确定重点内容在试题和试卷的比重,是编制试题和试卷的第一道工序.(2)双向细目表的作用和编制双向细目表是一种反映考查内容和考查要求的横竖两向的表格,其中一向是试题的考查内容,考查内容可分若干级列项,分级可粗可细,应结合学科的特点和测试的目的,做出科学合理的划分.命题的双向细目表一目了然地显示了试卷的整体结构,同时,各道试题的考查内容、考查要求以及在试卷中的位置(题号)也都记录在案.双向细目表的作用1.方便命题人员编题的操作,保证命