对外汉语教学测试

整理文档很辛苦,赏杯茶钱您下走!

免费阅读已结束,点击下载阅读编辑剩下 ...

阅读已结束,您可以下载文档离线阅读编辑

资源描述

对外汉语教学的测试教育测量与评价教育测量也称考试、测试。考试的目的是要作评价,作判断。根据考试的用途、手段和评价标准,可以将考试作如下分类:(一)根据测试用途分类成就测试,能力测试,能力倾向测试1.成就测试也称成绩测试,测试目的在于测量学生在某个学习阶段学到了什么,包括:A)各学科的单科/综合测试。B)教学阶段的安置、形成、诊断和总结性测试。安置性测试的典型例子是摸底考试和分班考试。形成性测试考察学生进步的情况,对阶段性教学内容掌握的情况。诊断性测试是针对个体或个别教学内容掌握情况的考试,意在对个别学生或特定的教学内容掌握的情况作精确的了解。总结性测试的典型例子是学期、学年考试、会考也属这一类型。2.能力测试测验目的在于测量个体的不因外界环境的影响而轻易改变的、较稳定的、表现在认知能力方面的心理特质,比如观察力、记忆力、理解力、概括力、空间想象力、判断推理能力等等。IQ的测试属于这类考试。3.能力倾向测试又称学习能力测验,它介于成就测验与能力测验之间,既测知识也测能力,目的在于测量学生的潜在学习能力及学术发展趋向。潜在能力指个体从未来教育或训练中最可能发展并受益的能力,一般分为两种:A)一般学习能力测试。B)特殊能力倾向测试。高考属这类考试。根据评分者和评分方法分类客观试题由被试者从可供选择项中确定正确(最佳)或错误答案的题目。这类题目包括是非题、多选题、配对题等,这类题目答案唯一,评分不受主观因素影响,在条件许可的情况下,还可以用机器阅卷评分。有时我们也把介于主观性题目与客观性题目之间的限制性题目如简答题、填充题也归类于客观题,全部由客观性题目组成的测验称之为客观性测验。主观试题由考生以自己的答案来回答所提出的问题。考生在处理问题方式、回答内容的选择、回答内容的组织及答题重点等方面均有相当的自由。这类试题包括论述题、证明题、作文题等,因为这类题目的答案不唯一,评分易受主观性因素的影响,故称之为主观性题目。评分受评阅人主观判断的影响。根据评价标准分类常模参照测试标准参照测试根据是否运用标准化方法分类标准化测试非标准化测试标准化的含义题目的标准化(客观试题)指导语的标准化施测过程的标准化评分的标准化解释的标准化最重要的是分数解释的标准化原始分==〉标准分原始分数的误区case1有老师对学生说,你上次数学测验的的成绩是78分,这一次测验只得了71分,你为什么退步了?Case2家长看到孩子成绩单上的数学测验成绩为82分,语文测验成绩为70分,父母们对此是如何评价的?Case3某学校负责人在学期结束时的总结会上对某学科教师说他的教学效果不好,其依据是该学期学生在此学科上的考试平均成绩低于其他学科。标准分的意义:该生与全体考生比较所处的位置根据测试材料和形式分类语言与文字测试非语言与文字测试根据人数多寡分类团体测试个人测试考察测试质量的几个测量学指标难度、区分度、效度、信度1.难度难度:被试完成题目(item)任务时所遇到的困难程度。难度系数:定量地刻画被试作答题目时困难程度的量值。P难度指标适用范围计算公式难度是指测验项目的难易程度,试题的难度可以用试题的通过率来表示。试题卷面的难度值范围是0.6~0.7难度记为P,在教育测量中,P=R/NR:答对该题的人数N:参加测验总人数难度•1、难度的两种数学定义:•(1)P=1—x/wx为某题得分的平均分数,w为该题的满分。这种定义法,难度值小时表明试题容易,值大时表明试题难,最小值为0,最大值为1。•(2)P=x/w这种定义法,难度值小时表明试题难,值大时表明试题容易,最小值为0,最大值为1。区分度含义意义公式指标范围指测验对学业水平不同的考生的区分程度或鉴别力。具有良好区分度的项目,能将不同水平的考生区分开来,即在该项目上水平高的考生得高分,水平低的考生得低分。通常用D表示,取值范围为+1.00至-1.00。D越高则质量越好。0.2以下应淘汰0.2-0.3合格0.3-0.4良好0.4-1性能佳D=PH-PLPH指高分组通过的百分比,高分组为总分数最高的27%PL指低分组通过的百分比,低分组为总分数最低的27%区分度计算客观性试题极端分组法公式D=PH-PL计算步骤:按测验总分从高到低排序;测验总分最高的27%的被试作为高分组,最低的27%的被试为低分组;分别求出这两组被试通过试题的百分比;将算得有关数据带入上公式。公式XH:高分组总分;XL:低分组总分;H:该题最高分;L:该题最低分;N:考生总人数的25%计算步骤:按测验总分由高到低排序;分别确定测验总分的前27%和后27%作为高低分组;列出试题分析表;将数据带入公式计算。主观性试题极端分组法)(LHNXXDLH信度即测试的稳定性和和可靠程度,信度是反映测量中随机误差大小的指标。包括重测信度、复本信度、同质性信度。重测信度:同一测验对同组被试先后两次施测所得结果的一致性程度;复本信度:两平行测验对同组被试施测所得结果的一致性程度;同质性信度:测验内部所有题目间的一致性程度。教师自编测验的信度指标范围为0.7以上。)1(122ikkr信σ2i:每道试题方差;Σ2:全卷方差;k:试卷中试题数目含义种类公式指标范围试题同质性信度效度是测验的准确性,是测验能够测出它所欲测的特质的程度,即测验实际测量出其所要测量特性的程度。内容效度:是指测验内容对于其所欲测之行为领域的代表性程度。效标关联效度:是指一个测验对处于特定情境中的个体的行为进行预测的有效性。结构效度:是指测验对于被称作某一理论概念或特质测量的程度。教师自编测验的效度指标范围为0.4以上。含义种类公式指标范围iDkr1效Di为每一试题的区分度k为试卷中试题的数目试卷结构效度一、信度(一)信度的概念信度是指测量结果的稳定性或可靠的程度,亦即测量结果是否真实、客观的反映实际水平。可以从以下三个方面理解测量的信度:1、实测值与真值相差的程度也就是误差,误差越小,测量的信度越高。2、统计量与参数之间的接近程度统计量指样本上的数字特征。参数是总体上的数字特征。统计量越接近参数,可靠性越高,信度越高。3、两次重复测量或等值测量之间的关联程度两次测量的相关系数越高,则测量的信度越高,但被测对象的经验、知识增长等因素也影响信度。(二)提高测量信度的方法1、适当增加测量题目的数量数量多则代表性就大,既可提高信度,又可提高效度。但数量太多又操作困难。2、测验的难度要适中难度适中,则信度大,区分度也大。3、测验的内容应尽量同质测验内容庞杂,则增加难度,必然降低信度。4、测验的程序应统一测验的过程直接关系到信度的高低,信度需要规范公平的测验过程去保证。5、测验的时间要充分测验的时间如果不足,不能客观反映学生的实际水平,也影响信度。6、评分要尽量客观、准确评分不准确,必然降低信度。二、效度(一)效度的概念效度是指测量结果的准确性和有效性的程度,亦即测量是否达到了预期的目的。可以从以下三个方面理解效度:1、效度始终是对一定的测量目的而言的一般而言,判断效度的高低,就是判断测验达到目的的程度。2、效度也是对测量的结果而言的测量结果真实、正确的反映被测对象的功能和特性时,则为效度较高或有效。3、效度只是高与低的问题测量的效度不存在有没有,只存在高与低。由于教育测量对象的特殊性(精神的、心理的、可以掩盖的),所以更注重效度问题。(二)效度的类型1、内容效度是指测验目的代表所欲测量的内容和引起预期反映所达到的程度,也就是测量内容的代表性程度。2、效标关联效度又称经验效度或统计效度,是以测验分数和效标之间的相关系数来表示测验效度的高低。效标就是鉴定效度的参照尺度。效标具有可变性,而且选择是比较困难的。3、结构效度是指一个测量能实际测量出理论上的构念或心理特性的程度。即就是从心理学的理论观点对检测结果加以解释和探讨。(三)提高效度的方法1、控制系统误差2、精心编制量表3、妥善组织检测4、扩充样本的内容和代表性5、合理处理效度和信度的关系6、适当增加测验的长度三、难度(一)难度的概念难度是指测验试题的难易程度。教育测量中,客观试题的难度一般用正确回答人数与参加测量总人数的比值表示,即p=r/n难度是试题对学生知识和能力水平的适合程度的指标。难度既影响区分度,又影响信度和效度。但是难度是一个相对的概念。(二)难度对测验的影响1、影响测验分数的分布形态2、影响测验分数的离散程度3、影响测验的鉴别能力(三)测验的适宜难度根据公式p=r/n,则0≤p≤1,所以,一套题目的整体难度应该是0.3-0.7,平均难度是0.45-0.55,这样才可以保证分数呈正态分布。(四)控制题目难度的基本方法影响题目难度的主要因素:1、考查知识点的多少。2、考查能力的复杂程度或层次的高低。3、考生对题目的熟悉程度。4、命题的技巧性。四、区分度(一)区分度的概念区分度是指测验对考生实际水平的区分程度。又叫鉴别力。区分度又分为正区分(积极区分)、负区分(消极区分)和零区分。(二)区分度与测验信度、难度的关系1、区分度与信度的关系据研究,要想达到理性的测验信度,提高区分度是一个好方法。2、区分度与难度的关系难度适中时,区分度有可能达到最大。(三)提高区分度的方法1、使题目和整个考试难度适中。2、着重考查复杂的学习结果。(四)区分度的评价标准区分度当然是越高越好,但是越高越难,一般应该控制在0.2--0.4之间。0.4-非常好;0.3-0.39良好;0.2-0.29尚可。3.信度信度指的是测量结果的稳定性和可靠性。也就是说,在不同时间、不同测验条件下所得分数之间能够保持一致。重测信度同一测验对同组被试先后两次施测所得结果的一致性程度。复本信度指同一批考生在两个平行(等值)试卷上得分的相关系数。评分者信度指评分者评分的稳定性和可靠性,反映了评分能够稳定地反映考生的真实知识和能力水平的程度。4.效度效度,就是指试卷的有效性,即试卷是否达到了考试的目的。换句话说,也就是测验是否精确地测量了想要测的东西。效度的统计学定义是:与测量目标有关的真实分数方差与总分方差的比率效度的分类内容效度题目对欲测的内容范围取样的适当程度。构想效度(理论效度、结构效度、建构效度)效标关联效度(准则效度、实证效度)提高测验信度、效度的方法测验中题目的数量应适当,不能太少。紧密围绕教学大纲和教学目标命题。考核内容应全面,并能有效代表学生应掌握的知识领域。测验的整体难度适当,不同类型、不同难度的题目应保持恰当比例。少出偏题、怪题,一般应以考察基础知识和基本能力为主。一、难度难度是指试题的难易程度,它是衡量试题质量的一个重要指标参数,它和区分度共同影响并决定试卷的鉴别性。一般认为,试题的难度指数在0.3-0.7之间比较合适,整份试卷的平均难度最好在0.5左右,高于0.7和低于0.3的试题不能太多。1、难度的两种定义:(1)P=1—x/wx为某题得分的平均分数,w为该题的满分。这种定义法,难度值小时表明试题容易,值大时表明试题难,最小值为0,最大值为1。(2)P=x/w这种定义法,难度值小时表明试题难,值大时表明试题容易,最小值为0,最大值为1。2、难度的计算:(1)主观性试题的难度A基本公式法:P=1—x/wB极端分组法P=1—(XH+XL)∕2WXH:高分组的平均得分(前27%),XL:低分组的平均得分(后27%)。(2)客观性试题的难度A基本公式法:P=1—R/NR为答对人数,N为全体人数。B极端分组法:P=1—(PH+PL)∕2PH=RH/n叫高分组通过率,RH:高分组答对人数,n:总人数的前27%。PL=RL/n叫低分组通过率,RL:低分组答对人数。二、区分度区分度是区分应试者能力水平高低的指标。试题区分度高,可以拉开不同水平应试者分数的距离,使高水平者得高分,低水平者得低分,而区分度低则反映不出不同应试者的水平差异。试题的区分度与试题的难度直接相关,通常来说,中等难度的试题区分度较大。另外,试题的区分

1 / 43
下载文档,编辑使用

©2015-2020 m.777doc.com 三七文档.

备案号:鲁ICP备2024069028号-1 客服联系 QQ:2149211541

×
保存成功