心理测量学PsychologicalTesting一、说明(一)课程性质本课程适合于大学本科心理学、教育科学等专业的本科生及研究生教育。本课程的学习将有助于实验设计、教育评价、心理与教育统计学等学科的学习,是培养学生科学研究及掌握研究方法的基础性学科。(二)教学目的通过学习,要求学生掌握心理测量的基本知识、心理测量的编制和实施、以及良好测量所要求具备的基本条件。更重要的是,通过本课程的学习要使学生熟练掌握不同心理测量的实际应用。(三)教学内容本课程的主要教学内容有:心理测量的基本内涵及其评价和测量的一般步骤和方法两部分。内容涉及一般测量解析,测量的要素及量表类型,测验信、效度、难度和区分度,测量的一般步骤和方法,智力测验、人格测验等心理测验,以及心理测量的综合应用和心理测量理论的新发展等内容。(四)教学时数54个课时(五)教学方式课堂教学与实践应用相结合。第一编心理测量的基本内涵及其评价第一章绪论教学要点:通过本章的学习,了解测量的基本性质及其要素,测量量表的四种水平,心里测量的本质、基本条件及功能,心里测量的发展以及心理测量的道德准则等内容,对心理测量有一个概括化的了解。教学时数:[10学时]教学内容:一、一般测量解析1.测量(Measurement)概论2.测量的分类3.心理测量的种类(1)以测量对象来分,(2)以测量的目的来分,(3)以测量的方式来分类,(4)以项目结构或组成形式来分,(5)按评价参照的标准分类4.测量与测验(Test)、考试(Examination)、评价(Evaluation)联系与区别二、测量的要素及量表类型1.测量的要素识记:单位(Unit),参照点(ReferencePoint),量表(Scale)2.量表类型(1)称名量表称名变量只说明某一事物与其他事物在名称、类别或属性上的不同,并不说明事物与事物之间差异的大小、顺序的先后及质的优劣。(2)顺序变量顺序变量是指可以就事物的某一属性的多少或大小按次序将各事物加以排列的变量,具有等级性和次序性的特点。(3)等距变量等距变量除能表明量的相对大小外,还具有相等的单位。(4)比率变量比率变量除了具有量的大小、相等单位外,还有绝对零点。三、心理测量的本质、基本条件及功能1.心理测量的本质2.编制心理测验的基本条件3.心理测量的功能(1)理论研究功能,(2)实际应用功能四、心理测量发展简史1.主观经验性考试阶段(1864年以前)2.客观标准化测验阶段(1864年——1940年)3.客观测验的深入发展阶段(1940年——)4.西方心理测量的发展5.心理测验在我国的发展(五)心理测量的道德准则1.心理测量工作者的素质要求(1)心理测量工作的知识结构.(2)对心理测量的态度2.心理测量工作者的道德准则(1)测验的保密和控制原则(2)测验中个人隐私的保护考核要求:1.心理测量的种类2.测量与测验(Test)、考试(Examination)、评价(Evaluation)联系与区别3.测量的要素及量表类型单位,参照点,量表,称名量表,顺序变量,等距变量,比率变量4.心理测量的本质、基本条件及功能5.心理测量发展简史第二章经典测验理论的基本假设教学要点:通过本章的学习,掌握经典测验理论的基本假设,心里特之及其特性,心里测量的误差和种类,以及真分数的含义等内容。教学时数:[6学时]教学内容:一、心理特质(Trait)及其可测性假设1.经典测验(ClassicalTestTheory,CTT)理论2.特质假设二、测量误差及其来源1.测量误差的含义2.误差种类识记:随机误差,系统误差3.误差来源(1)来自心理测量工具,(2)来自测量对象,(3)来自实测过程(二)真分数模型及其假设1.真分数的含义2.真分数数学模型解析领会:(1)几个推理,(2)CTT的基本含义,(3)CTT的基本公式3.经典测验理论的不足考核要求:1.心理特质(Trait)及其可测性假设2.测量误差及其来源3.真分数模型及其假设4.经典测验理论的不足第三章测验信度教学要点:通过本章的学习,掌握信度的意义,信度系数的计算,了解影响信度的主要因素以及提高信度的常用方法等内容。教学时数:[4学时]教学内容:一、信度的意义1.信度指实测值和真值相差的程度2.信度指统计量与参数之间的接近程度3.信度是指一种测验对相同的应试者再次测验时引起同样反应的程度二、信度系数的计算1.稳定性系数2.等值性系数3.等值稳定性系数4.内部一致性系数5.评分者的信度系数三、提高测验信度的方法1.信度系数以多大为宜2.影响信度的因素3.提高测验信度的方法考核要求:1.信度的意义2.信度系数的计算识记:稳定性系数,等值性系数,等值稳定性系数,内部一致性系数,评分者的信度系数3.提高测验信度的方法请列举一些你所使用过或接触过的量表思考:量表的作用是什么?你如何解释下述现象?一个很聪明的孩子,测得智商是80分一个学习很好的学生,考试成绩为60分一个人缘很好的人,人际关系测量低于常模值量表帮助我们了解心理现象(心理特质),就像尺子帮助我们测量身高。思考:我们如何知道我们有多高?有两个工具:尺子/秤尺子的数据与我们的目测更一致,而秤盘的数据则与我们的目测不一致。因此,尺子是测量身高的有效工具——效度。什么材料的尺子?——钢铁(热胀冷缩)涉及到一致性的问题。——信度•物理不等于数学•1.70与1.7的关系•总结:量表是我们用来了解心理特质的工具,但这个工具是有误差的。误差要控制在一个许可的范围内。回顾•什么是误差?•误差的种类?•误差是在测量中与目的无关的变因所产生的不准确或不一致的效应。•误差分为随机误差和系统误差。•高尔顿的智力观•比奈的智力观•判断题、选择题和问答题•SX2=ST2+SE2ST2=SV2+SI2SX2=SV2+SI2+SE2SV2SI2SE2SX2ST2信度•稳定性\可靠性\一致性•信度乃是一个被测团体真分数的变异数与实得分数的变异数之比。•rXX=ST2/SX2信度的定义二•信度乃是一个被测团体真分数与实得分数的相关系数的平方。•rXX=P2TX•思考:相关系数的平方?信度的定义三•信度乃是一个测验X与它的任意一个平行测验X'的相关系数。•rXX=PXX'A卷:你是一个喜欢热闹的人吗?1=绝对是2=是3=不一定4=不是5=绝对不是B卷:你是一个喜欢安静的人吗?1=绝对是2=是3=不一定4=不是5=绝对不是信度的估计方法•重测信度(Test-RetestReliability)•定义:同一量表,同一被试群体,在不同时间,两次施测,求其相关。•实质:表示测验结果的稳定性。故称之为稳定性系数(CoefficientofStability)•形式:施测—适当时间—再施测时间间隔的把握•间隔时间越长,稳定性系数越低。适宜时间间隔依照测验目的、性质及被试特点而定。几分钟至几年。•年幼儿童,间隔要小;年长群体,间隔可大。智力测验的间隔不能太短,成就测验的间隔不能太长。•一般间隔时间不超过六个月。(即不能让被试记住上一次测验的内容,又不能让其特质发生变化,或对所学知识产生遗忘)复本信度(Alternate-formraliability)•因为任何测验只是所有可能题目中的一份取样(行为样本),所以可编制许多平行的等值测验,叫做复本。复本等值要符合下列条件:•各份测验测量的是同一种心理特性。•各份测验具有相同的内容和形式。•各份测验的题目不应重复。•各份测验题目数量相等,难度和区分度大体相同。•各份测验的分数分布(平均数和标准差)大致相等。•复本编好后,应再测一次,以确保各份测验的等值。定义:两个复本施测同一被试群体,求其相关。•等值性系数:同时连续施测,反映内容变异。•形式:复本A—最短时间—复本B•稳定性与等值性系数:•时间间隔施测,内容变异+重测信度误差•形式:复本A—适当时间—复本B分半信度(Split-HalfReliability)•定义:在测验没有复本且只能实施一次的情况下,可将测验项目分成对等的两半,根据被试在这两半测验中所得的分数计算相关系数,即得分半信度。•计算分半信度先要对测验分半。不同的分半法可能会得到不同的信度值。分半信度(Split-HalfReliability)•为了使两半基本等值,可将项目按由易到难的顺序排列编号,然后按奇数和偶数序号将项目分半。要注意使那些性质相同、联系紧密的项目分在相同的一半,否则会使信度值偏高。•由于分半信度实际上只是半个测验的信度,测验越长、项目越多,两半分数的相关就越高。因此,对长度不同的测验,要用校正公式。同质性信度(HomogeneityReliability)•同质性指测验的所有题目测量的是同一种心理特质,表现为各个题目得分之间有较高的相关,相关越高则同质性越强。•因素分析的思路五、评分者信度(ScorerReliability)•评分者信度是指不同评分者之间在测验结果计分上的一致性。•在心理测验中,评分者信度的计算,通常是随机抽取若干份试卷,由至少两位受过训练的评分者按计分规则分别判分,然后计算它们的相关。几个评分者的评分越一致,评分者信度越高。五、评分者信度(ScorerReliability)•最简单的估计方法就是随机抽取若干份答卷,由两个独立的评分者打分,再求每份答卷两个评判分数的相关系数。这种相关系数的计算可以用积差相关方法,也可以采用斯皮尔曼等级相关方法。•如果评分者在三人以上,而且又采用等级记分时,就需要用肯德尔和谐系数来求评分者信度。估计信度的方法与测验复本的数目以及施测次数的关系所需要施测的次数所需要副本的数目一二一分半信度同质性信度评分者信度副本信度(连续施测)二再测信度复本信度(间隔施测)•在一般情况下,间隔施测的副本信度最低,因为很多因素有机会影响到分数。相反,校正过的分半相关,因为影响的因素少,所得的信度估计为最高。各种信度系数相应误差变异的来源信度系数的类型误差变异的来源再测信度复本信度(连续施测)复本信度(间隔施测)分半信度同质性信度评分者信度时间取样内容取样时间与内容取样内容取样内容的异质性评分者间的差异•实际上,有多少种误差来源,便有•多少种估计信度的方法。一个测验•哪种误差大,便应该用哪种误差估•计。有时一个测验需要有几种信度•系数,这样我们就把总分数的变异•数分成不同的分支。•假设对100个六年级学生以两个月的时间间隔先后施测一个创造力测验的A\B两个复本,所得的等值性与稳定性系数为0.70。我们还根据•被试对每个复本的反应计算出分半信度为0.80•(先计算每个复本的分半相关系数。将二者平•均后再用斯皮尔曼-布朗公式校正)。同时,•我们让另一个评分者随机抽取50份卷子另外评•分,得到评分者信度为0.92。然后,我们对这•三种方法所产生的误差变异进行分析。一个假想测验的误差变异来源分析信度类型误差变异量误差变异来源复本信度(间隔施测)1-0.70=0.30时间与内容取样分半信度1-0.80=0.20内容取样上述二者差异0.30-0.20=0.10时间取样评分者信度1-0.92=0.08评分者差异误差变异总和0.20+0.10+0.08=0.38真实变异1-0.38=0.62一个假想测验的误差变异来源分析真实变异误差变异时间上的稳定性,复本之间的一致性,评分者之间的一致性内容取样误差时间取样误差评分者间差异62%20%10%8%第四章测验的效度教学要点:通过本章的学习,掌握效度的含义,效度估计方法,了解影响信度与效度的关系,影响效度的因素以及提高信度的几种方法等内容。教学时数:[10学时]教学内容:一、效度概述1.效度的一般定义及其内涵效度是指测验的准确性,即测验能够测出他们所欲测的特质的程度。2.效度的统计与原理3.效度的信度关系(1)高效度,高信度(2)高信度,低效度(3)低信度,低效度二、效度的估计1966年美国心理学会在《教育心理测验值标准》中将效度分为三大类:1.内容效度(ContentValidity)内容效度指测验实际测到的内容与所要测量的内容之间的吻合程度。2.结构效度(ConstructValidity)结构效