心理测量黎光明E-mail:Lgm2004100@sina.com华南师范大学心理学院第四章测量信度信度是指:测量结果的可靠性和稳定性。因为心理测验通常测量人的行为,行为会由于各种各样的原因,因时、因事、因地而产生变动,这些因素有些是偶然的,有些是固有的,人在完成心理测验时的行为也会受上述因素的影响,从而使测验结果与真实结果不完全一致,所以我们要用信度来衡量测验的可靠性和稳定性。一、信度的定义信度是指测验的可靠性、稳定性。信度是指同被试者在不同时间内用同一测验(或用另一套相等的测验)重复测量,所得结果的一致程度。如果稳定,则信度高,若两次测量相差较大,说明稳定性差,信度低。信度只受随机误差的影响,不受系统误差的影响。如秤坏了,不影响两次的体重的测量。再如枪坏了,不影响两次打靶的点位。第一节信度的概述X=T+E222ETxSSS二、信度的统计定义定义1:信度是被试团体真分数方差与实得分数方差之比2T2E2X2T2E2X22TXXXr定义2:信度是被试团体真分数与实得分数相关系数的平方定义3:信度是一个测验X(A卷)与它的任意一个平行测验(B卷)的相关系数2TXXXrXXXXr三、信度的意义(1)信度系数可以解释为样本测验分数的总方差中有多少比例是真分数方差,也就是测验的总变异中真分数造成的变异占百分之几。它直接告诉我们测量的误差有多大。(2)测量的标准误可以告诉我们,有多大可能性真分数在某一分数范围内,并且可以预测实得分数再测时可能的变化情况。四、信度的作用(1)解释真分数与实得分数之间的关系,明确告诉测验误差的大小。(2)它是确定测验好坏的一个指标。一般的原则是:当<0.70时,测验不能用于对个人作出评价或预测,而且不能做团体间比较。当0.70≤<0.85时,可用于团体比较。当≥0.85时,才可以用来鉴别或预测个人成绩或作用。(3)下结论说某测验比较可靠,必须是依据情境的,经多次证实的。我们知道,要求出测验的信度,那么就要求构建出两个平行测验,并求出平行测验间的相关系数,围绕构建两个平行测验,形式是很多的,根据形式上的不同,可以分成以下几种。第二节信度的评估方法一、重测信度用同一个测验,测两次来构建两平行测验求得的相关系数。评价:优点:容易理解平行测验,能提供测验随时间而变异的资料。缺点:有练习效应和记忆效应,而且时间间隔要妥当(时间间隔要依测验目的而定)。二、复本信度又称等值性系数,通过构建两个复本来求两测验的相关系数,反映测验在内容上的等值性。评价:优点:能克服练习和记忆效应。缺点:复本难以构建,开发题目成本提高,而且也存在时间间隔问题。能否只用一个测验,又只测一次呢?三、内部一致性信度定义:主要反映题目之间的关系,表示测验能够测验相同内容或特质的程度。主要包括分半信度和同质性信度。(一)分半信度分半信度指采用分半法估计所得的信度系数(rhh,hh表示half之间),因为分半题目后,题量减少,这样就影响了原本信度,因此需要对其校正,可用斯皮尔曼-布朗校正公式。评价:优点:只要用一次测量就行。缺点:分半用何形式难以确定,是按奇偶分半,还是按中间分半,还是按时间分半没有规定。21hhxxhhrrr(二)同质性信度同质性主要代表测验内部所有题目间的一致性。可以考察测验题目的单维性。1、库德—理查逊公式(K-R20和K-R21)。2、克伦巴赫系数公式,这个公式巧妙地利用高等数学,同时巧妙地利用了平行测验的概念。22(1)1ixSkkS例:5个学生做了4道题目,数据如下,求克龙巴赫系数。2iS学生题目0102030405第1题263663.04第2题142341.36第3题151342.56第4题361332.56总计721715179.5231.042XS解:92.004.3156.256.236.104.311441122XiXXSSKKr四、评分者信度用于测量不同评分者之间所产生的误差。如大奖赛上评委给选手评分,教师给学生评分等。如果是两个评分者独立对被试的反应评分,则可以用积差相关来计算,或用斯皮尔曼等级相关法计算。如果评分者在三人以上,而且是等级评分,则可以用“肯德尔和谐系数”(W)来求评分者信度。各种信度系数相应误差变异的来源信度系数类型误差变异来源再测信度时间取样复本信度(连续施测)内容取样复本信度(间隔施测)时间内容取样分半信度内容取样同质信度内容异质性评分者信度评分者间差异第三节影响信度的因素一、样本特征(一)样本团体异质性的影响样本的异质性越强(大),分散就越分散,分数变异就越大,相关系数就会越大。例如,一个班上,只有白痴和天才二人,两次对他们施测,天才的分数都高于白痴分数的可能性要很大,这反映了测验的稳定性。相反,若被试同质性强(大),则受随机误差就大。这就要求我们应该将一个班上所有的分数尽量拉开距离,以提高测验的信度。(二)样本团体平均能力水平的影响样本团体平均能力水平应测验而异,因为题目的难度会影响被试的能力水平。让小学的学生去做大学的数学题,或让大学生去做小学的作业,都会影响其信度。二、测验长度如果测验只有一道选择题?试比较一道选择题与100道选择题测验效果?因此,测验的长度会影响测验的信度。不同的长度,信度是不一样的。因此可以增加题数来增加信度。三、测验难度人格测验只有强度之分。学绩测验、智力测验、成就测验有难度之分。试想一个测验没有一个做出来,或者所有的人都做出来,这样两个测验的信度如何?难度就整个测验而言,应该在0.5左右。这是因为大多数人的水平在中等水平。而选择题要出容易些,请问这是为什么?四、时间间隔时间间隔只对重测信度和不同时测量时的复本信度有影响。练习与思考1、信度的类型不包括()。(A)重测信度(B)内部一致性信度(C)评分者信度(D)取样信度2、重测信度是指用(),在同样条件下对同一组被试者前后施测两次得分间的相关系数。(A)一套不相等的测验(B)另一种测验(C)同一套测验(D)另一套相等的测验3、信度系数可以解释测验的总变异中()造成的变异占百分之几。(A)样本标准差(B)测量标准误(C)测量误差(D)真分数4、影响测量信度的主要因素()A、被试方面B、施测情境方面C、测量工具方面D、两次施测的间隔时间5、对于不同平均能力水平的团体,题目的()会影响信度系数。(A)难度(B)表达方式(C)代表性(D)效度•6、斯皮尔曼—布朗公式:式中为()的相关系数,为测验在原长度时的信度估计值。•(A)全测验•(B)原测验•(C)两半测验•(D)全部分数hhhhxxrrr12hhrxxr•7、SE=公式中SE为测量的标准差,SX是所得分数的标准差,rxx为测验的信度系数。从公式中可以看出,测量的标准误与信度之间的关系是()•(A)信度越低,标准误越小•(B)信度越低,标准误越大•(C)信度越高,标准误越大•(D)信度越高,标准误越小xxxrS1•8、信度只受()的影响•(A)系统误差•(B)随机误差•(C)恒定效应•(D)概化作用•9、同质性信度主要代表测验内部()间的一致性。•(A)两半测验•(B)题目与分测验•(C)所有题目•(D)分测验谢谢!