第五章心理测验的项目分析信度与效度是相对于结果而言的,是对测验整体的分析。项目分析则是对每个项目(item)的具体分析,是细化的。主要内容项目的难度1项目的区分度2项目的综合分析和筛选3项目分析项目分析是指根据被试的反应对组成测验的各个项目(题目)进行分析,从而评价其功能的程序和方法。主要包括:定性分析包括考虑内容效度,题目编写的恰当性和有效性等;定量分析主要是指项目的难度和区分度的测量;项目的难度-定义定义:难度的指项目的难易程度。通常以通过率表示,即以答对或通过该题的人数的百分比来表示:P:题目的难度(更准确地说应该是易度)R:被试正确回答或通过题目的人数N:参加测验的所有被试**难度的指标具有相对性,根据样本的水平来确定参照点。**题目的难度接近或等于0.5比较理想,但在实际操作中一般只需项目的平均难度接近0.5,各个项目的难度在0.5±0.2之间变化就可以。P=R/N项目的难度-计算1、二分法记分的项目1)通过率2)两端分组法当被试人数较多时,则可以根据测验总成绩将被试分为三组:分数最高的27%的被视为高分组NH,分数最低的27%的被试为低分组NL,中间46%的被试为中间组。分别计算高分组(PH)和低分组(PL)的通过率,再求试题的难度:RH和RL为高分组和低分组通过该项目的人数;NH和NL分别为高分组合低分组的人数。P=R/NP=(PH+PL)/2或P=½(RH/NH+RL/NL)项目的难度-计算2、非二分法记分的项目1)用被试得分平均数估计:适用于答案不止两种结果,且分数有多种可能性的简答题、论述题等题型。公式:P为难度值;或M为所有被试在该项目上的平均得分;XMAX或W为该项目的最高得分。2)用难度的矫正公式计算:适用于由于有猜测性成分,得分可能被夸大,不能真实反应测验难度的多重选择题公式:CP:矫正后的难度;P:未矫的难度;K:选项的数目11KPCPKP=/XMAX或P=M/W项目的难度-难度与测量的关系1、难度的等距变换以通过率作为难度指标,它仅仅能指出题目难度的顺序或相对难度高低。当样本足够大时,测验分数接近于正态分布,如果被试在所要测的特性上成正态分布,则可以根据正态曲线表,将难度转化成等距量表,用Z分数表示难度。-较难的项目难度为正值,较易的项目分数为负值,中间难度的得分值为0但是Z分数有小数点和负值,便是难度又不便之处,需要进一步转换,最常见的是美国教育测量中心(ETS)所采用的以Δ(delta)作为难度指标:转换公式:Δ为难度指标;Z为标准分数;13为转换公式的平均值;4为转换公式的标准差。Δ=13+4ZP=0.9987时,Z=-3,故Δ=13+4(-3)=1P=0.9772时,Z=-2,故Δ=13+4(-2)=5P=0.8413时,Z=-1,故Δ=13+4(-1)=9P=0.5000时,Z=0,故Δ=13+4(0)=13P=0.1587时,Z=+1,故Δ=13+4(+1)=17P=0.0228时,Z=+2,故Δ=13+4(+2)=21P=0.0013时,Z=+3,故Δ=13+4(+3)=25由于Z分数大部分的数值都包含于±3之间,因此可知:由此可见,常用的Δ值域介于1~25之间;Δ值越大,试题越难;Δ值越小,试题越容易。项目的难度-难度与测量的关系项目的难度-难度与测量的关系2、难度对测验的影响1)难度与测验分数的分布通过考察测验分数的分布,可以对测验的难度做出直观检验。由于人的心理基本上是呈常态分布的,而我们目前所采用的统计方法大都以正态分布为前提。如果被试样本具有代表性,对于中等难度的测验,其分数分布呈正态分布。如果所获得的分数不是常态的,而是如图所示的a或b的情形,得分偏高或偏低,则为偏态分布。项目的难度-难度与测量的关系正偏态分布,即大多数得分集中在低端,说明编制的测验对于所要研究的样本团体来说偏难,因此必须增加足够数量的较容易的项目。负偏态分布,即大多数得分集中在高分端,说明测验过易,必须增加足够数量的有较高难度的项目。1)难度与测验的信度难度影响测验分数的离散程度和信度。难度太大或太小的测验,被试得分集中在高分端或低分端,测验分数之间的变异变小,则测验分数的方差也变小,rxx值将降低。项目的难度-难度与测量的关系221etttSrS项目的区分度-定义定义:指测验项目对被试心理品质水平差异的区别程度。区分度高的项目,能将不同水平的被试区分开来;区分度低的项目,则不能很好地鉴别被试水平。区分度一般用D表示,取值范围介于±1之间,值越大,区分效果越好。D为正值,称为积极区分。D为负值,称为消极区分。D为0,称为无区分。评价测验项目的区分度高低依赖于对被试水平的准确测量,一般称为效标分数。项目的区分度-计算1、项目鉴别指数法区分度分析的一种简便方法是比较测验总分高和总分低的两组被试在项目通过率上的差别,二者通过率之差为鉴别指数D。式中PH为高分组在某项目上的通过率,PL为低分组在某项目上的通过率。D值为1时,高分组全部通过,低分组完全失败;D值为0时,两组的通过率相等。当样本较大(100)或分数分布式正态分布时,一般按照高低分组各取27%规律进行。当样本小(100)时,则不易用27%规则,可以把上下半被试直接作为高低分组。D=PH-PL1965年,美国测验专家伊贝尔根据长期的经验提出用鉴别指数评价项目性能的标准,如下表所示:项目的区分度-计算鉴别指数(D)项目评价0.40以上0.30-0.390.20-0.290.19及以下很好良好,修改后会更佳尚可,但需修改差,必须淘汰项目的区分度-计算2、相关法(项目-总分相关):以项目分数与效标分数(测验总分)的相关作为项目区分度的指标二列相关:适用与两个可以连续测量的变量,但其中有一个由于某种原因被分成两个类别。当一个测验的项目是连续的,而效标或测验总分被分为高、低或及格、不及格两类别时,就可以用;有时效标或测验总分是连续的,而项目分数被人为分成对、错或通过、不通过两类,也可用此法。点二列相关:适用于一个变量为连续变量,另一个变量为二分变量的资料。积差相关:非二分法计分的题目,但是如果某个项目在总分中占的比重大,该题目的区分度可能被高估,这时应扣除该项目分数。项目的区分度区分度的相对性1、不同的计算方法,所得区分值不同---区分度有几种计算方法?2、样本容量大小影响相关法区分度值的大小---样本越大,区分度越……3、分组标准影响鉴别指数---分组越极端,区分度越……4、被试样本的同质性程度影响区分度值的大小---样本越同质,区分度越……区分度与信度的关系一般来讲,测验的信度随区分度的提高而增长。信度的增长速度较区分度快,因此要提高信度,提高区分度是方法之一。美国测量学家R.L.艾伯(1962)的发表的研究结果如下:Prxx------------------------------------------0.12250.0000.16000.4200.20000.6300.30000.8400.40000.9150.50000.949-----------------------------------------------项目的区分度区分度与难度的关系区分度和难度都是相对的,是针对一定团体而言的,绝对的难度和区分度是不存在的。一般来说,较难的项目对高水平被试区分度高,较易的项目对低水平被试的区分度高。如下所示:PD------------------------------------------1.000.000.900.200.700.600.600.800.501.000.400.800.300.600.100.200.000.00-----------------------------------------------项目的区分度题目的综合分析和筛选(一)题目的分析步骤1.选取有代表性的样组实施测验。2.计算每个人的总分,然后按总分分组。3.计算高分组和低分组通过每一题的比率。4.分别求出每一测题的难度和鉴别指数。5.选项分析。6.修改测题或选项。(二)题目的筛选1、筛选方法:根据难度挑选项目:一般要求题目的难度值要位于0.20-0.80之间,有的平均难度要在0.50左右;根据区分度挑选项目:鉴别度在0.30以上,有些区分度在0.20-0.30之间的项目如果很好的体现测验目的,也可酌情保留。2、通常判断选项好坏有以下几点:1)正确答案无人选或少于其它选项的人数。2)错误答案选的人太多。3)正确选项高分组选择人数少于低分组。4)错误选项上高分组选择人数多于低分组。5)选项无人选择。6)未答人数较多。题目的综合分析和筛选