1项目分析2测验的项目分析:定性分析和定量分析定性分析:测验的内容效度、题目编写的恰当性和有效性定量分析:对题目的难度和区分度进行分析项目分析的目的是:通过选择和修改测验题目,提高测验的信度和效度。3项目的难度分析难度(difficulty),指项目的难易程度,能力测验中一个重要的指标。在人格测验中,类似的指标是“通俗性”。即取自相同总体样本中,能在答案方向上回答该题的人数。两种指标的计算方法是相同的4难度的计算二分法记分的项目(1、0记分)公式(通过率):P=R/N×100%P指项目的难度(通过率)R答对或通过该项目的人数N全体被试人数5举例:第一题10名被试中8人答对,其难度为:P1=8/10×100%=80%6样本例数较大时的计算方法根据测验总成绩将被试分为三组高分组(NH):分数最高的27%中间组:分数居中的46%低分组(NL):分数最低的27%计算高分和低分组的通过率计算两组平均通过率作为难度指标公式:P=(PH+PL)/2P指难度(通过率)PH指高分组通过率PL指低分组通过率7举例:某测验条目高分组通过率为85%,中间组通过率为52%,低分组通过率为35%,问平均通过率是多少?P=(PH+PL)/2=(0.85+0.35)/2=60%8吉尔福特的难度校正公式因为选择题易受到猜测的影响,备选答案越少,机遇的作用越大,越不能反映真实难度,吉尔福特的校正公式用于对此进行校正。公式:P校正前通过率K备选答案数目CP校正后通过率11KPKCP9举例:上题若为5选1的题型,请计算校正后的通过率?5.01516.0511KPKCP10非二分记分项目的难度计算公式:X指全体被试在该题上的平均得分Xmax为该题的满分举例(前例5):计算难度(通过率)第一题平均得分1.8分,最高分2分,通过率:P1=1.8/2.0×100%=90%100maxXXP11难度水平的确定进行难度分析的目的是为了筛选条目,项目难度多高合适,取决于测验的目的、性质及项目的形式。一般而言,难度(通过率)在0.5时,区别力最高,对信度和效度影响最好。在能力测验中,为了使尽可能少的人在测验中得0分或得满分,因此必须安排很容易的项目和很难的项目,但测验的平均通过率最好控制在0.5水平。12测验的难度测验的难度取决于组成测验项目的难度通过观察测验分数的分布,可以进行直观检验。如果测验难度适中,分数的分布应当接近常态分布;如果测验偏难,分布呈正偏态(图13-4,A)如果测验偏容易,分布呈负偏态(图13-4,B)测验偏难或偏容易时,可以通过增加或减少不同难易程度的条目来解决。13MMAS不同年龄组各分测验的难度18-19岁组20-24岁组25-29岁组30-34岁组35-39岁组40-44岁组45-49岁组总平均难度自由组词.35.33.40.40.34.31.30.33图画再认.82.80.76.78.71.68.74.76残图命名.34.28.27.28.24.25.23.27汉词配对.75.67.61.56.46.48.44.57图符配对.67.64.58.55.42.43.35.52人名配对.37.32.31.25.19.17.14.25数字广度.49.49.49.46.41.39.40.45汉词广度.41.40.39.35.34.33.34.37空间广度.36.34.31.30.27.26.24.30汉词再认.62.57.54.56.50.51.53.55人面再认.57.51.52.50.49.44.51.51汉词回忆.31.28.25.27.20.21.20.25图画回忆.56.57.49.49.44.44.40.49图形再生.71.65.64.60.52.52.52.60词对延迟.77.64.67.56.48.48.44.58图符延迟.78.74.71.65.56.52.44.63人名延迟.50.41.40.32.24.18.19.32经历定向.99.99.99.98.98.98.99.98时事常识.65.59.64.58.54.46.50.57生活记忆89.90.89.86.85.83.85.8714项目的区分度项目区分度(itemdiscrimination)也叫鉴别力,是指测验项目对被试者的心理特征的区分能力。高区分度条目:实际水平高者能通过,实际水平低者不能通过。区分度的计算方法鉴别指数相关法15鉴别指数鉴别指数计算步骤按测验总分依次排列确定高分组和低分组高分组:排序最高的27%的被试低分组:排序最低的27%的被试分别计算高分组与低分组在每个项目上的通过率公式:D=PH-PLD指鉴别指数PH高分组在某项目上的通过率PL低分组在某项目上的通过率举例(例8)16计算鉴别指数按总分排序确定高、低分组分组人数=32×0.27≈9人高分组:1~9号低分组:24~32号分别计算高、低分组在1~4题的通过率P1H=9÷9=1.00P1L=2÷9=0.22P2H=8÷9=0.89P2L=2÷9=0.22P3H=8÷9=0.89P3L=1÷9=0.11P4H=6÷9=0.67P4L=0÷9=0.00分别计算各题鉴别指数D1=1.00-0.22=0.78D2=0.89-0.22=0.67D3=0.89-0.11=0.78D4=0.67-0.00=0.6717鉴别指数的判断因为高分组条目总得分上高于低分组,理论上他们每个条目的通过率也要高于低分组。D0时,D越大,说明该条目区分两种水平(组)的能力越强D0则反映高分组的得分反而低于低分组,说明该条目有问题。伊贝尔(L.Ebel,1965)关于鉴别指数评价项目性能的标准:鉴别指数(D)项目评价0.40以上很好0.30~0.39良好,修改后会更佳0.20~0.29尚可,但需修改0.19及以下差,必须淘汰18相关法计算区分度常用的方法是相关法,即以某一条目得分与效标成绩或测验总分进行相关运算。相关系数越高,说明该条目越具有区分功能。常用于项目分析的相关方法点二列相关二列相关Ф相关19点二列相关适用于一类变量为二分变量,另一类变量为连续变量的相关计算。公式:rpq点二列相关系数为与二分变量通过组相对应的连续变量的平均数为与二分变量未通过组相对应的连续变量的平均数St为连续变量的标准差p通过组人数与总人数之比(通过率)q未通过组人数与总人数之比(未通过率)举例(例9):pqSXXrtqppqpXqX20二列相关适用于两个连续变量,但其中一个变量被人为分成两类。公式:rb为二列相关系数y为p与q交界处正态曲线的高度Xp、Xq、St、p、q的意义与点二列相关公式相同当两个变量均为连续变量时,也可使用皮尔逊积差相关方法计算。举例:(例9)ypqSXXrtqpb21公式:ypqSXXrtqpb579.0398.0467.0533.048.227.475.68br22Ф相关此种相关适用于两个变量均为二分称名变量(计数资料)公式:式中a、b、c、d分别代表四格表中第一、二、三、四项中所包含的次数。举例:求成功通过能力倾向测验(以6分为界)与工作成功与否之间的相关?a=22、b=38、c=33、d=7显著性检验:用卡方(X2)检验方法))()()((dbcadcbaadbc45.0)738)(3322)(733)(3822(722333823区分度与难度的关系区分度与难度呈现的是一种曲线(倒“U”的关系)。难度为0.5时,区分度最高难度较高或较低时,区分度中等非常高或非常低的难度时,区分度也很低不同水平被试中区分度与难度的关系较难的题目对高水平被试有较高的区分度中等难度的题目对中水平被试有较高的区分度较容易的题目对低水平被试有较高的区分度平均难度0.5左右,能保持整体较好的区分度。24D的最大值与项目难度的关系项目通过率理论上最大区分度(以总分对半划分高、低分组时)高分组通过率低分组通过率D的最大值1.001.01.00.000.901.00.80.200.801.00.60.400.701.00.40.600.601.00.20.800.501.00.01.000.400.80.00.800.300.60.00.600.200.40.00.400.100.20.00.200.000.00.00.0025注意事项当测验用于选拔或诊断时,应该多选择难度值接近录取率的项目。测验为选择题时,难度值应大于随机猜测概率水平。难度等于概率水平,说明题目可能太难;或题意不清,被试凭猜测作答。难度(通过率)低于概率水平,说明题目有系统偏差。是非题难度值0.75时最合适,四选一题目0.63时最合适。26题目难度在0.3~0.7之间,平均难度0.5时,测验具有较理想的区分度。理论上讲每个单题难度在0.5时具有最好的鉴别效率。同质的题目难度在0.5时,相关有偏高的趋势。在极端的例子中,如果相关为1.0,难度均为0.5,那么50%的人全通过,另50%的人全不通过,区分效率反而下降。区分度取值在-1.0~+1.0之间。区分度为负值:题目不行区分度为正值:越接近1说明区分度越好,越接近0说明区分度越差。一、测验的信度信度的概述:掌握信度的定义和作用,熟悉测量的误差来源及其对信度的影响。估计信度的方法:掌握重测信度、复本信度、内部一致性信度和评分者信度的定义,估计方法和适用范围。影响信度系数的因素:熟悉影响信度的常见因素,了解提高测量信度的常用方法。二、测验的效度效度的概述:掌握效度的定义和作用,了解效度与信度的关系。效度的种类:掌握内容效度、效标效度和实证效度的定义、估计方法和适用范围。提高测量效度的方法:熟悉影响效度的因素,了解提高测量效度的方法。三、测验的项目分析项目的难度:掌握项目难度的意义,熟悉项目难度的计算方法,了解项目难度对测验的影响。项目的区分度:掌握项目区分度的意义,熟悉区分度的计算方法,了解项目区分度对测验的影响。