第一章心理与教育测量概论练习与思考1.与物理测量相比较,阐明心理测量的特点。2.为什么人们不能象对物理测量那样容易接受心理测量?(此题为思考题)3.如何才能证明心理测量的必要性和可能性?解答要点:1.(1)从依据的法则来说,心理与教育测量依据的法则在很大程度上只是一种理论。(2)从测量的内容来说,心理与教育测量的内容是复杂的,内隐的,其测量只能是间接的。(3)相对与物理测量的定量分析的精确度而言,心理与教育测量定量分析的精确度很低。3.(1)从心理与教育测量的理论基础来看,心理测量是可能的。(2)人的心理现象和知识水平如同其他一切物理现象一样是有差异的,这种差异既有质的方面,也有量的方面,因此有必要测定出这些差异的数量。第二章心理与教育测量的产生与发展练习与思考1.简述古代中国对心理与教育测量的贡献及其特点。2.心理与教育测量从卡特尔到比内的发展过程中可以看出什么特点?(此题为思考题)3.推孟和韦克斯勒在智力测验发展过程中各有什么贡献?解答要点:1.在古代中国,在测验实践和测验理论方面都对心理与教育测量作出了贡献并具有自己的特点。一、在测验实践方面的贡献。1、在能力测量方面。早在2500年前,思想家和教育家孔子凭自己的经验观察,首先评定学生能力的个别差异,并将人的智力分成中上之人、中人和中下之人三个等级。董仲舒已论及到注意测验。刘邵把人的才能划分为12种类型。6世纪中叶,中国江南出现了类似现在的婴儿发展测验的周岁试儿习俗。出现于清代的益智图、九连环可以认为是最早的创造力测验。2、在人格测量方面。孔子把人分为狂者、狷者和中行3种。刘邵根据阴阳、五行和形体的关系及其人的行为表现,把人的性格划分成12种类型。3、在教育测量方面。世界上最早的教育测量出现于中国西周奴隶时期。据记载,在西周的国学中已经建立具有相当系统性的教育测量制度。在汉代,考试制度、考试类型和考试功能方面都作了重要的发展。除了学校内部测量的自身发展以外,取士制度自汉以来的发展,客观上也对我国的古代乃至西方的教育测量发展起了促进作用。二、在测验理论方面的贡献。孔子后约150年,大思想家孟子就指出了测量人类心理的必要性和可能性。他说:权,然后知轻重;度,然后知长短。物皆然,心为甚。刘邵认为,人才鉴定对于知人善任、振兴国家事业具有重要意义。他说:夫圣贤之所美,莫美乎聪明。聪明之所贵,莫贵乎知人。知人诚智,则众材得其序,而庶绩之业兴矣。三、古代中国心理与教育测量的特点。第一、中国古代社会的心理与教育测量思想都是描述性的,而非定量的;第二、中国古代社会的心理与教育测量是分类式的;第三、注重对人作整体的鉴定和评价,并倾向于和人的道德品质联系起来。第四、是与教育中的因材施教及人才使用有着密切的联系,它从一开始就具有强烈的应用性质。2.①推孟在智力测验发展过程中的贡献是他采用了比率智商的概念来表示智力水平的高低。②韦克斯勒在智力测验发展过程中的贡献是:第一,他用离差智商代替比率智商,克服了比率智商的局限;第二,他编制的智力量表分为言语量表和操作量表两部分,不仅能够获得总体智力水平的信息,而且可以获得手测者智力优势的信息。第三章经典测量理论的基本假设练习与思考1.简述心理特质的含义。2.心理测量的误差来源主要包括哪些?3.CTT模型及其假设的重要内容是什么?答案要点:1.心理特质指表现在一个人身上所特有的相对稳定的行为方式,就是人的心理特质。可以从下面几个方面来理解:(1)特质是一组具有内部相关的行为的概括,具有一定的抽象性。(2)特质是一种一般的神经心理系统,……它可以综合不同刺激,使人对这些刺激做出相同的反应。(3)特质是一个人身上比较稳定的特点。(4)一个人的精神面貌(人格)是由多种特质分多个层次有机组合而成的。(5)特质可以决定一个人对特定刺激的反应倾向,可以对人的行为进行某种预测。2.心理测量的误差主要来自3个方面:测量工具、被测对象和施测过程。3.CTT模型是:经典测验理论假定,观察分数(记为X)与真分数(T)之间是一种线性关系,并只相差一个随机误差(记为E)。即:X=T+E其主要内容为:(1)若一个人的某种心理特质可以用平行的测验反复测量足够多次,则其观察分数的平均值会接近于真分数。即:E(X)=T或E(E)=0(2)真分数和误差分数之间的相关为零。即:ρ(T,E)=0(3)各平行测验上的误差分数之间相关为零。即:ρ(E1,E2)=0第四章测量信度练习与思考:1.指出各种信度系数所对应的误差来源。2.已知16人参加一次测验后在奇数题和偶数题上的得分情况,试用两种以上方法估计测量信度。(此题为思考题)被试12345678910111213141516奇数题32404228353041283234263436254041偶数题313945304029393032303040362640423.已知某态度量表用道题,被试在各题上得分的方差分别是0.80,0.81,0.79,0.78,0.80,0.82,测验总分的方差为16.00,求α值。(此题为思考题)4.怎样提高测量信度?解答要点:1.对重测信度来说,其对应的误差来源有:①所测量的心理特质不稳定;②遗忘和练习的效果没有相互抵消;③在两次施测的时间间隔里,所要测的被试的心理特质得到了学习和训练;④两次测查的时间间隔不同在信度不同。对复本信度来说,其对应的误差来源有:①所用的复本不是真正的平行测验;②产生的迁移效应会影响信度的大小。对分半信度来说,其对应的误差来源有:分半的方法会影响测验的信度。对同质性信度来说,其对应的误差来源有:①题目间的相关性;②测验所测内容的单一性与异质性。对评分者信度来说,其对应的误差来源有:3.=6/6-1[1-(0.80+0.81+0.79+0.78+0.80+0.82)/16.00]=6/5×(1-0.3)=0.844.由于项目数量太少会降低测量的信度,所以,提高测量信度的一个常用方法是增加一些与原测验中项目具有较好的同质性的项目,增大测验长度。但是应该注意:1.新增项目必须与试卷中原有项目同质。2.新增项目的数量必须适度。①适当增加测验的长度。②使测验中所有试题的难度接近正态分布,并控制在中等水平。当测验中所有试题的难度接近正态分布并控制在中等水平时,被试团体的得分分布也会接近正态分布,且标准差会较大,以相关为基础的信度值必然也会增大。努力提高测验试题的区分度。③努力提高测验试题的区分度。④选取恰当的被试团体,提高测验在各同质性较强的亚团体上的信度。⑤主试者严格执行实测规程,评分者严格按标准给分,实测场地按测验手册的要求进行布置,减少无关因素的干扰。第五章测量效度练习与思考:1.什么是测量的效度?它与信度的关系这样?2.什么是内容效度?测验编制者和使用者应分别从哪几个方面来把握内容效度?3.什么是结构效度?测验编制者和使用者应分别怎样把握结构效度?4.什么的实证效度?它与内容效度和结构效度有何异同?5.什么是效标和效标测量?6.已知若希望把效度系数提高到0.65和0.70,则测验长度要增加几倍?解答要点:1.(1)效度是指一个测验或量表实际能测出其所要测的心理特质的程度。①信度高是效度高的必要而非充分条件当随机误差的变异减小时,真实分数的变异数增加,测验信度随之提高。信度的提高只给有闲变异数的增加提供了可能。至于是否能提高效度,还要看系统误差变异数的大小。可见,信度高不一定效度就高。但一个测验要想效度高,真分数的变异数必须占较大的比重,即测验的信度必须高。②测验的效度受它的信度制约,根据效度和信度的定义以及公式可得到。2.(1)内容效度是指一个测验实际测到的内容与所要测量的内容之间的吻合程度。(2)测验的编制者和使用者应该从以下几个方面来把握内容效度:①首先应该明确内容效度的含义;②应该明确内容效度的应用范围;③在使用时还要主要不要跟表面效度相混淆;④对测验的编制者来说应该懂得确定测验内容效度的方法,明确确定内容效度的步骤。3.(1)结构效度是指一个测验实际测到所要测量的理论结构和特质的程度,或者说它是指测验分数能够说明心理学理论的某种结构或特质的程度。(2)对于编制者和使用者来说应该从以下几个方面来把握结构效度:①首先应该明确结构效度含义;②其次也应该了解结构效度的特点;③应知道结构效度的应用范围;④对测验的编制者来说应该懂得确定测验结构效度的方法,明确确定结构效度的步骤。4.(1)实证效度是指一个测验对处于特定情境中的个体的行为进行估计的有效性。(2)实证效度与内容效度和结构效度一样都用于估计测验效度。(3)实证效度与内容效度和结构效度的不同之处在于:①它们是估计测验效度的不同方面;②它们的应用范围不同;③确定它们的方法也不同。5.(1)效标是衡量一个测验是否有效的外在标准,它是独立于测验并可以从实践中直接获得的我们所感兴趣的行为。(2)效标测量就是把我们所感兴趣的行为用数字或等级表达出来。6.当效度系数提高到0.65时,测验长度要增加6.4倍;当效度系数提高到0.70时,测验长度要增加20倍。第六章测验的项目分析练习与思考1.测验项目分析的作用是什么?1.因为用测验的项目分析可以解决以下问题:(一)项目是否具有所预期的功能?对于常模参照测验,测题是否有足够的区分度?对目标参照测验来说,测题是否能充分地测量到教学的结果。(二)项目的难度是否得当?(三)项目是否有缺陷?第七章测验常模练习与习题1.试比较各种导出分数的优缺点。2.列举你所了解的各种测验的分数合成方法,并评价它们的合理性。3.选择常模团体与制定常模有什么关系?任何选择好常模团体?4.离差智商与比率智商的本质差异是什么?(此题为思考题)解答要点:1.常用的导出分数有百分等级、标准分数、T分数。百分等级百分等级的优点:百分等级是一种相对位置量数,具有可比性,且具有易于计算、解释方便等优点,对一般教师、学生和家长来说,均能了解百分等级的意义,所以它较适用于不同的对象和性质不同的测验。另外,百分等级不受原始分数分布状态的影响,即使分数分配不是正态的,也不会改变百分等级常模的解释能力。百分等级的缺点:(1)百分等级的单位不等,尤其在分配的两个极端。如果原始分数的分配是正态或近似正态分布,则靠近中央(平均数或中位数附近)的原始分数转换成百分等级时,分数之间的差异便夸大了,虽然原始分数比较靠近,但转换成百分等级后,却显示出很大的差异性;对接近两极端的原始分数,百分等级反应迟钝,即使原始分数发生较大的变化,也不能引起百分等级的相应变化,使得其差异被缩小了。(2)百分等级只具有顺序性,无法用它来说明不同被试之间分数差异的数量。它不适合计算平均数、相关系数及其它统计量数。(3)百分等级只相对于特定的被试团体而言的。因此在解释时不能离开特定的参照团体。被试得分不变,但参照团体改变了,百分等级值就可能发生变化。所以在报告百分等级时,一定要说明是相对于什么参照团体来说的。标准分数标准分数的优点:标准分数是一个抽象值,不受原始测量单位的影响,并可接受进一步的统计处理。具有可比性和可加性。标准分数的缺点:由于计算中经常出现负数和小数,且单位过大(一个标准差单位),所以,使用起来不够方便。T分数T分数的优点:(1)具有等单位特点,便于工作进一步的统计分析。(2)正态分布下,可以利用正态分布表将各种导出分数与百分数等级分数作换算。(3)正态分布下,运用某种变式分数可以将几个测验上的分数作直接的比较。即使是非正态分布,也可运用由正态化的Z分数转换而得的变式分数进行直接比较分析。T分数的缺点:(1)分数过于抽象,不易理解,正如在介绍麦柯尔的T分数时所提到的那样不为一般人所熟悉。(2)在非正态分布下,分布形态不同的变式分数,仍然不可以作相互比较,也不能相加求和。2.(1)临床诊断--直觉合成:在实际工作中,最常用的组合测验分数的方法是根据经验对测验分数作直觉的组合,这就好比临床医生,把各种化验、检验所获得的资料与实际观察所得的结果结合起来,根据经验作出诊断一样。象这种根据直觉的经验,主观地将各种因素加权,而获得结论或预测的方法叫作临床诊断。临床诊断--