第七章心理与教育测验的编制与实施第一节编制心理与教育测验的基本程序第二节测验的使用第一节编制心理与教育测验的基本程序•一、确定测验的目的•二、产生测题•三、测验的标准化•四、测验的量表与常模•五、鉴定测验的基本特征•六、编制测验指导书一、确定测验的目的•1、明确测验用途•2、明确测验对象•3、分析测量目标一、确定编制测验的目的1.明确测量用途•(1)测验的编制者首先要明确的就是自己所编制的测验是用来测量哪种心理结构或者说心理特质。明确了测验用途,才能有的放矢的去寻找测验的理论依据。•(2)明确测量用途的同时还要明确所编制的测验是属于常模参照测验还是标准参照测验。韦氏智力测验构架•评估多种认知能力的测验组合–分测验的量表分:IQ=3Z+10–言语、操作和全量表:IQ=15Z+100•量表构成全量表言语操作常识类同算术词汇记忆广度填图积木拼图译码排序理解迷律2.明确测量对象也就是明确测量哪些个人或团体。年龄:WAIS(适用于16岁以上)、WISC(6-16岁)、WPPSI(4-6岁)WISC和WPPSI在译码分测验上存在差异教育水平:文化背景:文化背景的不同,往往导致心理结构取向的不同。加德纳的观点译码(coding)或数字符号(digitsymbol)主要测查注意力、简单感觉运动的持久力、建立新联系的能力和速度。文书工作人员得分高,具有强迫观念和强迫行为者得分高。做事认真、一丝不苟者得分低;女性比男性得分高。3.分析测量目标(1)确定能表征所欲测量的心理结构的行为心理特质→行为→行为样组→项目——回顾以往研究成果,看哪些行为经常被人用来界定该理论结构且效果较理想。(如态度的三成份:认知、情感、行为倾向)——考虑时代的特点——了解受测群体的实际情况——向有关专家、资深者咨询和请教(2)确定每一类行为的项目比例——平衡项目之间的比例的目的是使测验结构的各种行为的比重与测验者所认为的比重相当。以《大学生恐惧障碍问卷》的编制为例•DSM(美国《精神障碍的诊断与统计手册》)系统和ICD(《国际疾病分类》)系统以及CCMD(《中国精神疾病诊断标准》)系统•这三个疾病诊断系统对恐惧障碍的定义基本相似,认为:恐惧障碍是一种以过分地、不合理地惧怕外界客体或情境为主的心理障碍,恐惧发作时往往伴有显著的焦虑和自主神经症状,并且导致患者极力回避其所害怕的客体或情境。根据文献分析和访谈交流的结果,大学生恐惧障碍倾向问卷可以分为4个基本维度:躯体症状,主观体验,回避行为,恐惧思维。研究假设:《大学生恐惧障碍倾向问卷》的结构包括躯体症状、主观体验、回避行为和恐惧思维四个维度。二、产生测题•1、选择项目形式•2、初步组成测题•3、检查测题并初步修改•4、预测和对预测结果进行分析•5、测题的选择、编排及最后测题的确定(1)最高行为测验的项目形式(1)是非题——一个陈述(或问题)及两个可能的答案(真——假或是——否)。例:橘子树树叶上的黑斑最可能的起因是虫害。真假(2)多项选择——作为问题或提问的提干;一个正确答案或关键答案;以及两个或更多个不正确的答案,这些不正确的答案也称作干扰项。例:一颗橘子树有许多叶子上长有黑斑。这可能是因为:A。除草剂损害B。细菌感染C。昆虫侵扰D。营养不良3。匹配——一段陈述,说明要按照一定的原则将两列对象联结起来;一列是前提或刺激;一列是答案。例:在左侧列出的每个特征前,写上右列中最可能原因的对应字母。特征主要原因()1。黄叶A。严寒气候的损害()2。干裂的树皮B。缺氮()3。树叶上的锈点C。真菌感染()4。带斑点的叶子D。除草剂的损害E。病毒感染(2)调查问卷项目形式态度和人格问卷最常用的项目形式:二分法形式(同意——不同意)、Likert形式。1。儿童应绝对服从父母。同意不同意2。儿童应该无条件服从父母非常同意同意中等不同意非常不同意12345大学生恐惧障碍问卷(部分)说明:本问卷由20道与日常生活有关的陈述组成。当你阅读每条陈述时,请考虑它与你的行为、感情、态度或意见的符合程度。请根据你的实际情况认真如实地选择一个最符合你的选项,并在该选项上打“√”。1.我同陌生人谈话很容易a、极不同意;b、较不同意;c、比较同意;d、非常同意2.我无缘无故地对某些东西特别害怕a、极不同意;b、较不同意;c、比较同意;d、非常同意3.假如有人在评价我,我很容易想到最坏的评价a、极不同意;b、较不同意;c、比较同意;d、非常同意4.我总是尽量避开某些物件或数字a、极不同意;b、较不同意;c、比较同意;d、非常同意以《大学生恐惧障碍问卷》为例•本问卷采用Likert自评式4点量表计分,“极不同意”计1分,“较不同意”计2分,“比较同意”计3分,“非常同意”计4分。为提高问卷的信、效度,部分题项将采用反向计分的形式。2、初步组成测题•测题的格式确定以后,根据原先拟定的双向细目表,可以进入测题的编写阶段。一般初选题目的数量应是测验计划数量的2-3倍,以备修改和删减。•编题者在编题时,可以考虑以下几个来源:直接选自国内外优秀的相关的测验;修改前人的测验中的有关测题;自己编写。3、检查测题并初步修改测题初步形成以后,编制者应自己或请教资深的人员对测题进行初步的检查,而不是立即投入预测。检查的方面主要应包括:(1)测题编制的技术性问题(2)初步确定测题是否具有有效性和可信度4、预测和对预测结果进行分析预测注意事项:•①预测时所用的被试应该是从测验对象这个全域中抽取的,也即取样时同样应注意其代表性。•②关于预测的人数问题,一般说来,不必太多,绝大多数的被试必须留到后面的正式测验中。•③预测应力求按正规的要求进行,使其与将来正式测验的情况相近似。预测结果的分析:•难度、区分度、信度、效度以《大学生恐惧障碍倾向问卷》的编制为例选取200名在校大学生作为被试,施测《大学生恐惧障碍倾向问卷》预测问卷,进行相关的心理测量学分析,删除不恰当的题项,以形成《大学生恐惧障碍倾向问卷》正式问卷。类别名称人数%学校苏州大学7412.89%苏州科技学院18532.23%西南大学12421.60%井冈山学院478.19%甘肃政法学院14425.09%合计574100%年级一年级16929.44%二年级16428.57%三年级18532.23%四年级569.76%合计574100%学科文科39268.29%理科18231.71%合计574100%性别男23741.29%女33758.71%合计574100%恐惧障碍问卷的项目分析项目与总分的一致性注:**p﹤0.01项目与总分相关rp1.384**p2.596**p3.519**p4.576**p5.558**rp6.381**rp7.421**p8.552**p9.526**•为了检验各项目的辨别力,再对问卷的项目进行区分度的计算。具体方法为:先将量表总分按从小到大排序,抽取所有被试的前27%和后27%设为两组,将其命名为低分组和高分组,然后对每个项目在这两组间进行T检验,结果见表3项目组别NMeanStd.DeviationtdfSig.(2-tailed)p1高分组1581.5759.4957710.042263.608.000低分组1641.1098.31354p2高分组1583.0696.6396417.955319.993.000低分组1641.7683.66089p3高分组1582.6076.9227212.572296.841.000低分组1641.4451.72003p4高分组1582.6076.7967713.482306.544.000低分组1641.5000.66922p5高分组1582.6646.7453517.915312.354.000低分组1641.2561.66112p6高分组1583.0886.671349.362319.488.000低分组1642.3598.725415、测题的选择、编排及最后测题的确定•项目的选择•项目的编排并列直进式:依测验的性质将测题组织成若干分测验,同一分测验的测题依其难度由易到难排列,如韦氏智力测验。混合螺旋式:先将各类测验项目依难度分成若干不同的层次,再将不同性质的测验项目予以组合,做交叉式的排列,项目难度逐次上升。韦氏智力测验构架•评估多种认知能力的测验组合–分测验的量表分:IQ=3Z+10–言语、操作和全量表:IQ=15Z+100•量表构成全量表言语操作常识类同算术词汇记忆广度填图积木拼图译码排序理解迷律选取660名左右全日制在校大学生作为被试,同时施测《大学生恐惧障碍倾向问卷》正式问卷以及《艾森克人格问卷简式量表中国版》、《简易应对方式问卷》和《症状自评量表》;并进行《大学生恐惧障碍问卷》的信效度检验,以及人口学变量的差异分析。对问卷的同质性信度、分半信度进行分析,以考察问卷的稳定性。克龙巴赫α系数分半系数总量表0.83040.8179躯体症状0.79100.7674主观体验0.74890.6588回避行为0.73280.6073恐惧思维0.78600.5804效度研究:•结构效度•经过探索性因素分析,大学生恐惧障碍倾向问卷共抽取出4个因素,解释了总变异的53.261%,这与当初的理论构想基本一致。另外,各分量表与总量表呈中高度相关,而各分量表之间则呈中低相关,说明问卷的结构效度良好。相容效度(以SCL-90为参照)总量表躯体症状主观体验回避行为恐惧思维躯体化.412**.335**.249**.226**.319**焦虑.499**.326**.402**.277**.352**恐怖.526**.358**.361**.303**.435**结束语最后,我们通过讨论测验编制过程中可能存在的四步失真问题作为本节的结束语。•1。理论基础•2。确定代表心理结构的行为样组•3。编写测题•4。实践这几步失真的存在有可能使我们的测验偏离预期所想要达到的效果,因此,在编制和实施测验过程中,重视并尽量降低“失真”的程度是十分重要的,同时,也提醒测验的实施者在解释测验结果时不可迷信分数,而给被试轻易贴上“标签”,最好的办法是同时参考不同测验的结果。三、测验标准化•(1)指导语会直接影响受测者的作答态度与方法。有人以不同的指导语对几组被试实施同一个能力测验,结果表明,将该测验说成“智力测验”的一组,成绩最高;将之说成“日常测验”的一组,成绩最低。•(2)确定测验时限一般采用尝试法,即通过预测来决定。假设根据第一次试测的经验,我们估计大部分被试可以在25分钟内做完,在第二次试测时,可以先叫被试用黑铅笔做20分钟,然后再换成红铅笔,再过5分钟换成蓝铅笔。这样便可以了解被试在规定时间内完成题目的数量。第二节测验的使用测验的使用主要涉及两个问题:•1。如何实施测验才能保证测验分数尽可能少受施测过程的影响;•2。如何解释测验分数才能保证受测者的心理不受负面影响。本节主要围绕这两个问题讨论心理测验的一些技术性问题。第二节测验的使用•一、主试的资格•二、测验的选择•三、测验的施测1.施测前的准备工作2.指导语3.测验情境4.测验焦虑5.与受测者建立良好的协调关系•四、测验的评分及分数的解释1.如何看待测验分数的意义2.如何向受测者报告测验分数一、主试的资格•1、心理测验的专业理论知识•2、心理测验的专业技能个别施测的心理测验的主试要求比较高。•3、测验工作者的职业道德主试必须具备一定的心理测验专业理论知识,这是考察资格的最基本条件•了解心理测量和测验的特点和性质、作用与局限性•了解测验的基本特征,如信度和效度等心理测量学指标•保证测验标准化的必要性韦氏智力测验构架•评估多种认知能力的测验组合–分测验的量表分:IQ=3Z+10–言语、操作和全量表:IQ=15Z+100•量表构成全量表言语操作常识类同算术词汇记忆广度填图积木拼图译码排序理解迷律对测验保密是测验工作者的职业道德•测验工具和有关测试资料(如测验结果和个案记录等)只能由有资格的人保管,并需采取适当的步骤。切不可将测验借给不够资格的人员使用;•心理测验的内容不可泄漏,心理测验和其他评量工具一样,只有被试事先未曾熟悉内容