1心理卫生评定量表的信度与效度分析姚应水皖南医学院3SCL-90症状自评量表LSR生活满意度量表BDIBeck抑郁问卷MMPI明尼苏达多项人格测验请列举一些你所使用过或接触过的量表量表的作用是什么?4你如何解释下述现象?一个很聪明的孩子,测得智商是80分一个学习很好的学生,考试成绩为60分一个人缘很好的人,人际关系测量低于常模值5量表是我们用来了解心理特质的工具,但这个工具是有误差的。误差要控制在一个许可的范围内。量表帮助我们了解心理现象(心理特质),就像尺子帮助我们测量身高。误差自始至终存在于一切科学实验的过程之中。误差的分类抽样误差与测量的优劣没有必然的联系。因此,进行信度和效度评价时,可以忽略抽样误差。系统误差它直接影响测量的准确性,与效度有关。但它在测试中不引起测量结果的不一致性,故与信度无关。随机测量误差与信度和效度都有关系,信度则完全受随机测量误差的影响。78信度9什么是信度(reliability)?指测量结果的稳定性和可靠性程度。描述性定义一个被测团体真分数的变异数与实得分数的变异数之比。测量学定义(操作性定义)信度的种类及估计方法重测信度复本信度内部一致性信度评分者信度11(一)重测信度(test-retestreliability)指用同样的测量方法在不同时段对同一对象进行重复测量,所得结果的一致程度。一致程度越高,则该测量方法稳定性越好,重测信度也就越高。重测信度大小等于同一组被试在两次测验上所得分数的皮尔逊积差相关系数。))()()(())((2222nYYnXXnYXXYr举例使用的前提条件:1)测验所测的特质必须是稳定的,即被测的特征和属性在两次测验之间没有发生变化2)把握适当的时间间隔,遗忘和练习的效果基本上相互抵消3)两次施测期间被试的学习效果没有差别计算重测信度应注意的问题:两次测验时间间隔要适当总的原则是时间间隔要长到第一次的测试对第二次的测试结果不会产生影响,但也不能太长以至于客观情况已发生了变化所测试变量的性质应当较为稳定。如个性、价值观、生活质量等测试环境应当一致应尽量保证第二次测试环境与第一次测试的环境相同,以减少外部变量对结果的干扰。15(二)复本信度(Alternate-formReliability)用两个平行测验(同一测验的两个复本)在相距最短时间内测量同一组被试所得结果的一致性程度复本信度大小等于同一组被试在两个复本测验上所得分数的积差相关系数。计算公式同重测信度))()()(())((2222nYYnXXnYXXYr举例复本信度的注意事项两个测验必须在项目的内容、形式、数量、难易、时限、指导语等方面相同或相似。两次测验的时间间隔要适当。局限:复本法只能减少而不能排除练习和记忆效应。对于许多测验来说要建立复本是非常困难的。18(三)内部一致性(internalconsistency)信度指组成研究工具的各项目之间的同质性或内在相关性,内在相关性越大或同质性越好,说明组成研究工具的各项目都在一致地测量同一个问题或指标,也就是说明工具的内在一致性越好,信度越高。•估计内在一致性系数的方法有:•分半信度•克朗巴哈α信度系数、•库德—理查逊的KR-20值1.分半信度(split-halfreliability)概念:在测验没有复本且只能实施一次的情况下,按题目的奇偶顺序或其他方法可将测验项目分成对等的两半,根据被试在这两半测验中所得的分数计算相关系数,即得分半信度。计算方法:对这两个部分的数值进行相关分析,计算分半信度系数rhh,然后采用Spearman-Brown公式对rhh进行修正以计算分半信度rtt。举例2.克朗巴哈α信度系数(Chronbach’sαcoefficient)Chronbach’sα信度系数是Cronbach于1951年创立的,用于评价问卷的内部一致性。α系数取值在0到1之间,α系数越高,信度越高,问卷的内部一致性越好。举例可以认为内在一致信度较好•3.库德—理查逊的KR-20值(Kuder-Richardsonformula20,KR-20)•KR-20值也是分析所有项目间的平均一致程度,但是,KR-20值公式要求项目以0、1记分。•KR-20值计算方法:•在一定意义上KR-20值是克朗巴哈α系数的一种特例。211tiittSqpnnr24(四)评分者信度(interraterreliability)当不同评分者使用相同工具,同时测量相同对象时,需计算评分者间的一致程度。几个评分者的评分越一致,评分者信度越高计算方法:当只有两个评分者时,若为连续变量评分,则计算简单相关系数(r);若为等级变量评分,则计算等级相关系数(Spearman等级相关系数)。当测试的评分者三个以上,且测试采取等级评分时,可以用肯德尔和谐系数,计算公式为:举例26以上介绍的各种信度估计方法都是对测试的一致性进行估计,但由于误差来源不同,它们研究的侧面各不相同重测信度:估计测试中跨时间的一致性。复本信度:估计测试跨形式的一致性评分者信度:估计测试跨评分者的一致性内在一致性系数:估计测试跨项目或两个分半测试之间的一致性影响信度的主要因素27测试工具本身的影响测试实施过程的影响①测试题目取样不当②测量的难度③测题或指导语用词不当、时限过短①测试环境②测试者穿着、言谈举止不符合施测要求③评分不客观、登记分出错影响信度的主要因素28被试者(被调查者)的影响测试得分的分布范围及测试长度的影响①被试者的动机②被试者的焦虑、生理因素③测试经验、学习和教育的影响①测试得分的分布范围越宽、信度系数就越高。②信度系数也是一种相关系数,受到样本中各被试的能力或者特性的范围影响。③其他条件不变时,测试长度越长,即题目数越多,信度就越高29效度30什么是效度(validity)?概念:又称准确度,是用以反映测量结果与“真值”的接近程度。对于一个标准测验来说,效度比信度更为重要。效度分析的意义:是量表(问卷)调查研究中最重要的特征,效度越高表示该问卷测验的结果所能代表要测验的行为的真实度越高,越能够达到问卷测验目的。它反映了对问卷的系统误差的控制程度。效度的性质效度是针对测验结果的效度是针对某种特定的测验目的的效度只有程度上的差别(只有程度上的差别,没有全或无的差别)效度是测量的随机误差和系统误差的综合反映判断一个测量是否有效要从多方面搜集证据常见的效度种类内容效度指量表测量的内容与所要测量的内容之间的吻合程度。即测试对象对问题的理解和回答是否拟于设计者希望询问的内容一致。结构效度根据研究者所构想的量表结构与测试结果吻合程度。标准关联效度又称校标效度。即以一个公认有效的量表作为标准(通常称为金标准),检验新量表与标准量表测量结果的相关性。3233评价方法适用主要通过主观经验判断文献分析法专家咨询法适用于成就测验、选拔和分类的职业测验不适于能力倾向测验和人格测验内容效度34评价方法适用主成分分析因子分析相关分析主要用于智力测验、人格测验结构效度35评价方法适用相关分析(计算效度系数)区分法主要用于成就、智力、能力倾向、职业兴趣、人格等测验标准关联效度可分为:(1)同时效度,又称平行效度(convergentvalidity),是指测试工具与现有标准之间的相关。(2)预测效度,是指测试工具作为未来情况预测指标的有效程度。•结构效度能帮助我们运用测验分数解释人的心理特质•标准关联效度可用来了解测验分数能否有效地预测或估计某种行为表现•内容效度研究的问题是变量的内容范围影响效度的因素测试本身的因素测试题中所用词汇、句型难度不能过大量表中所提的问题意思应当清楚、测试题不能有额外线索测试题要合理编制答案不能有规律(或组型)测量的数目测量的难度要适当测试实施和计分方面被试对象的主观因素样本方面38信度与效度的关系A准确度和可靠度都好C准确度差、可靠度好B准确度较好、可靠度差D准确度和可靠度都差40同时具有信度和效度有信度,但没有效度既没有信度,也没有效度两者存在着必然的联系:高信度是高效度的必要条件,但非充分条件。即信度高不一定其效度就高,但没有效度,信度就毫无意义;没有信度就不可能有效度,若想获得较高的效度,其信度必定要高。41提高量表(问卷)信度的方法适当延长问卷的长度问卷的难度适中问卷的内容尽量同质测验的时间要充分测验的程序要统一42提高量表(问卷)效度的方法理论正确,解释清楚操作规范以减少误差控制系统误差样本适宜且要预防流失适当增加问卷的长度排除无关因素干扰43量表(问卷)的制定细节决定成败!