信度与效度

整理文档很辛苦,赏杯茶钱您下走!

免费阅读已结束,点击下载阅读编辑剩下 ...

阅读已结束,您可以下载文档离线阅读编辑

资源描述

数据处理与SPSS应用信度与效度检验信度与效度有两个指标是考察测评工具的可靠性和有效性的,即信度和效度。信度指的是测量的可靠性或一致性效度指的是测量的有效性或正确性。信度信度,是指使用相同指标或测量工具重复测量相同事物时,得到相同结果的可能性。如果说某个指标或测量工具的信度高,那它提供的测量结果就不会因为指标、测量工具或测量设计本身的特性而发生变化。信度是测量的一致性,即一群受试者在同样测验卷上,测量多次的结果是否都具有一致性。信度本身与测量所得结果正确与否无关,它的功用在于检验测量本身是否稳定,也即在测量多次情况下,其结果是否都能一致的问题。效度效度指的是测量的有效性,即测量工具能准确、真实、客观地度量事物属性的程度。是测量工具能够测出其所要测量的特征的正确性程度。效度越高,即表示测量结果越能显示其所要测量的特征。如果说根据某项特征能够区分人、物或事件,那么说某个测量该特征的测量工具是有效的,就是指它的测量结果能把具有不同特征的人、物或事件进行有效的区分。信度与效度的关系信度是效度的必要条件,但不是充分条件。一个测量工具要有效度必须有信度,没有信度就没有效度;但是有了信度不一定有效度。信度低,效度不可能高。因为如果测量的数据不准确,也并不能有效地说明所研究的对象。信度高,效度未必高。例如,如果我们准确地测量出某人的经济收入,但未必能够说明他的消费水平。效度低,信度很可能高。例如,一项研究未能说明社会流动的原因,但它很有可能很精确很可靠地调查各个时期各种类型的人的流动数量。效度高,信度也必然高。信度是研究结果所显示的一致性、稳定性程度,也是对研究结果一致性和稳定性的评价标准。一个具有信度的研究程序,不论其过程是由谁操作,或进行多少次同样的操作,其结果总是非常一致的。效度是一个研究程序的性质和功能,也是对研究结果正确性的评价标准,一个有效度的研究程序,不仅能够明确地回答研究的问题和解释研究结果,而且能够保证研究结果在一定规模的领域中推广。把两者的作用结合起来看,信度和效度是一项教育科学研究的活动和结果具有科学价值和意义的保证。研究的信度是研究的效度的一个必要的前提,没有信度,效度不可能单独存在,也就是说,一项研究不可能没有信度却具有效度。信度对于效度是必要条件,但不是充分条件,有信度不保证一定有效度,一个可靠的研究程序并不证明内容一定有效,而一个有效度的研究一定是一个有信度的研究。有效度必定有信度,效度高信度必定也高,因为不可能存在唯有效度而没有信度的情况。信度是为效度服务的,因而效度是信度的目的;效度不能脱离信度单独存在,所以信度是效度的基础。内部一致性信度同质性信度分半信度同质性信度是指测验内部所有题目的一致性当各个测题的得分有较高的正相关时,不论题目的内容和形式如何,测验即为同质的;若所有题目看起来好像测量的是同一特质,但相关很低或为负相关时,测验即为异质的。此外,对于一些复杂的、异质的心理学变量,采用单一的同质性测验是不行的,因而常常采用若干相对异质的分测验,并使每个分测验内容具有同质性,这样每个分测验就能用来预测异质效标的某一方面。分半信度指采用分半法估计所得的信度系数。这种方法估计信度系数只需一种测验形式,实施一次测验。通常是在测验实施后将测验按奇、偶数分为等值的两半,并分别计算每位被试在两半测验上的得分,求出这两半分数的相关系数。常见的是将测题按其序列号的奇偶分半,这种分法的前提是:测题并非随机排列,而是按某种顺序(如难度)排列;如果随机排列的题目,则必须是所有题目平等的(要么难度相等,要么性质一样);如果测验有多个分量表,应该在分量表内部排好顺序,再把各分量表分两半组合起来求相关。同质性信度的系数克伦巴赫α系数信度系数可以解释为总的方差中有多少比例是由真实分数的方差决定的,也就是测验的总变异中真分数造成的变异占百分之几。一个测验究竟信度多高才适合,才让人满意呢?当然,最理想的情况是=1.00,但实际上办不到。一般来说,信度系数愈高,工具的信度愈高。在基础研究中,信度至少应达到0.80才可接受,在探索性研究中,信度只要达到0.70就可接受,介于0.70-0.98属高信度,而低于0.35则为低信度,必须予以拒绝。若α<0.35为低信度,0.35≤α<0.7信度一般,若α≥0.7则属于高信度内部一致性信度的检验方法例题:采用某一个由6个项目组成的心理学测验量表对30名被试进行测试。对该量表的内部一致性信度进行分析SPSS:Analyze-Scale-ReliabilityAnalysis(分析-度量-可靠性分析)同质性信度:模型选α分半信度:模型选Split-half(分半)再测信度又称稳定性系数计算方法是采用再测法,即使用同一测验,在同样条件下对同一组被试前后施测两次测验,求两次得分间的相关系数。最适宜的时距随测验的目的、性质和被试的特点而异,一般是两周到四周较宜,间隔时间最好不超过六个月。再测信度的前提假设是:⑴所测量的特性必须是稳定的;⑵每个人对前一次反应的遗忘程度相同;⑶在时间间隔中没有学习另外的与测验有关的东西。例题:使用某量表在4周后对同一批被试进行第二次测验,分析该量表的再测信度。SPSS:Analyze-Correlate-Bivariate(分析-相关-双变量)实质是看前后两次测验变量值的相关系数内容效度内容效度是从测验内容上衡量测验是否达到了测试目的。从两个方面衡量测验的内容效度1.测试目标集中是测验具有良好内容效度的一个必要条件n个公共因子对测验总的方差的累计贡献率是衡量测试目标的集中性的指标。如果这个累计贡献率较大,即n个公共因子在测验中所起的作用较大,说明测试目标集中在这n个公共因子上,如果累计贡献率较低,即n个公共因子在测验中所起的作用较小,说明各测验项目的得分差异大部分是由随机因素造成的,测试的目标太分散,测验的效度就不好。2.根据公共因子的内涵来检查实际测试的结构与原定测试目标的吻合度。如果测试目标是集中的,并且公共因子的内涵与原定测试目标的内容一致,则测验的内容效度良好。结构效度结构效度,是指量表等测量工具对于理论的概念或者特质所能正确反映的程度。检验结构效度的目的,在于探究所建构的假设属性或理论概念是否能够成立。利用因子分析方法来测量量表的结构效度是目前较为理想的方法。研究者在设计量表的时候实际上是假设有某种结构存在,通过因子分析可以考察所用的量表是否能测出真正的结构,即求得量表的结构效度,从而也验证研究者的假设是否成立。另一方面,因子分析也适用于量表潜在结构的探索性研究,即可以帮助揭示某种量表的结构。根据三个原则对不合适的题目进行删减1.删除在两个或者两个以上的公共因子上具有接近因子载荷的题目,即某个题目在两个或者两个以上的公因子上的载荷差不多,比如采用的删除标准是因子载荷的数值为小数点后第一位数字相同)。2.某个公因子下只有一个题目,这样的题目要删除。3.删除在公共因子上的最大载荷小于0.35,共同度小于0.4的题目。

1 / 20
下载文档,编辑使用

©2015-2020 m.777doc.com 三七文档.

备案号:鲁ICP备2024069028号-1 客服联系 QQ:2149211541

×
保存成功