心理测量学真分数与信度和效度教材

momobaby
1 ℃
2020-06-30

整理文档很辛苦，赏杯茶钱您下走！

还剩 ... 页未读，继续阅读 >>

免费阅读已结束，点击下载阅读编辑剩下 ... 页

阅读已结束，您可以下载文档离线阅读编辑

资源描述

真分数与信度/效度上传刘景波（snr5aliu）目的仅用于学习交流心理测量的误差种类•误差定义，误差是由测量中与目的无关的因素引起的不准确或不一致的效应。•心理学研究中的误差按其性质可分为三类，随机误差系统误差过失误差(恒定误差)心理学研究中的三类误差随机误差又称偶然误差。由实验中一些偶然因素引起又不可控制的误差。随机误差产生的原因十分复杂,但其存在是绝对的。随着实验观测次数的增加,随机误差的变化会呈现一定的规律性——它总是围绕被观测的真正值(又称真分数,一般用多次观测的平均值来表示，真正值是无法测量到的)波动,随机误差的算术平均数随着观测次数的增加而逐渐减少以至于趋近于零。系统误差就是观测过程中服从确定规律性的误差。由于实验条件不同,造成不同的有一定规律性的误差属于这类误差。心理学实验中,不同的实验方法、不同的被试样本等都会对实验结果产生规律性的影响。这类误差不能通过增加实验次数消除。如果需要可以通过实验设计加以消除,这一问题我们将在后边的变量处理和实验设计中讨论。过失误差一般把明显歪曲实验结果的误差成为过失误差,它是由于实验观测过程中的过失造成的。这些错误有测错、传错、记错、仪器失灵、取样错误。在实验数据整理过程中必须鉴别、舍弃这些含有过失误差的数据(又称异常点),否则会严重影响实验结果的准确性,得出不正确的结论。心理测量误差的三方面来源•在心理测量中，常见的误差来源于三个方面：测验内部，施测过程，受测者本身。1．测验内部引起的误差测验内部的误差主要来源于题目取样：①、当测验题目较少或取样缺乏代表性时，被试的反应受机遇影响较大（譬如一次考试碰巧准备到或没有准备到某题）；当几个测验复本不等值时，接受不同的题目，就会获得不同的分数。②、除题目取样不当可引起误差外，其他一些因素，如题目用词的模棱两可，对反应步骤说得不清楚；题目过难引起猜测；时限短使被试仓促做答等，也可能成为误差的来源。2．由施测过程引起的误差在三种误差来源中，与施测过程有关的误差可能是最容易控制和检验的。测验的标准化水平越来越高，大部分施测条件能够得到控制。但由于心理现象的复杂性，许多意想不到的偶然因素仍可能影响测验分数，使人防不胜防。①、物理环境施测现场的温度、光线、声音、桌面好坏、空间阔窄等皆具有影响。②、主试者方面主试者的年龄、性别、外表，施测时的言谈举止、表情动作等均能影响测验结果。倘若不存在按照规定实施测验，如制造紧张气氛，给予特别协助货暗示，以及计时错误等，都会带来较大误差。特别是当测验具有复杂步骤和说明，或测验题目本身是模糊不确定的形式时；当主试者在安排测验条件上有较多余地（例如个别实施）测时；当测验是对幼儿、有情绪困扰者以及对测验程序不熟悉的人施测时，主试者的影响更大。③、意外干扰在测验环境复杂，特别是当受试人数较多时，容易发生出乎意料的干扰或分心事件。例如：停电、有人生病、有人作弊、计时表停了、临时发现题目或作答纸张印刷不清或装订错误等，无论哪种情况都会引起不安和扰乱，导致成绩不准确、不一致。④、评分计分评分不客观以及计算登记分数出错也是常见的误差。一般选择题的评分教为客观。而问答题、论文题等自由反应型的题目，评分标准很难掌握，加之阅卷者的偏好个不相同，因而难以保证分数的一致性。不仅各教师间有此差异，即使是同一教师一次评许多卷，受情绪疲劳、外界干扰、卷面整洁、考试前后位置引起的对比效应以及对学生成见的影响，标准也可能不统一，甚至同一张试卷隔一段事件再评，前后给分也可能不一致。至于学校间、地区间的差别就更大了。为了控制与施测过程有关的误差，主试者必须严格遵循标准化程序施测和评分，不得任意改动和发挥，同时要机智地处理各种意外情况。真分数理论——真分数是一个在理论上构想出来的概念•真分数：一个测量工具在没有测量误差时，所得到的真正值。•真分数的操作定义：经过无数次测量所得的平均值。•真分数的定义表明，一个人在一个测验上所得的分数，是他的真分数的函数，也是测量误差的函数，用公式表示如下：X=T+E这里X为实得分数或观测分数，T是假设的真分数，E是测量误差。•X=T+E•这里X为实得分数或观测分数，•T是假设的真分数，E是测量误差。•E仅指随机误差，不包括系统误差（I），后者不引起分数的改变，因而包含在真值中。•即，T=V+IVIEX图4-8实得分数、真分数和误差的关系T误差与真分数、和实得分数的关系在公式3-1中，E可能是正的，也可能是负的。这就是说，一个人的实得分数可能大于真实量，也可能小于真实量，总是围绕着真值上下波动。关于测量误差（E）有以下假设：（1）如果对一个人测量无数次，其平均误差为0，即E＝0（2）真分数和测量误差是相互独立的，即rTE＝0（3）误差分数和实得分数的相关为0，即rXE＝0真分数理论与信度效度实得分数（X）中的变异(SX2)——实得分数变异(ST2)——真分数的变异(SV2)——有效变异数(SE2)——随机误差变异(SI2)——系统误差变异(ST2／SX2)——测验的信度(SV2／SX2)——测验的效度效度和效度的定义信度在心理测量理论中被定义为：在一列测量数据中，真分数变异(2T)在总变异（2X）中占的比例。真分数变异在总变异中占的比例越大，说明随机误差对测量结果的影响越小，则测量工具的信度越高。22'XTXXr效度在心理测量理论中被定义为：在一列测量数据中，与测量目的有关的真实变异（2V）与总变异的比率。22XVXYr一个测验的效度表明，在一组测验分数中，有多大比例的变异是由测验所要测量的因素引起的。信度和效度的关系信度(ST2／SX2)——当随机误差的变异(SE2)减少时，真分数的变异(ST2)增加，测验的信度随之提高。效度(SV2／SX2)——信度的提高只给有效变异数(SV2)的增加提供可能。至于是否能提高效度，还要看系统误差(SI2)的大小。可见，信度高不一定效度高。但一个测验要想效度高，真分数的变异必须占较大的比重，即测验的信度必须高。信度\效度关系的数学表达xxxyrrrXY表示实得效度系数(程序X得分与外部效标Y分数之间的相关)，rXX表示测量程序的信度。式中显示：信度是效度的极限值或上限。换言之，由于测量的不可信而降低了效度。yyxyxtrrr但是，在一些效标或预测因子中存在某种程度的不可信是不可避免的。当效标的信度已知，可以用左面的公式在统计上对这种不可信进行校正：3．信度指数和信度系数信度指数（reliabilityindex）：在心理测量理论中，某一测验的真分数与实得分数间的相关系数为测验的信度指数。变异数与总变异数（实得变异）的比率。即：TXXTNxtr根据真分数和误差的性质，可推导出XTXTr式中：XTr－代表信度指数；T－真分数的标准差；X－实得分数(观测分数)的标准差。信度系数（reliabilitycoefficient）：可定义为平行测验分数之间的相关系数。如果用1x和2x分别表示一组受测者在两套平行测验中所得的离差分数，则：212121XXXXNxxr根据真分数和误差的性质，可推导出2221XTXXr则221XTXXrr2T－代表真分数的变异；2X－代表实得分数的变异，即总变异。由此，我们可以看出，信度系数可以用数学语言定义为：真分数方差与观测分数方差的比率，或者是信度指数的平方。4．信度信息的解释要解释信度信息，须作以下区别：（1）21XXr——观测分数变异中可归因于受测者真分数中变动的比例部分（2）(21XXr)2——一份平行测验上所得的观测分数变异中能用另一份平行测验的观测分数的变异预测的比例部分（3）XTr——真分数和观测分数的相关假设一份测验手册报告信度系数21XXr=0.81，那么我们可以作如下解释：第一，观测分数方差的8l％归因于该受测者组的真分数的方差（即，2T=0.812X）；如果观测分数的标准差为4，我们可以预测，不可观测的真分数分布的标准差应该为T=1681.0=3.6。第二，我们可以说，第二次测验观测分数的方差的65％的部分能够用第一次测验的观测分数方差预测（即，0.812）。第三，我们可以认为，对这些受测者来说这些观测分数和真分数之间的相关为81.0或0.90。22'XTXXr式中：XXr－代表信度指数；2T－代表真分数的变异；2X－代表实得分数的变异，即总变异。需要注意的是，真分数是不能直接测量的，因此，心理测验的信度只是一个理论上的构想概念，只能根据一组实得分数进行估计。通常以同一样本所得两组资料的相关，即信度系数作为测量一致性的指标。由于测验分数的误差来源不同，估计信度的方法也不同，因此不同的信度具有不同的意义。在心理学中，主要以下面将讨论的三种类型的信度来评价心理测验的稳定性。