心理测量学知识第一节概述第一单元测量与测量量表一、什么是测量测量就是依据一定的法则用数字对事物加以确定。测量的三个元素事物:测量的对象,更确切的说,就是引起我们兴趣的事物的属性和特征。数字:某一事物或该事物某一属性的量,具有区分性、序列或等级性、等距性、可加性法则:测量所依据的规则和方法。二、测量的基本要素1.参照点:确定事物的量,须有一个计算的起点,这个起点叫参照点。绝对零点:(绝对参照点)重量、长度等,0即无,表示什么都测不到。相对零点:(相对参照点)人定的0,海拔高度,温度,0IQ=00岁儿童一般的智力心理测量的单位不够完善:既无统一的单位,也不符合等距的要求。三、测量量表命名量表用数字来代表个别事物或归类。如运动员编号,或用1代表男,2代表女。数字只用来标记或分类,而不能做数量化分析,不能比大小,也不能作四则运算顺序量表数字不仅代表类别,还指明类别的大小某种属性的程度。用于分等或排出顺序,无相等单位,无绝对零点,如考试第1名,2名等距量表不但有大小关系,且有相同单位,但无绝对零点,可做加减运算,不能乘除,200度比100度,但不能说200度是100度的2倍,0度是人为定的相对零点等比量表最高水平的量表,有绝对零点,可做四则运算。心理测量一般用顺序量表。第二单元心理测量的基本概念心理测量的定义依据心理学理论,使用一定的操作程序,通过观察人的少数有代表性的行为,对于贯穿在人的全部行为活动中的心理特点做出推论和数量化的一种科学手段。1心理测量的对象是人的行为。2只对少数经过慎重选择的行为样本进行观察,来间接推知受测者的心理特征。3为具有可比性,施测条件要一致。4个人在测验中所得到的原始分数并不具有任何意义,只有将与其他人的分数或常模相比才有意义。心理测量的性质间接性、相对性、客观性(一)间接性:只能通过一个人对测验项目的反应来推论出他的心理特质。特质是个人对刺激作反应的一种内在倾向。是个体特有的、稳定的、可辩别的特征,它又是一个抽象产物,一个构思,而不是一个直接测量到的有实体的个人特点。(二)相对性:对人的行为做比较,没有绝对标准。(三)客观性:包括(1)测验的刺激是客观的;(2)对反应的量化是客观的;(3)对结论的推论是客观的。测验的客观性实际上就是测验的标准化问题。包括测验用的项目或作业标准化、评分记分的原则和手段的标准化、分数转换和解释经过了标准化。[测验的客观性不包括()的客观性。绝对的标准特质:是个体特有的、稳定的、可辨别的特征。第三单元心理测验的分类最高行为测验有正确答案,智力测验和成就测验属于最高行为测验典型行为测验没有正确答案,各种人格测验均为典型行为测验第四单元纠正错误的测验观测验万能论测验无用论心理测验即智力测验第五单元心理测验在心理咨询中的作用一智力测验二人格测验三心理评定量表第六单元心理测量的发展史科学心理测验的产生与发展高尔顿:首先倡导科学心理测验,使用了测量差异,心理测验的开端他的学生皮尔逊:积差相关法卡特尔:1890年卡特尔在心理杂志上发表“心理测验与测量”第一次心理测验名词的出现比内:第一个正式的心理测验第二节测验的常模第一单元常模团体常模团体是由具有某种共同特征的人所组成的一个群体,或者是该群体的一个样本。先确定一般总体,再确定目标总体,最后确定样本。常模团体的条件1群体的构成必须明确界定2代表性样本3大小要适当。总体数目小,只有几十个人,则需要100%的样本。如果总体数目大,相应的样本也大,一般最低不小于30或100个。全国性常模,一般应有2000~3000人为宜。在实际工作中,应从经济的或实用的可能性和减少误差这两个方面来综合考虑样本的大小。4是一定时空的产物,注意选择新近的常模取样的方法(一)简单随机抽样(二)系统抽样(等距抽样)(三)分组抽样(四)分层抽样常模与常模分数全国常模区域常模特殊常模原始分数导出分数1常模分数:施测常模样本被试后,将被试者的原始分数按一定规则转换出来的导出分数。2原始分数:被试的反应与标准答案相比较而得到的测验分数叫原始分。3导出分数:由原始分数构成的分布转换而来的分数叫导出分数。第二单元常模的类型一、发展常模(年龄量表)(一)发展顺序量表葛塞尔发展程序表按月份显示儿童在运动水平、适应性、语言、社会性四个方面的大致水平。4周,控制眼睛,16周,能使头保持平衡,28周,能用手抓握,40周能控制躯干,坐立或爬行,52周,控制脚的运动,站立和行走等。皮亚杰:5岁理解质量守恒,6岁掌握重量守恒,7岁容量守恒(二)智力年龄基础年龄加高年龄水平的题目上获得的附加月份之和。高年龄每道题得2个月智龄。(三)年纪当量(年级量表)以10个月为单位,为1年级二、百分位常模百分等级一个分数的百分等级是指在常模样本中低于这个分数的人数百分比。85表示有85%的人比这个分数低百分点(百分位数)百分点则是计算处于某一百分比例的人对应的测验分数是多少。四分位数和十分位数四分位数是将量表分成四等分,相当于百分等级25%,50%,75%对应的三个百分点分成的四段。三、标准分常模标准分常模是将原始分数与平均数的距离以标准差为单位表示出来的量表,因基本单位是标准差,所以叫标准分数。标准差SDSQRT(∑(X-Xi)2)方差∑(X-Xi)2(一)线性转换的标准分数z=(X−X)SDx为原始分数,X为样本平均数,SD为样本标准差,z为某一分数与平均数之差是标准差的几倍。可能负,可能是小数。Z=A+Bz,加上常数A是为了去掉负数,乘以常数是去掉小数点使单位变小。不改变原来的等距关系。T分数5010(加50平均数,乘10标准差)九分52十分5.51.5二十分103离差智商10015(1)建立在统计学基础之上;(2)它表示的是个体智力水平年龄组中所处的位置;(3)是表示智力高低的一种理想指标。(二)非线性转换的标准分数当原始分数不是常态分布时,也可以通过非线性转换使之常态化。常态化过程主要是将原始分数转化为百分等级,再将百分等级转化为常态分布上相应的标准分数。四、智商比率智商IQ=MA/CA*100,MA心理年龄,CA实足年龄离差智商平均数100,标准差15IQ=100+15(X-X)/SD第三单元常模分数的表现方法第三节测验的信度第一单元信度的概念信度:是指同一受测者在不同时间内用同一测验(或用另一套相等的测验)重复测量,所得结果的一致程度。信度受随机误差影响,误差式,信度低。信度的指标信度指数信度指数的平方就是信度系数测量一次,得到一个分数的同时,便有一个误差,测多少次就有多少次误差。误差组成了一组数据,其标准差就是标准误SE=Sx√1−rxxSE标准误Sx标准差rxx信度系数测量的标准误和信度是互为消长的关系,信度越高,标准误越小,信度越低,标准误越大。第二单元信度评估的方法一、重测信度稳定性系数两到四周,间隔最好不超过6个月二、复本信度等值性系数它是以两个等值但题目不同的测验来测量同一群体,然后求得受测者在两个测验上得分的相关系数。如果两个复本的施测相隔一段时间,则称重测复本信度或稳定与等值系数。[复本信度的缺点:(1)如果测量的行为易受练习的影响,则复本信度只能减少而不能完全消除这种影响;(2)由于第二个测验只改变了题的内容,已经掌握的解题原则可以迁移到同类的问题;(3)对于许多测验来说,建立复本是十分困难的。]三、内部一致性信度分半信度同质性信度测验内部所有题目间的一致性,当各个题目的得分有较高的正相关时,不论题目的内容和形式如何,其测验是同质的。几个计算同质性信度的公式如下:(1)库德-理查逊公式(用于0、1记分)计算同质性信度,常用的是K-R20公式,在各测题难度相同或近似的情况下,还可采用计算更为简便的K-R21公式。[K-R20公式、K-R21公式有别于克伦巴赫α系数的是,它们只能用于()。是非题](2)克伦巴赫α系数(不适用于多重记分)四、评分者信度测量不同评分者之间产生的误差。要求平均一致性达到0.90以上,才认为评分是客观的。当多个评分者评定多个对象,并以等级法记分时,可采用肯德尔和谐系数作为评分者信度的估计。第三单元信度与测验分数的解释当rxx0.70,不可靠不能用,当0.70rxx0.85,可用于团体比较,当rxx0.85,才用来鉴别升预测个人成绩或作为。SE=Sx√1−rxxSE标准误rxx测验的信度解释个人分数的意义95%的概率水平,X-1.96SEXT≤X+1.96SE,这就是说,大约有95%的可能性真分数落在所得分数±1.96SE的范围内。比较不同测验分数的差异例:某人韦氏测验VIQ=102,PIQ=112,言语与操作测验的信度分别为)0.87和0.88,操作智商是否显著高于言语智商?解:求出SEd=S√2–rxx-ryy=15√2–0.87-0.88=7.5求出Xα=1.96SEd=1.96×7.5=14.7实际的差为112-102=10Xα,所有两者差异不显著SEd标准误,S标准差rxxryy信度系数第四单元影响信度的因素一、样本特征(一)样本团体异质性的影响若获得信度的取样团体较为异质的话,往往会高估测验的信度,相反则会低估测验的信度。(二)样本团体平均能力水平的影响因为每个题目具有不同的难度,对幼年者和能力水平较低者,其信度值相对较低。二、测验长度(一)测验越长,测题取样或内容取样越有代表性(二)测验越长,被试的猜测因素影响就越小。(三)测验太长,有时反而会引起被试者疲劳和反感而降低可靠性。斯皮尔曼--布朗公式通过斯皮尔曼--布朗公式的导出公式可计算出最少应增加的题数:(公式5--18)。例:一个包括40个题目的测验信度为0.80,欲将信度提高到0.90,问至少需要增加多少题目?根据斯皮尔曼布朗公式:K=0.90(1—0.80)/0.80(1—0.90)=2.25即要取得0.90的信度,测验长度就为原来的2.25,即需要增加40×2.25=90个题目,90-40=50。三、测验难度(地板效应与天花板效应)洛德(Lord)提出在学绩测验中,为了保证其可靠性,各类选择题的理想平均难度为:五择一测题,0.70;四择一测题,0.74;三择一测题,0.77;是非题,0.85。只有平均难度水平为50%时,才能使测验分数分布范围最大。四、时间间隔:两次测验相隔时间越短,其信度系数越大注意事项斯皮尔曼-布朗公式为校正分半信度的经验公式,它的假设是两半测验分数的变异数相等。当假设不成立时,可以采用弗朗那根(Flanagan)公式或卢伦(kulon)公式之一,直接求得测验的信度系数。对于一些复杂的、异质的心理学变量,采用单一的同质性测验是不行的,因而常常采用若干个相对异质的分测验。第四节测验的效度[美国心理学会在1974年发行的《教育与心理测量之标准》一书中将效度分为:(1)内容效度;(2)构想效度;(3)效标效度。]第一单元效度的概念(有效性或者说准确性)一、效度的定义:在心理测验中,效度是指所测量的与所要测量的心理特点之间符合的程度,或者简单地说是指一个心理测验的准确性。(是科学测量工具重要的必备条件)。因为测验分数的总方差等于真实方差与误差方差之和(公式5-8),而真实方差又分成两部分,即有关方差与无关的但稳定的方差:(公式5-19)以公式5-19代入公式5-8得:(公式5-20)在测验理论中,效度被定义为在一组测量中,与测量目标有关的真实方差(或称有效方差)与总方差的比率,即:(公式5--21)二、效度的性质1.效度具有相对性任何测验的效度是对一定的目标来说的,或者说测验只有用于与测验目标一致的目的和场合才会有效。[效度具有相对性,在评鉴测验的效度时,必须考虑测验的(目的)与(功能)。]2.效度具有连续性测验效度通常用相关系数表示,它只有程度上的不同,而没有“全有”或“全无”的区别。效度是针对测验结果的。测验效度是“测验结果”的有效性程度。信度考虑的是随机误差,效度还包括与测验无关但稳定的测量误差。1信度是效度的必要而非充分条件。2效度受信度制约。效度高,信度必然高,当信度高时,效度不一定高,且效度不会超过信度的平方根。第二单元效度评估的方法一