第三节智力的测量智力的科学研究从一开始就与智力的测量紧密地联系在一起。早在二千多年以前,中国的先哲们就提出了许多测量人的智力以及其他心理特征的思想和方法(刘劭,约168~240)。现代智力测验的出现只是近一百多年的事。一、智力测验概述心理测验意指在对心理进行测量时所使用的工具,有时也称心理量表。通常它是由一组精心设计的测试题目或项目组成,其作用在于抽取一组标准化的行为样本,通过对这组行为反应的观察分析,测验者就可以对引起行为的心理活动做出推论和解释。心理测验依其所测的内容和分类的标准不同,种类繁多,如人格测验、教育测验和团体测验等等,智力测验是心理测验的一种,也是最早发展的测验之一。(一)智力测验的产生19世纪中叶,达尔文的进化论激发了人们对智力和心理能力的研究。可以设想,如果生存的重要因素是对环境的适应,那么,在人类进化中,智力必定起着重要作用。高智力的人由于其对环境的优良适应性必定通过自然选择,被保留下来。根据这种思想,达尔文的表兄弟高尔顿(FrancisGalton,1822~1911)对智力进行了第一个系统性研究。他认为,智力水平的高低与神经系统的完整性和功能有效性有关,外部世界的信息是通过我们的感觉到达于大脑的。感觉越敏锐,获得的信息越多;信息越多,判断与思维越有用武之地。感觉辨别力基本上是心智能力中最高的能力。为此,高尔顿设计了多种测量工具,用于度量人们在各种感觉辨别力上的差异,例如,对声音的反应时间、命名颜色的速度等等。但以后的研究发现,在简单的感觉判断和更复杂的认知能力之间几乎不存在任何关系。世界上第一个正式的智力测验,是由法国心理学家比内和医生西蒙(Binet&Simon)在1905年编制的。它的产生是为了分辨出不适合在一般学校学习的智力落后儿童,从而给以特殊教青。比内认为,智力是由多种能力组成的,智力测验必须包含大量不同类型的测验项目。同时,年龄也是影响测验结果的一个关键因素,最聪明的3岁的孩子也不能与一个智力一般的9岁孩子相提并论。为此,他们提出了心理年龄的概念,表示智力水平的办法是计算智商。(二)智力测验的种类心理测验本身依据题目形式、编制目的、施测要求、解释方式等可以划分为各种不同的类型,这里介绍几种与智力测验有关的分类。1.个别测验和团体测验任何测验都可以由主试者向一个人单独施测,也可以同时施测于一组人。根据施测对象的数目,测验可以划分为个别测验和团体测验。个别测验指那种在同一时间内主试者只能对一个受测者进行施测的测验。如比内量表、韦氏儿童智力量表等大多数儿童智力测验都属于个别测验。个别施测对于某些特殊对象,如幼儿、智力障碍儿童等尤为必要。它耗费的时间和精力较多,测验程序比较复杂,并且主试者必须进行严格的训练后方能胜任。因此显得不够经济,短时间内不可能获得大量资料。团体测验与个别测验相反,能够在同一时间内由一位主试者对多名受测者进行施测,如一般的教育测验,各种人格量表,以及团体智力测验等都是集体进行的。团体施测较之个别施测显然可以节省大量人力与时间,并且可以在短时间内收集大量信息,同时主试者也无须接受严格的专业训练。不过它的缺点也正与个别测验的优势相反:主试者无法充分观察和控制每一位受测者的反应,测量误差不易控制。2.文字测验和非文字测验测验题目可以由各种不同的方式呈现,比如数字、文字、图形或各种实物都可用以组成题目进行测验,测验呈现的方式不同,受测者的作答方式也不一样。根据这一点,心理测验可以划分为文字测验和非文字测验。文字测验的题目以文字材料组成并呈现,要求受测者用文字或语言的方式作答。文字测验的实施比较简便,而且较易于测量人类高层次的心理功能。但是,这类测验容易受社会文化背景的影响,在跨文化比较研究中应用比较困难。同时,不同的文化程度会影响测验结果,对于那些在语言文字方面有困难的人和幼小儿童则完全不适用。题目不以文字表述,受试者不以语言或文字方式作答的测验称为非文字测验。非文字测验的说明由主试者口头叙述,测验题目多属于图画、工具、模型等,对仪器、实物等辨认或操作的操作性测验,也属于非文字测验。这类测验一般只适用于个别施测,费时费力,且对测验结果的评分易于受主观因素的影响,很难达到严格的标准化水平。但是由于其材料的特殊性,这类测验不易受文化因素的影响,可用于广大文化水平较低者,如学前儿童、文盲等,并且适合于进行跨文化研究。由于一个人在认知领域的知识往往并不能代替其在操作领域的技能,因此一般的智力测验同时包含两类题目,并且将两部分测验先分别计分,然后再结合起来进行解释,效果较好,如韦氏儿童智力量表。3.速度测验和难度测验速度测验关注的是回答题目的速度,要求受测者尽快地作答,完成题目越多越好。其目的在于考察受测者在测验任务上的反应速度。速度测验一般由比较容易的题目组成,不需要深入思考,只是题量大而时间限制非常严格,一般情况下几乎没有受测者能够在允许的时间内完成全部题目。这类测验以受测者在规定时间里答对的题目数量来区分优劣,常用于测查需要牢固掌握的基础知识部分。难度测验关注的是被试答题的正确性,要求受测者认真思考,准确地回答问题。测验的构成比较复杂,题目从易到难排列,最难的题目几乎没有一个受测者能够解决。这类测验可以没有时间限制或限制得非常宽松,通常以95%的受测者都有可能做完全部题目为前提来规定时间。它旨在测量受测者的解题技巧和解决问题的最高能力水平,以完成的数量和准确性为计分标准。各类学科竞赛所用的测验可谓难度测验的典型示例。(三)心理测验的性质智力测验是心理测验的一种,心理测验本身所具有的性质,智力测验都具有,下面简要介绍一下心理测验的基本性质。1.心理测量的对象是心理特质心理测量中作为研究对象的心理属性,称心理特质,如学习动机、记忆广度、推理能力和情绪稳定性等等,智力测验所测量的智力也是一种心理特质。心理特质指的是使一个人对于较广泛的一类情景稳定地做出同一反应的心理特点,它是建立在对人类大量相似行为进行观察的基础之上的一种科学构想,它是心理学家用以描述或解释行为的工具,不是客观事物。2.对心理特质的测量是间接的心理特质作为一种科学构想本身是抽象的,不可能直接观察到,因而对它的测量只能是间接的,即从行为样例中推理得出。尽管对于有些心理特质的测量方法在长时期使用中已经标准化,使用得相当普遍,但至今还没有对哪一种构想的测量方法得到普遍接受。因此时常有下述情况出现:两个具有不同理论观点的测验编制者,为测量同一种心理特质,使用着不同的间接测量途径,即选用不同的行为表现进行操作性说明。例如对儿童智力,有人用特定实验上的反应时长短去测定,有人用非文字智力测验的得分去测定,也有人认为只有把智力测验中言语部分和操作部分相结合才是最佳选择。3.心理测量具有误差任何测量,无论是物理的抑或心理的都会出现误差。任何测量进行多次,其结果不会完全一致,心理测量的误差尤为突出。因为心理测量是从对一个行为样本的观察中获得数据,再去推论得出结果,从部分推论整体,用以解释一个人的心理特质,自然不会百分之百的准确。同时,这有限的观察数据又是在某一特定时间、地点条件下获得的,引起误差的因素多种多样,即便采取措施也不可能完全避免,从对心理特质的理论说明,到计分、评分和结果解释各个环节上,都会有误差出现。因此,只凭一次测验结果并不能完全准确地反映所要测量的心理特质。要了解一个人如此行为的原因,或进一步由此预测他的未来行为,需要多方面考虑。4.心理测量工具的适用性与社会文化背景有关任何心理测验的适用性都有其特定的范围,它在测验编制开始时就已确定,依据测验的目的,适合于使用该测验的被试团体称为目标群体。任何心理测验也只有当它被应用于它所适用的目标群体时,才能显示出它的效能。由于人的心理在不同文化、教育和社会环境中有很大差异,如果把一个测验应用于目标群体之外的个人或团体,那么使用其原有的常模来做评定就很不恰当,会对结果做出既不客观、又不公正的判断。由于社会因素的影响,甚至在同一个社会文化团体中,不同性别或不同年龄的受测者对同一个测验的反应也不一致。因此,我们在选用测验工具时,除审查测验本身的质量外,还需要考虑它的适用性特征。二、心理测验的技术指标我们在选择一个智力测验来度量智力水平时,首先会考虑到:用这种工具测得的结果准确吗?测验分是否能有效地预测他在现实生活中取得的成就或他的学习成绩?每次所测得的结果都一致吗?测验结果的一致性和准确性,即测验的可靠性和有效性,是任何一个良好的测量工具都必须保证的前提,在测量学上称之为信度和效度。智力测验与其他测量工具一样,必须具有一定的信度和效度,才能对人的智力做出客观、准确的度量,并对测量结果做出合理的解释。(一)信度信度即可靠性,是指多次测验结果的一致性程度。一个好的测量工具,对同一事物反复多次测量,或由不同的人使用,其测量结果应该保持不变。正如用一个体重计在一天内测量某人的体重,如果每次测量结果相差很大,我们知道人的体重不会产生很大波动的,因此,这个体重计不是一个可靠的测量工具。任何测验,它都是只对一个行为样本进行测量的,这样以它为基础所做推论就不可能绝对精确。正如你在一门课程上的多次考试,由于题目不同,每次所得分数也不会完全相同一样,测量的结果总包含着一定的测量误差。信度依据误差大小有程度上的差异,大小介于0与1之间。通常由两个测量结果的相关系数来表示,称之为信度系数。根据误差源的性质,一个测验的信度可以分为以下几种。1.再测信度再测信度是指测验结果跨时间的一致性。它是用同一个测验对同一组人前后进行两次测量,两次测验分数的相关系数就是再测信度。再测信度反映的是两次测验结果有无变动,因此又称稳定性系数。2.评分者信度评分者信度是指不同评分者之间在测验结果计分上的一致性。当测验结果是由评分者主观评定时,评分者信度尤为重要。例如在体操比赛中,裁判评分的一致性直接影响着运动员的名次,因此一般都要取消两极各一个分数后再求平均成绩。在心理测验中,评分者信度的计算,通常是随机抽取若干份试卷,由至少两位受过训练的评分者按计分规则分别判分,然后计算它们的相关。几个评分者的评分越一致,评分者信度越高。3.内部一致性信度内部一致性信度又称同质性信度,是指一个测验或分测验中各题目所测内容的一致性。智力测验通常由许多不同的题目构成,内部一致性信度可以通过将测验题目区分为两半,比较人们在两部分上的得分情况获得。如果测量题目之间具有很高的相关,表示具有高内部一致性,或者说同质性信度很高。一般说来,智力测验的同质性信度较高。从测量方法上考虑,这样求得的信度也称分半信度。(二)效度效度是指测量的有效性,即一个测验对它所要测量的特性准确测量的程度。一个测验总是为一定的测量目的而设计编制的,并具有一定的操作规则和使用范围,判断它的效度高低,首先要看它达到测验目的的程度,如果能正确地测量出所要测的东西,那么它就是高效度的测量。例如,用英文书写的算术题测量儿童算术能力,他的成绩不佳可能出自算术能力低,也可能出自英文水平差未能理解题意。因此,作为能力测验便是无效的。同理,智力测验只能用来度量智力,而不能用它来度量个性,否则也是无效的。与信度相比,效度是一个更复杂、更重要的概念。心理学家一般将效度进一步分为内容效度、构想效度和预测效度。1.内容效度所谓内容效度是指测验题目对预测的内容或行为范围取样的适宜性程度。例如,教师在讲课告一段落后要进行考试,而考题不可能包含讲过的所有内容,必须从中选出一个有代表性的题目样本,编制成测验,然后根据考试分数推断学生对该范围内知识技能的掌握情况。如果测验题目不是该范围内的有代表性样本,或者过难或者过易,那么由此做出的推论,其效度必然很差。2.构想效度构想是指心理学理论所涉及的抽象而属假设性质的概念或特质,如智力、焦虑、自我、外向、攻击性等等。构想效度表示一个测验是否达到了对某一理论概念或特质的测量。如果一个智力测验测得的结果与该测验所依据的智力理论或假设相符合,那么,我们说该测验具有较高的构想效度。构想效度的确定通常需要综合评价各种不同的资料,一般采取两种途径:一是考察它与度量同类构想的测验是否