心理测量指定教材:戴海崎等主编,《心理与教育测量》,暨南大学出版社,2019。第一章测验的性质第一节测量1905年第一个心理测量量表比纳-西蒙智力量表问世,心理测量学诞生。对心理测量学的两种错误态度:妄加批评盲目迷信1-1从物理测量谈起物理测量一般是直接测量,测量结果的描述及操作方法或规则已经被人们共同接受。心理测量无法进行直接测量,而且作为测量对象的智力或人格,其定义心理学家众说纷纭、不能达成一致。1-2测量的定义测量是按照法则给事物指派数字。测量的三要素:事物及其属性、数字或符号、法则。案例:一个公司的招聘人员对一位应聘者经过观察和谈话后,对此人的办事才能作出粗略评判,并把评判的结果用数字1-5表示,“1”表示最不具有这种特性,“2”为稍有一些,“3”为一般,“4”为较多,“5”表示很高。1-2-1事物及其属性事物及其属性是我们测量的对象。作为脑的特性不能直接测量,但人的心理必会在其具体活动和行为中有所表现,倘若我们对智力或人格特征这些测量对象有着明确的操作定义,便可根据它寻找一组刺激或作业(实际上就是一组测题或问卷),用以引起被试的行为,而从中推论出其智慧能力或人格特征。1-2-2数字或符号。数字比数较少限制。数的特性:区分性、等级性、等距性、可加性。数字只具有数的若干特性。1-2-3法则测量程序的一般公式如下:f={(x,y);x=任何事物,y=一个数字}大部分的人类心理特征难以测量,主要是因为设计一个好而清晰的法则非常困难。心理测量的法则包括测量的内容、测量步骤的规定、评分的标准、及测验分数数量化的方法。法则的好坏,决定了心理测量的可靠性和有效性的程度。1-3四种测量量表类别量表等级量表等距量表比率量表1-3-1类别量表测量上最低的形式是分类,在这里根据法则指派给事物某一类别的数字或其他标志仅是符号或称呼,没有任何数量大小的含义,因此用这类数字表示的量表叫做类别量表。如:电话号码。1-3-2等级量表等级量表除了具有类别量表的性质外,根据事物的性质和分派的法则,指派给每一类别的数字还具有等级性或序列性的特性,但不表示数与数之间的差距是相等的。如:学校考试的原始分数。1-3-3等距量表等距量表除了具有类别和等级量表的性质外,还要求一定数量差距在整个量表阶梯上都是相同的,换句话说,根据事物的性质和分派的法则,这时量表的各个部分的单位是相等的,但没有绝对的零点。如:摄氏温度量表。1-3-4比率量表比率量表是测量的最高水平,也是科学家们最理想的量表。一个比率量表除了具有类别、等级和等距量表的性质外,还有一个具有实际意义的绝对零点。如:公制的长度(米)量表。1-4心理测量属于哪一种测量水平从根本上讲,智能和人格测验的分数是等级量表,但心理学家却喜欢用等距量表来表现这些测量结果。这是因为大量的统计方法适合于等距量表。这就使我们面临两难的境地。若干变通的方法:在统计上把测验分数转换成一个相等单位的量表,如标准分数;现实主义的态度;实用主义的态度。第二节测验的定义心理测验实质上是行为样组的客观的标准化的测量。行为样组标准化难度客观测量信度效度2-1行为样组行为样组是指能正确测量出被试某方面心理特性的一组试题。而这组试题能否正确地测量出被试某方面的心理特性,取决于试题的性质和数量。如果试题没有代表性,或者只有另一方面的代表性,那就不能用它来进行正确的测量。2-2标准化标准化是指测验的编制、实施、记分以及测验分数解释的程序的一致性。标准化的要求只是所有科学观察需要控制条件的一种特殊应用而已,这样,在测验的情境下,唯一的自变量是正在受到测定的个体的智能或人格特征。常模是指某一标准化样组在某一测验上的平均分数。常模的功用是给测验分数提供比较的标准,从而对测验分数加以解释。2-3难度客观测量完满的客观性实际上是不可取得的,但不论怎样,客观性总是测验编制的目标,并且在大多数测验中已达到一定的高度。心理测量的客观性最主要的表现为测题(项目)或整个测验的难度水平必需客观2-4信度测验的信度是指同一组被试用同一测验实施两次后所得分数的一致性;或者同一组被试经过一次测验,而后用一个等同形式的测验再测一次,两次所得分数的一致性。信度的种类有三:稳定系数等值系数内在一致性系数稳定系数稳定系数的求法是先对某个测验实施首测,过一段时间后对它再测,然后计算首测与再测所得分数的相关系数。等值系数等值系数的求法是先对同一测验的一型或A型施测,然后在最短的时间内实施第二型或B型,再求它们得分的相关系数。内在一致性系数内在一致性系数的常用求法是将一个测验分裂为两个假定相等而独立的部分来记分的,一般以项目的奇数为一组,偶数为另一组,求两者相关系数,而后再用斯皮尔曼-布朗公式来估计整个测验的信度。2-5效度效度是指一个测验真能确实地测量到它所欲测量的东西的程度。考察一个测验效度的常用方法如下(以智力测验为例):求测验结果与另一种已知其效度的标准化测验的相关;求测验结果与学生学业成绩的相关;观察每项测题通过人数的百分比。是否依年龄或年级的增加而增加;观测每项测题与全量表是否有连贯性。第三节正确使用测验防止滥用3-1测验要保密。3-2只有够资格的心理测验工作者才能使用心理测验。3-2-1测验的选择要慎重。3-2-2测验的实施应控制误差。3-2-3测验的记分要客观。3-2-4要懂得如何解释测验分数。3-3不能把一个原来良好的测验,不分时间、地区到处乱用。3-4主试要对被试在测验实施中的反映和行为作出切实而详细的记录。3-5要正确地使用测验,就要对测验本身有一个正确的认识。3-6一个好的测验工作者要有测验道德。第四节测验的实施和被试的主观状态4-1主试在测验前的准备4-2指导语4-3测验的情境4-4测验焦虑4-5练习与应付技巧4-6反应方式与反应心向4-7与被试建立和睦的关系第五节测验的种类和功用5-1测验的种类这里讲的测验是指标准化测验,而不是非标准化测验。标准化测验除了要有常模外,还要具备下列条件:(1)给所有被试实施有代表性的相同的一组测题,为他们的作业取得直接比较的基础;(2)实施测验的手续(包括测验指导语、测验时间限制、测验情境等)要有详细的规定,以保证每一被试有相同的测验条件;(3)记分方法要有详细的规定,使评分误差降低。上述三点与得分的步骤有关,常模(标准化样组的平均数)则给测验分数提供参照点。这样,一个测验就能作为测量人的某种心理特性的工具。5-1-1按照测量的对象分5-1-1-1智能测验5-1-1-2教育测验5-1-1-3人格测验5-1-2按照测验的人数来分5-1-2-1个别测验个别测验只能由同一主试在同一时间内测量一个人。个别测验的优点是主试对被试的言语、情绪状态有仔细的观察,并且有充分的机会与被试合作;激起被试最大努力,所以其结果正确可靠。个别测验的缺点在于:时间不经济,测验的手续复杂,需要训练有素者方能胜任。5-1-2-2团体测验团体测验可由一位主试同时测量许多人。各种教育测验都是团体测验,一部分智力测验也是团体测验。它的优点是时间经济,主试不必接受严格的专业训练即可担任。它的缺点在于对被试的行为不能做切实的控制,所得的结果不及个别测验正确可靠。5-1-3按测验的材料来分5-1-3-1语言或文字测验:它可以测量人类高层次的心理功能,编制和实施都较容易。人类的心智能力不能完全以图形或实物测量出来,所以语言或文字测验应用范围较广,团体测验多采用它。然而它不能应用于语言有困难的人,而且无法比较语言文化背景不同的被试。5-1-3-2非文字测验或操作测验:以图画、仪器、模型、工具、实物为测验材料,被试以操作表达。它的长处和短处,正好与语言或文字测验相反。5-1-4按测验的功用来分5-1-4-1预测测验和成就测验预测测验用于推测某人在某方面未来成功的可能性,智力测验和能力倾向测验就属于此。它多数根据作业分析的结果来选择测验材料。成就测验在于考察某人在某方面目前的成绩,一般教育测验就属于此,因此它所测量的是学生现在的成绩,它往往是根据作业样本来选择测验材料。5-1-4-2难度测验和速度测验难度测验的功用在于测量被试的程度高低。它的时间限制的标准通常是使95%的被试都有做完测验的机会。测题由易到难排列。以测量被试解决难题的最高能力。速度测验在于测量被试作业的快慢,它的测题难度相等,但严格限制时间、看规定时间内做对几题。5-1-4-3普通测验和诊断测验普通测验在于考查一个人或一个年级学生在某方面的大概程度;诊断测验则进一步去诊断被试某方面的特殊优点和缺点。教育上的诊断测验偏重发现学生困难之处,作为改进教学方法或进行补救教育的依据。5-2测验的功用5-2-1辨别智愚5-2-2选拔人才5-2-3指导就业5-2-4诊断5-2-5预测5-2-6评价学生的成绩5-2-7用来进行实验分组,使之等组化第二章心理测量的发展史心理测量的思想和实施在中国由来已久,我国的古代考试制度是现代心理测量的渊源。孔子惟上智与下愚不移中人以上,可以语上也;中人以下,不可语上也。孟子权,然后知轻重;度,然后知长短。物皆然,心为甚。科举制度隋唐至清末1300多年科举制盛行,对人才的选拔悉依考试结果为准则,自从利玛窦1582年来我国之后,我国的文物制度逐渐传入欧洲。科举制度一经传入欧洲,备受启蒙思想家伏尔泰的赞扬。于是,夺取政权后的法国资产阶级于1791年参照我国的科举制度建立了自己的文官考试制度。随后,英美两国也相继建立。它们为受官任职制定了准绳,打破了门第或名人推荐的限制,扩大了资产阶级进入政府的通道。第一节心理测量的早期尝试与先驱者的探索1-1冯特的实验心理学实验心理学的鼻祖冯特,1879年在德国莱比锡大学设立第一所心理实验室,用生理学和物理学的仪器及其方法来做心理实验,从此心理学开始成为一门实验科学。1-2高尔顿的理想1-3卡特尔的个别差异研究第二节比纳-西蒙智力量表的产生及其特点2-1比纳-西蒙智力量表2-1-11905年量表这个量表共包括30个测验项目,具有如下两大特点:(1)项目种类繁多,可以测量智力多方面的表现。(2)测验项目的排列,由浅而深,使同一量表可以测量智力高低不同的儿童。2-1-21908年量表2-1-31911年量表1905年量表测题举样1、看:用一支点燃的火柴在儿童面前慢慢移动,看儿童眼睛是否能跟随物体移动。8、图片之认识:给儿童看一图片,然后询问他图片上某物在何处。15、重述句子:每个句子有15个字母,先说一次给儿童听,然后要其背诵。22、比较重量:把五个重量不同(18、15、12、9和6克)的物品依此排列。30、抽象名词之意义:例如革命与进化、总统与皇帝有何不同?2-2比纳方法的特性2-2-1用年龄作准则2-2-2明了心理过程有低级和高级之分2-3比纳1911年量表的不足之处诊断高级心理过程的测题不很多没有一定的测验手续有许多测题的位置不对斯坦福大学教授推孟对这类错误进行订正,遂有斯坦福-比纳智力测验问世。在心理学史上,假使我们称冯特为实验心理学的鼻祖,我们不得不称比纳为心理测量学的鼻祖。第三章智力测验第一节智力的性质1-1对智力的一般理解1-1-1智力是抽象思维的能力1-1-2智力是适应环境的能力1-1-3智力是学习的能力1-1-4综合的观点1-2智力的种类社会的智力具体的智力抽象的智力1-3智力的结构1-3-1因素分析的简解因素分析是聚合彼此高度相关而又与其他测验变量群相对独立的一些测验变量群的一种统计程序。1-3-2智力结构的几种理论斯皮尔曼的二因素论、塞斯顿的群因素论、吉尔福德的三维智慧结构理论都是采用因素分析的技术来揭示智力的结构的。1-3-2-1二因素论二因素论认为人类的智力是由两个因素构成的,一个是一般因素称为g,一个是特殊因素称为s。g因素和s因素合并起来就构成一个人智慧活动的总体。根据这种说法,各种智慧活动都有一个共同的一般因素g,同时,又有其本身的一些特殊因素s。而一般因素g乃是智力测验的对象,目前许多智力测验的测题都是通过广泛取样而求出g。1-3