第三节实验设计一、实验设计及评价标准1、实验设计(广义):是指根据研究目的,经过周密的思考而制定出的整个研究工作的具体计划和安排(董奇,2004)。2、实验设计(狭义):是指对人类或者动物的心理和行为进行实验性观察时,对控制条件的设计(RobertSolso,2002);包括如何选择被试、如何将被试分配到各实验条件、如何控制额外变量以及如何收集数据(RandolphSmith,2004);目的在于使研究者观察到实验处理效应(张学民,舒华,2004)。——第二节内容偏重于变量的界定和控制;而本节的内容侧重变量与变量之间关系的考察,即自变量处理效应的考察。3、好的实验设计的标准宏观评价(孟庆茂):(1)能够恰当地解决所欲解决的问题。(2)恰当地控制实验中的无关变量。(3)使实验结果有很高的可靠性。微观评价(舒华):(1)使研究变量的效应最大化(2)对额外变量进行有效控制(3)使实验误差变异最小化(4)充分体现自变量和因变量之间的内在联系。——构思效度和内部效度二、实验设计的分类(一)心理实验设计的宏观分类真实验设计,准实验设计,非实验设计(前实验设计与事后设计)真实验设计:就是通常所说的实验设计,是以数理统计为基础的实验设计。其特征在于对影响内部效度的无关变量采取了严格的控制,能有效地控制研究中自变量的不同取值和因变量的指标,以及被试的分配情况,并可应用统计方法分析实验结果。优点:条件控制严密;局限:自然性差,人为性强,生态效度低。准实验设计:是指降低了实验控制的标准,通常在不易对被试进行随机取样,无法严格创设等组的条件下进行的设计。如:教学方法与教学效果;工作压力与工作效率优点:在真实性和生态效度上高于真实验设计。局限:无关变量控制不够严格、因果关系确定性弱知识问答是先有真实验设计还是准实验设计?真实验设计是否代表着实验设计的发展趋势?——准实验设计是由Campbell&Stanley于1966年提出的,目的在于克服实验室实验的局限性。1951-1959年康涅狄格州交通死亡人数(Campbell,1969)康涅狄格州(实线)和其他4个州的交通死亡率(Campbell,1969)非实验设计:是一种对自然条件下发生的心理现象进行观测、记录、描述的设计方法。这种设计往往不易采取随机化原则分配被试,而且也不易主动地控制自变量和其他无关变量,它可以为进一步实施更严格的设计积累资料。(有关该概念的理解国内外有很大不同,比较混乱)意义:为更高层次的真实验设计和准实验设计提供必要的基础和资料。局限:易受无关变量的影响。包括:单组后测设计、单组前后测设计、固定组比较设计、事后回溯设计国外对非实验设计的看法非实验设计就是不用实验作为研究手段的研究设计。具体方法有:1.现象学方法(phenomenology),是指对自己的直接经验进行描述的方法。局限:(1)不能比较不同条件下被试的数据,因此不能得出因果关系的结论;(2)对自身心理活动的关注可能会改变正常的心理活动;(3)其结论不一定完全精确、客观,而且其研究结果不能推广到别人身上。2.个案研究法(casestudy),是指对他人的行为经验进行描述、记录的方法。常用于临床心理、特殊心理的系统研究。3.现场研究法(fieldstudy),在现实情境中进行的研究。常用于研究在实验中看不见的心理和行为。4.调查研究法(surveyresearch),包括问卷法和访谈法。经常与其他方法结合使用,也可以独立使用。(二)真实验设计的具体分类1.按统计检验力分,完全随机设计、随机区组设计和拉丁方实验设计以上是三种最基本的实验设计方法,它们可以组合成各种复杂的实验设计。它们的区别在于控制无关变量的方法。分别采用随机化方法、区组技术、双重区组技术控制无关变量的影响。实验结果的检验精度逐级提高。实验设计模型:完全随机设计:Yij=μ+αj+εi(j)随机区组设计:Yij=μ+αj+πi+εi(j)拉丁方设计:Yijkl=μ+αj+βk+γl+εpooled(i=1,2,......,n;j=1,2,......,p;k=1,2,......,p;l=1,2,......,p)2.按自变量的数量分,单因素设计和多因素实验设计单因素设计:实验中只有一个自变量,被试接受这个自变量的不同水平的实验处理的设计。多因素设计:实验中有多个自变量,被试接受几个自变量水平的结合的实验处理。能探讨较复杂的因果关系,如交互作用,代表实验设计发展的一种趋势。例:多媒体教学与传统教学的效果?3.按被试分派程序分,被试间设计、被试内设计和混合设计被试间设计:是指实验中每个被试只接受一种自变量水平或自变量水平的结合的设计。这种设计中的变量为被试间变量。被试内设计:是重复测量设计的一种形式,由一个被试(而不是一组同质被试)接受所有的自变量水平或自变量水平的结合的设计。实验中的自变量叫做被试内变量。混合设计:是指在一个实验设计中既有被试内自变量,又有被试间自变量的设计,是重复测量设计的一种复杂形式,是一种最有实用价值的实验设计。4.其他的设计前后测设计,所罗门设计,小N设计,正交设计,嵌套设计三、实验设计的思想基础(复习)1.统计检验的基本思想统计检验的目的:确定从样本统计值得出的差异能否作出一般性的结论——总体参数之间确实存在差异。使用条件:当研究假说不能通过直接观察或通过观察总体的所有成员而直接被估价时,就需要通过统计推论间接地对它进行估价。如,6岁儿童的男女身高差异问题的研究。从某地区随机抽取男生30人,M1=114cm;女生27名,M2=112.5cm,能否根据这一次测量的结果下结论:6岁男生的身高比女生高?又如,中美小学生心算能力的比较研究。心理学实证研究的结果,基本上都需要进行统计检验。2.方差分析的基本思想思考:统计发现三种教学方法考评结果的方差分析结果为:F(2,27)=1.0,请问差异是否显著?方差分析的主要功能:是分析因变量总变异中不同来源的变异的贡献量的多少,如实验处理引起的变异,被试个体差异带来的变异,实验误差带来的变异等。“力是改变物体运动状态的原因”,运动状态的改变的表现就是“变异”;反过来,变异反映了物体受到了力的作用。任何一个心理变量的每一个观测值都凝聚着各种各样因素的影响。如,有一次辨别反应时的测量值为350ms。那么可能影响因素:简单RT,辨别能力,心理期望,注意不集中,疲劳,猜测,偶然因素……一组观测数据中,具体数值各不相同,之所以不同,就是变异来源很多。320315333318340327358365350380360375方差分析的目的在于考察系统的特定影响因素(自变量)是否对观测值有显著影响变异(variation):是“影响因素作用效果”的量化表现;衡量指标:标准差——方差(variance)——均方(每个自由度的平均变异);量化表现形式:平方和变异的来源:实验处理-实验处理之外的因素/组间变异-组内变异/组间均方-组内均方F值:组间均方除以组内均方——组间变异(实验目的),组内变异(控制对象)F检验的思想就好象把组间变异放在一个噪音(误差变异)的背景上,只有当组间变异足够大,明显不同于误差变异时,才说明处理效应是存在的。如果组间变异与组内变异相比差不多,则说明处理效应是不存在的。F(m,n)=1.0,意味着目标声音和背景声音一样响四、实验设计模型每一种实验设计都有一个特定的实验设计模型,它揭示了实验中一个观测值的构成,即影响一个观测值的所有变异源,为不同的实验设计提供了分解平方和的方法。例:单因素完全随机实验设计模型:Yij=μ+αj+εi(j)(i=1,2,......,n;j=1,2,......,p)Yij表示实验中第i个被试在第j个处理水平上的观测值。μ表示总体平均数,αj表示水平j的处理效应,εi(j)表示误差变异。实验设计模型的基本假设是:(1)模型Yij=μ+αj+εi(j)反映了影响实验中观测值Yij的所有变异源;(2)实验中包含了研究者感兴趣的处理水平(αj);(3)误差变异在每个处理总体内是以均数为0,方差为σ2e正态分布的。每一个被试的误差变异都独立于其他被试的误差变异。实验设计最重要的功能就是使处理效应最大,使误差变异最小。五、方差分析中的常用术语主效应(maineffects):实验中由一个因素的不同水平引起的变异。交互作用(interaction):当一个因素的水平在另一个因素的不同水平上变化趋势不一致时,我们称这两个因素之间存在交互作用。简单效应(simpleeffects):一个因素的水平在另一个因素的某个水平上的变异。处理效应(treatmenteffect):由自变量引起的变异。主效应、交互作用和简单效应均属于处理效应。误差变异(errorvariance):不能由自变量或明显的额外变量解释的那部分变异。单元内误差(within-cellerror):几个被试接受同样的实验条件时,他们之间所出现的差异。被试个体差异导致的误差。作用:用来估计实验误差。残差(residualerror):误差变异中除了单元内误差以外的误差,也应该是一种随机误差。如,只有一个被试接受一种实验处理时存在的误差。作用:用来估计实验误差六、真实验设计(一)单因素实验设计1.单因素完全随机实验设计(1)单因素完全随机实验设计的基本特点:适用条件:研究中有一个自变量,自变量有两个或多于两个水平。基本方法:把被试随机分配给自变量的各个水平,每个被试只接受一个水平的处理。误差控制:随机化法。假设被试之间的变异在各水平之间是随机分布的,在统计上无差异。实验设计模型:Yij=μ+αj+εi(j)(i=1,2,...,n;j=1,2,...,p)Yij表示实验中第i个被试在第j个处理水平上的观测值。μ表示总体平均数,αj表示水平j的处理效应,εi(j)表示误差变异。即:总变异由两部分组成:实验处理引起的变异(αj);误差引起的变异(εi(j))。(2)数据处理方法(SPSS统计软件):包含的统计变量:实验的自变量A,实验的因变量Y。预期的统计结果:自变量A的主效应是否显著,即F((P-1),P(n-1))的P值是否小于0.05。实施的统计过程:analyze—comparemeans—One-WayANOVA(3)应用举例及延伸与该设计相关的名称:随机组实验设计,独立组实验设计;下属的设计类型:实验组控制组前后测设计,实验组控制组后测设计,随机多组后测设计。(3)单因素完全随机实验设计应用举例研究题目:文章的生字密度对学生阅读理解的影响研究假设:阅读理解随着生字密度的增加而下降实验变量:自变量——生字密度,含有4个水平(5:1、10:1、15:1、20:1)。因变量——阅读测验的分数实验设计:单因素完全随机实验设计被试:32人,随机分为四组,每组接受一个自变量处理——阅读一种生字密度的文章。数据:a1:36435752a2:46424533a3:89875676a4:988712131211思考:其他的例子?2.单因素随机区组实验设计(1)单因素随机区组实验设计的基本特点:适用条件:研究中有一个自变量,自变量有两个或多于两个水平;研究中还有一个无关变量,也有两个或多个水平,并且自变量的水平与无关变量的水平之间无交互作用。基本方法:首先将被试在无关变量上进行匹配,然后把各匹配组的被试随机分配给自变量的各个水平,每个被试只接受一个水平的处理。误差控制:区组法(无关变量纳入法)。通过统计处理,分离出由无关变量引起的变异,使它不出现在处理效应和误差变异中,从而提高方差分析的灵敏度。实验设计模型:Yij=μ+αj+πi+εi(j)(i=1,2,......,n;j=1,2,......,p)Yij表示被试i在水平j上的分数;μ表示总体平均数或真值;αj表示水平j的处理效应;πi表示区组效应;εi(j)表示误差变异。总变异组成:实验处理引起的变异;区组引起的变异;误差引起的变异。(2)数据处理方法(SPSS统计软件):包含的统计变量:实验的自变量A,区组变量X,实验的因变量Y。实施的统计过程:anal