第六章准实验设计定义所谓准实验,是相对于真实验而言的,是指那种既不能直接操纵自变量又不能对研究中的额外变量作较严格控制的研究。它像实验一样一般要比较不同的组或条件,但这种设计用不可操纵的变量来确定要比较的组或条件。不可操纵的变量通常是被试变量(如性别男和女)或时间变量(如处理前和处理后)。它和真实验的主要区别在于,准实验中没有运用随机化程序进行被试选择和实验处理;也不能完全主动地操纵自变量。准实验设计的发展背景:准实验设计是伴随现场研究的发展而发展起来的。最初实验室研究在人工的实验室中进行,采用真实验设计的方法,对各种变量的控制都非常严格。这样能够最大限度的保证研究的内部效度。但是这种严格的实验室研究结果的可推广性,即外部效度是值得怀疑的。很多实验室研究的结果不能应用到日常生活场景中。另外,很多与社会生活密切相关的问题不能在实验室中进行。基于上述原因,一种新的思路被提出来,这就是现场研究。现场研究是在实际工作,学习和生活情景中进行的研究。但是现场研究中,常常不能运用随机化程序选择和分配被试。学校,工厂等企事业单位都有正常的工作和学习秩序,不可能、也不应该随便更改。所以现场研究中经常选择现成的车间,班组和班级来作为实验对象。而且有些情况下,也不能采用控制组。基于这种状况,现场研究中就不太可能采用真实验设计方案,而只可能采用一些准实验设计方案。最初提出准实验设计概念的是心理学家Cook&Campbell(1966,1979)。他们于1979年发表了《准实验研究:现场背景的设计和分析》这一专著,为准实验设计提供了坚实的理论基础。书中,他们系统全面地提出了准实验的设计原则和统计分析方法,使准实验设计的理论和方法日臻完善。准实验研究往往有如下特点:(1)其研究中的自变量往往用被试变量。这些被试变量可能是自然形成的被试变量,如年龄、性别、种族等;可能是社会所形成的被试变星,如社会阶层、宗教信仰、居住区等;可能是因疾病及与之有关的被试变量,如残疾者、弱智者、脑外伤者等;可能是学习现状不同的群体或己形成的不同个性的群体等。(2)研究者只能选择那些已具有了某种不同程度特征的被试。而不能像真实验那样从总体中随机选取被试或随机分组。(3)一般而言,不能从准实验研究结果中作出因果关系的结论。其主要原因是在研究的变量上缺乏严格控制,因而其内部效度较低。尽管准实验设计在内部效度方面不如实验设计.但是,当一个问题无法使用真实验设计时,准实验设计不失为可选择的设计。Geronimus(1991)研究少女妈妈,发现与过早怀孕相比,社会经济地位等家庭因素更能决定这些女孩子是否会经历贫困、高退学率、高婴儿死亡率等不幸。Geronimus使用少女妈妈的姐妹作为对照组。以这种方式对家庭背景进行控制的时候,许多与过早怀孕相联系的消极后果都消失了。第一节单组准实验设计一、时间序列设计(一)时间序列设计的基本模式(1)设计方案对一组被试先进行周期性测量,之后引入实验处理X,然后再进行一系列周期性的测量。比较插入实验处理前后测量的变化趋势,从而推断实验处理是否产生效果。(2)图示及数据分析o1o2o3o4Xo5o6o7o8o代表测量结果,X代表实验处理,O1-O8之间间隔时间相等。(3)补充说明根据研究的内容和目的不同来确定实验处理前、后的观测次数,并且前、后的观测次数也可以不同。但总的来说,观测的次数越多越好。有学者推荐在实验处理前的观测次数不少于50次。《法制报》的发行对犯罪率的影响在报纸发行前对犯罪行为进行一系列观察,在报纸发行后再进行一系列观察,比较前后的观察结果。(O为观察,X为实验处理)对学生实施恶劣情绪管理计划的效果在实施这一计划之前对学校打架次数进行记录,在实施这一计划之后再进行记录,比较前后的结果。O1O2O3O4XO5O6O7O8GF图时间系列设计研究的可能结果EDCBAA线处理后没有出现不连续性B线处理前后的成绩水平基本相同C线处理前后的变化趋势一致D线处理后的水平发生了高的变化E线也发生了高的变化,但不久又恢复到处理前的水平F线处理后的水平变化过一段时间才发生了G线处理后的水平发生了低的变化例:一位小学语文教师想研究某种新的识字教学法能否提高教学效果,于是他连续地运用旧的教学法进行了四周的识字教学,并对每一周的教学效果进行检测。其操作程序:第一周教给学生50个生字;第二周教给学生50个生字,同时检测上一周的学习效果;第三周教给学生50个生字,同时检测第二周的学习效果;第四周继续教给学生50个生字,同时检测第三周的学习效果;第五周则改用新的教学方法教给学生50个生字,同时检测第四周的学习效果……依此类推,第五到第八周都采用新的识字教学法。如果以百分制记录检测的结果,则八周识字教学的效果记录如下表。周次12345678检测分数3028354567708586表识字教学法试验结果12345678X图单组时间序列设计研究结果图示图中垂直虚线是引入新教学法的时间,即此前的四周使用传统的教学方法,此后的四周使用新的教学方法;两条斜着的虚线分别代表引入处理前后两个观测序列的回归线。从曲线在引入新的教学法前后的变化可以直观地看到新教学方法的作用。坎贝尔1969年采用时间序列设计研究了康涅狄格州的交通死亡人数与实施严惩制度的关系。例:美国康涅狄格(Connecticut)州在1955年发生了324次交通死亡事故,创历史最高记录。迫使州政府立即采取了限制车速的严厉措施。此后,1956年的交通死亡事故比1955年下降了40次。于是,州政府便据此作出结论,说这种变化是由于采取了严格限制车速措施引起的结果。年份195119521953195419551956195719581959325300275250225200坎贝尔认为,不应仅就最接近实施限制车速措施(处理)前后各一年的记录数据作比较。而应当把这两年的交通死亡事故次数的变化,都置于实施严格限制车速措施前后的时间序列之中去考察分析。为此,坎贝尔在1969年发表论文,按时间序列,搜集了自1951年至1959年康涅狄格州每年所发生的交通死亡事故的记载数据;并用图解说明了他对实施限制车速措施所产生的效果的研究分析。如果把上述1955-1956年交通死亡事故的数字变化,置于这两年之前与之后的时间系列中去考察和分析,则会发现除了处理效果之外,还有其他因素可能会对处理后的变化产生影响。首先,在1955年采取限速措施之前的时间序列中,交通死亡事故曾出现过大幅度的起落现象,时间序列的基线是不稳定的,1952和1954年交通死亡事故的次数,甚而比实施限制车速措施后的1956~1959年时间序列中的任何一年都少。其次,1955年所发生的交通死亡事故的次数是该时间序列中的顶峰,按随机涨落的原理,顶峰之后便有可能由于回归的原因而发生逆转现象,而限制车速的措施又正是在事故发生的高峰之后实施的,这就不能排除有回归效应的可能性。因此,对于这项时间序列设计的研究结果,应该将处理效果置于时间序列之中进行分析推断。一方面,从1951年、1953年和1955年来看,发生交通死亡事故的次数是呈上升的趋势;而处理后则出现了事故持续下降的倾斜度,这可以说明采取严厉限制车速的措施,确实产生了使交通事故降低的积极效果。另一方面,还应充分估计到在时间序列中引进处理后所发生的变化,还可能会受到诸如上述其他因素的影响。1966年,美国联邦政府通过了《高速公路安全法案》,要求摩托车驾驶者使用头盔,然而在70年代末期,因为社会对个体人权的关注,政府撤销了法案。Hedrick无意中进行了A—B—A形式实施的时间序列设计。(二)时间序列设计的数据分析比较处理前后观测值的变化趋势有无差异;一般比较前后回归线的斜率和截距。(三)时间序列设计的评价优点:1、可以较好的控制“成熟”因素对实验处理效果的影响。在O1-O8的系列测量过程中,相邻两次测量的时间间隔基本相同,可以认为在每个时间间隔内“成熟”的发展基本相同,“成熟”仅发生在O4-O5之间而不发生在其他时间间隔内应是一个小概率事件。2、可以有效的控制测验因素的干扰。由于每个被试的成绩都是经过反复测验而得到的一系列结果,这样就能够降低由于只做一次测验而出现的有偏样本成绩的概率,可以有效地减少测量偏差。缺点:1、由于无对照组,因而不能有效地识别和控制伴随实验处理发生的偶发事件的影响,不能排除那些与实验处理同时出现的附加变量的影响。2、多次实施前测往往会降低或增加被试对实验处理的敏感性,从而在被试身上产生作用而影响其实验处理后的测量成绩。时间序列设计具有相对的有效性,研究者可以使用这种设计积累研究资料,为进一步严格的实验研究和科学概括提供证据。有三点需要注意:1、研究中要保持实验情境的相对稳定,减少不必要的条件变化对实验结果的干扰。2、通过单组时间序列设计实验不能得到最后的、确定性的结论,如果想得到肯定的因果关系结论,应选用有控制组参加的实验设计。3、由于研究中对实验条件控制不是很严格,因此研究者应充分考虑那些突发的或随意事件,详细记录研究中伴随的各种事件,这有利于对结果作出更符合实际的科学评估和解释。二、相等时间样本设计(一)相等时间样本设计的基本模式(1)设计方案是指对一组被试连续抽取多个相等的时间样本,即选择完全相等的多个时间段,在其中的一个时间样本中实施实验处理,而在后续的另一个时间样本中并不实施实验处理,并通过对两种时间样本的观测分数之间的差异分析来比较实验处理的准实验设计。(2)图示及数据分析X1O1X0O2X1O3X0O4X1-实验处理,X0-常规安排(二)相等时间样本设计的数据分析第一次实施第二次实施X1O1O3X0O2O41、处理条件与无处理条件间的比较,以考察存在处理效应的可能性2、分别在有处理条件下和无处理条件下考察时间因素的简单效应,这主要是分析研究中的时间效应或顺序效应;3、分析实验处理与处理顺序的交互效应,以考察在时间序列中不同处理的不同效应。例:关于改正或减少学龄前儿童在课堂里出现攻击性行为的研究。把幼儿园中一个有20名4岁幼儿(男12名,女8名)的原班,作为一个被试组。研究的目的是在不改变原任教师按课堂开放原则组织和管理该班的前提下,验证儿童集体积极行为的影响对于改变伙伴攻击性行为(如对同伴脚踢、拳打、口咬和推搡等)的效果。研究集体控制是否有助于提高奖励和惩罚的效果。连续43天,每天上午观察3小时。在正式实验之前,先观察并记录了全班儿童在课堂中攻击性行为的比率,取得了观测值O1,作为基线资料。实验分4个阶段进行。第1和第3阶段,施行控制条件(X0),即单独使用奖励和惩罚的方法。对1小时内无攻击性行为的儿童奖给糖果,令有攻击性行为者离开课堂3分钟。并分别随后得出了1、3阶段的观察结果O2和O4。第2和第4阶段,给予实验处理条件(X1),即使用集体影响和奖惩相结合的方法,将全班20人分为5组,根据小组伙伴的行为进行奖惩,在1小时内小组中1人受罚,4人均不能得奖;小组内无1人受罚,则每人受奖。并分别随后获得了2、4阶段的观察结果O3和O5。研究结果表明,在实施实验处理(X1)的第2和第4阶段,课堂中出现攻击性行为的次数最少;集体控制与外部奖励、惩罚结合使用,比仅用奖励和惩罚的方法,对于控制学龄前儿童在课堂中的攻击性行为,可取得更显著的效果。例:一位教师想研究学习反馈在学生写作学习中有无明显的作用。研究模式是:每周要求学生完成一篇作文,实验周期共四个月,其中第一个月有学习反馈、第二个月没有学习反馈、第三个月有学习反馈、第四个月没有学习反馈。有学习反馈用XO表示,就是每周学生完成作文后,老师都要对其作文做详细的批阅和给出恰当的评语;没有学习反馈用O表示,就是学生每周完成的作文交来后,老师只是批上“阅”字和日期,不作任何修改和评价。在实验中老师悄悄地对学生的作文成绩进行成绩评定但不公布,这样就形成了如下表的实验模式。表写作学习中反馈效应的准实验研究模式第一次循环第二次循环(有反馈的学习成绩)XO1(无反馈的学习成绩)O2(有反馈的学习成绩)XO3(无反馈的学习成绩)