第三章研究的设计一、研究设计的内容二、研究设计的标准三、研究取样的设计四、研究变量的确定与操作定义的设计一、研究设计的内容二、研究设计的标准三、研究取样的设计四、研究变量的确定与操作定义的设计一、研究设计的内容(P105-108)明确研究目的、选择研究对象;选择研究方法与设计方式;确定研究变量与观测指标;选择研究工具与材料;指定研究程序与选择研究环境;考虑数据整理和统计分析的方法。二.研究设计的标准(一)研究的信度1、研究的信度定义:指研究所得事实、数据的一致性和稳定性程度。2、分类:内在信度与外在信度根据误差来源不同,分为稳定性信度与同质性信度3、判定研究工具或研究结果信度的方法(1)重复法采用相同条件下采用相同方法进行两次以上的研究,然后考察它们能否取得相同结果。(2)相似法指比较同质或类似研究工作、或同类研究的结果的一致性程度,来判定研究工具或研究结果的可靠性。(3)独立评判法即两个或两个以上的研究者同时对一组被试的行为、操作水平等各种表现进行独立判断或评价,然后比较他们之间的一致性,用以判定研究者之间的一致性程度。(二)研究效度1、研究效度的概念研究效度是指研究的有效性和真实程度,是指研究结果的可靠性和普遍性。2、分类:内在效度与外在效度内在效度是指研究人员控制外部变量的程度,是指研究结果能否被明确解释的程度。内在效度通常要回答的问题是:研究结果是否真实可信?研究结果是否是由所操纵的自变量引起?外在效度是指研究结果的代表性和可推广程度,即研究结果能否被推广到更大范围的程度。外在效度通常要回答的问题是:研究结果是否具有代表性并能解释一般的情形?研究结果有多大的概括性?在类似情境中能否验证研究结果?3、影响内在效度的因素(1)偶然事件(History):偶然事件也有人译为“历史”,指研究过程中发生的,没有预料到的,会影响研究结果的因素。控制方法:设置一个对照组加以控制,使偶然事件的效力对两个组的影响均等。(2)成熟的过程(Maturation)成熟是指在研究过程中被试生理或心理方面发生的变化。控制的方法可以设置对照组,或缩短研究时间的周期。(3)前测效应(Testing)前测效应是指有前测的经历会对后测的效果造成影响,有人称之为练习效应或热身效应。一般来说,当研究者有理由怀疑前测会对研究结果造成影响,或者前测很花费时间和经费,那么最好避免采用前后测设计,仅采用后测设计。(4)测量工具(Instrumentation)指测量手段不统一产生的负面效果。如果用来测量研究结果的工具,在前测与后测中所用的内容、难度都不一样,就难以确定研究结果的最终效果。(5)统计回归(Statisticalregression)统计回归是指多次测量研究对象时出现的一种倾向,即对一个变量进行测试时,他们的分数出现两极分化,但当再次进行同样的测试时,他们的分数更接近于平均数。因此,实验设计中要避免选择测试特别好的或特别差的被试,因此选择被试要随机化,要有代表性。(6)被试选择的偏差(Selectionbiases)当必须采用两组被试进行比较研究,如果这两组被试的能力、特质、条件、背景等因素不相同,那么就会导致测验结果的差异,从而混淆研究的效果。控制样本偏差的措施是随机抽样,随机分组、随机分配实验处理,尽可能使实验组和对照组除了在实验处理上的不同外,在其他各种条件上做到均等、相似。(7)实验样本的流失(Experimentalmortality)实验样本的流失有的翻译为实验的偶然减员,是指在研究期间有些被试缺席或中途退出,以致前测与后测人数不符,样本失去代表性,而影响统计分析的结论。一般,流失的被试是在前测中成绩较差者,则样本后测的平均成绩会提高;反之,流失的被试是在前测中成绩较好者,则样本后测的平均成绩会降低。(8)选择与成熟的交互作用即变量的混淆,各种因素互相干扰,互相作用,以至于无法确切解释自变量和因变量之间的关系。在研究设计中,由于被选取的两组被试具有不同的能力、特质、条件,导致对以上各个因素产生不同的作用,从而影响研究结果。(9)因果方向不明在研究中分不清自变量和因变量的研究不多见,但有时由于研究设计的不确切,导致在两个变量之间很难确定谁是因,谁是果,这种现象在相关性研究中尤为普遍。一旦因果关系不明,对研究结论的解释就会受到挑战。方法:做进一步的因果研究设计来探讨其中的方向关系。有较高的相关不一定具有因果关系,但具有因果关系必定有很高的相关。(10)实验处理的扩散(Diffusionoftreatments)即在实验研究中,实验组与对照组互相沟通,导致主试或被试有可能把实验处理传递给对照组,对照组可能会有意无意的模仿、运用、吸收,产生与实验处理相符的行为和活动,产生与实验组相同的结果。这种实验处理扩散的结果就是:实验处理的效果会被抵消。为了避免实验处理的扩散,应尽量将实验组与对照组的接触降到最低限度。(11)补偿性均等在现场的教学实验研究中,实验处理往往是向实验组被试提供较好的学习机会,提供具有吸引力的材料(如采用多媒体教学,或试验新教材),而对照组被试经常要被剥夺某种好的学习机会或被认为有价值的东西,以配合实验组。但是从教育伦理角度考虑,这样做对某些学生不公平,学生的学习和发展机会应该均等。因此,有时校方或行政管理人员会为他们提供有益于学习的活动或资源,作为某种补偿,以示均等。这种做法,将使对照组被试也有良好的学习表现,从而导致实验效果的混淆。(12)补偿性的竞争补偿性的竞争指对照组被试在与实验组竞争时,表现出超常努力的现象。补偿性的竞争这种现象在教育研究情景中常会发生。如在新的教学方法与旧的教学方法比较研究中,对照组被试往往会把实验情景看作一种竞争或威胁,或者由于没有作为实验组心里不服气,从而加倍努力,以证明自己能力不亚于实验组。结果造成无法确定教学实验效果。(13)自暴自弃(Demoralization)自暴自弃是指被试由于得知未被选为实验组产生的怨恨,并且故意怠工,失去自信心,表现比平时差,自甘堕落的现象。这样会导致实验处理效果突显,但这种实验效果未必真实可靠。4、影响外在效度的因素外在效度(externalvalidity)是指研究结果的代表性或普遍性。具体说来,就是指研究结果是否可以推广到类似情景中去的程度。(1)取样的偏差由于抽样范围的限制,样本不具有代表性,无法将研究结果类推到样本以外的人群,从而影响研究的外在效度。(2)被试与实验处理的交互作用只要研究对象是人,就会具有个别差异。由于每个人的特质不同,对于实验处理的反应也会不一样。交互作用就是不同变量之间的影响相互不一致。(3)研究变量与情景的叙述不清外在效度关心的一个问题是:研究结果会不会因环境的不同而变化,在研究情景中表现出的效果是否会在一般情景中再现,换句话说,就是能否“复制”。任何研究均需界定研究变量,并说明研究情景,给人以操作的程序和测量的标准。如果研究变量没有明确界定,研究情景也不交代清楚,他人便无法知晓研究的程序和方法,也无法了解研究结果的真实性和适用范围,研究的推广解释就会受到限制。因此,研究设计过程中,必须界定研究变量,下操作性定义,规定研究的情景和条件。(4)重复测验的干扰重复测验的干扰是指前测对后测的影响或交互作用,前测的内容或程序可能会引起被试的对某些论题或事物的注意和敏感,往往会影响后测的成绩。(5)实验安排的反作用实验安排的反作用是指由于实验情境的安排,被试知道自己正在被观察或正在接受实验处理而产生的一种实验效应(霍桑效应)。被试往往会投实验者之所好,改变自己原来的常态行为,表现更积极,更努力,提供实验者所期望的行为。这样往往会对实验效果的推论造成影响。(6)新颖的干扰由于实验情景是经过特别安排的,其内容、程序、步骤、环境等都可能给被试带来新奇感,由此会激发被试的参与热情,进而促使实验效果的提高。(7)实验者效应实验者效应指在实验情景中,实验者或主试的行为、外表对被试行为的影响。实验者或主试的仪表容貌、言语风格、性格特征、行为习惯等,会潜移默化、无意间影响被试的行为表现,这种影响会导致研究结果不能推广到不同实验者的其他同类研究中去。(8)特殊事件的影响在研究期间可能会发生许多意想不到的事,这些事是事先无法估计到,但是却会影响研究的结果。如果将这样的研究结果去推论解释一般情况下,无类似特殊事件时,则类推结果就会受到一定的限制。(9)因变量的测量因变量的测量是研究结果的依据,因此因变量的操作性定义和测量工具成了决定研究结果的关键因素。(10)时间效应(theeffectoftime)任何实验必须要有后测,研究结果只有通过后测才能显现。但是有些实验处理的效果是隐晦或不完整的,有些结果具有即时性,只有在实验后立即实施后测才能显示效果。通常实验研究均在实验处理之后立即测量实验效果,但此时所测得的效果,有时因变量还没有来得及发生变化。另一方面,也有这样的可能性,实验效果产生很快,即刻效应明显。较长时间后,效应未必存在或保持不变。三、研究取样的设计1、取样:是指从研究对象的全体中抽取一部分作为全体的代表进行研究。2、优点:1)加强研究效能;2)减少研究误差;3)深究研究对象;4)确保研究施行3、抽样的基本步骤1)界定总体2)确定样本容量3)选择抽样方法并选取样本4)统计推论4、抽样的基本方法1)简单随机抽样:简单随机取样法就是按照随机原则直接从总体N个单位中,抽取出若干个单位作为样本的方法。主要有抽签法、随机数字表抽样法缺点:2)分层随机取样法是先将总体按一定标准分为若干类型(统计上称为层),再根据类型的数量在总体数量中所占的比例(或比率),确定从各类型中抽取样本的数量,然后按随机原则和所确定的各层抽取样本的数量,从类型中抽取样本。优点:代表性和推论的精确性较好。局限性:要求对总体各单位的情况有较多了解,否则就难以作出科学的分类。(3)等距随机抽样法是根据事先已有的总体中各个体的排列顺序编号,用总体N除以样本容量n,求得抽样间隔,然后再按抽样间隔,随机抽取样本。优点:比简单随机抽样更简便,其样本代表性更好,抽样误差较小;缺点:如果总体中个体的排列存在周期性的波动或变化,系统取样所得的样本就可能出现系统偏差。(4)整群随机抽样法又称团体小组取样,是先将总体单位按一定的标准分成许多群(小组),然后按随机原则从这些群中抽取若干群作为样本。优点:样本比较集中,易于组织,可节省人力、物力和时间;缺点:样本分布不均匀,代表性较差,抽样误差较大。(5)多段随机取样又称系统取样、阶段取样,是先将研究总体各单位按一定标准分成若干个群,作为抽样的第一级单位,然后再根据一定标准把第一级单位分成若干个子群,作为抽样的第二级单位。如此类推,在各级单位中依照随机原则抽取样本。优点:可综合运用各种抽样方法,简便易行,节省经费,对研究总体范围大、单位多、情况复杂的情况十分有效;缺点:抽样误差相对于简单随机取样大。5、影响样本容量的因素1)研究目的2)研究经费与时间的限制3)研究问题的特点4)抽样方法5)研究对象总体的同质性6)研究实施过程中的具体情况7)研究所使用的测量工具的可靠性8)研究所使用的统计方法9)研究结果精确程度的要求6、样本大小的经验性确定描述研究、调查研究中,样本应占总体的10%,且调查研究的样本容量一般不少于100;相关研究、比较研究的满意样本每组至少30;控制严格的实验每组可以15人,不严格的教育实验最好为一个自然教学班,大于30人;用因素分析等多元统计方法所需的样本容量一般为300人到600人,最低不能少于150人。四、研究变量的确定与研究指标设计(一)研究变量的定义及基本类型Ⅰ定义:是指性质、数量上可以变化、测量或操纵的条件、现象、事件或事物的特征Ⅱ类型1)相关变量与因果变量2)主体变量与客体变量3)直接测量变量与