方差分析1.方差分析的原理估算误差方差平方和分解2.单因素方差分析完全随机随机区组3.多重比较4.多因素方差分析1.方差分析的原理1.1什么是方差分析AnalysisofVariance•简称ANOVA,检验多个总体均值是否相等分析实验数据中不同来源的变异对总体变异的贡献大小,从而确定实验中的自变量是否对因变量有重要影响(见P167第二段)比较两个以上的样本平均数•可以把方差分析看成是t检验的扩展分析两个以上的自变量的效应及其变量之间的交互作用1.2从一个例子看方差分析的原理•Craik&Lockhart(1972)记忆效果和加工方式有关•Eysenck(1974)50名55~65岁的被试随机分组–Counting计算字母的数目–Rhyming想出押韵的词–Adjective想出一个修饰词–Imagery把词想象成画–Intentional告知有记忆测验(前4组都不知道要测验)过程:包含27个词的表过3遍后要求被试写下记住的词因素“加工方式”有5个水平j=1,2,…,k(k=5)countingrhymingadjectiveimageryintentionaltotali=1,2,…,n97111210n=108913111966816148661151061491041111231166131214531310157810191177111111Total(Tj)7069110134120503=∑XMean7.006.9011.0013.4012.0010.06SD1.832.132.494.503.744.01Variance3.334.546.2220.2714.0016.061.2.1几个概念•因素:自变量independentvariable,处理treatment如:加工方式•因素的水平:一个因素的不同情况或取值,不同的实验处理如:Counting,Rhyming,Adjective,Imagery,Intentional•因变量:自变量影响的结果如:记忆效果•单因素方差分析one-wayANOVA只有一个因素,一个因变量•多因素方差分析two,three,…-wayANOVA多个因素,一个因变量1.2.2虚无假设、前提假设•虚无假设H0:m1=m2=m3=m4=m5•方差分析的前提假设正态normality方差齐性homogeneityofvariance•误差方差errorvariance:和实验处理无关的方差•某种实验处理的效果相当于在每个人的分数的基础上加一个常数独立independenceofobservations1.2.3估计总体方差的两种方法方法一wwithineerrorjejeMSMSMSMSksssskssnnnsss,简写为记做;有时称为组内均方,,简写为记做,称为误差均方,只要方差齐性不管虚无假设是否成立)ErrorSquareMean(67.9500.1427.2022.654.433.35,,,22252221222521252522222121======方法二trtreatmentXeXettjXXeMSMSsnsnXkXXssn,简写为称为这种估计)为总平均数(其中如果虚无假设成立,2222222288.87788.810MeanGrand06.10788.81=====方差分析的逻辑•用两个方法来估计总体方差一种方法与虚无假设是否成立无关另一种方法以虚无假设成立为前提•如果两种方法算出来的结果一致,接受H0,否则拒绝H0处理效应treatmenteffecttreatmenterrortreatmenterroretreatmenteerrorjjjjMSEMSEHMSEMSEHnMSEMSEkk======为假时,当为真时,当各处理组均值的方差均值和总均值之差处理效应:某处理组的0022222211mmmm1.2.4平方和的分解sumofsquares•平方和的优越性在于其可加性均方和方差只有在自由度相等时才可加22221XXXXSSXXXXnSSSSSndf====变异的分解kNdfkdfNdfSSSSSSXXXXnXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXeXwbtwbtjijijtjjtijijjijijtjijtijijjijtjijjijijtjijtijijjijtjjijtjtijjijtjtijjijtjtijijjij==========11)()(22222222222222变异误差组内变异处理组间总变异m均方bbtrbeeewdfSSMSMSdfSSMSMS=====)()(均方处理组间均方误差组内自由度平方和均方•如果当F≤1,数据的总变异中大部分是由实验误差或个体差异造成的,不同的实验处理之间差异不大,即实验处理基本无效•如果F1且落入F分布的临界区外,实验处理的作用显著大于组内变异的作用,可以确认实验处理的有效作用,至少有两个处理之间的差异显著•方差分析就是检验组间变异在统计上是否显著地大于组内变异组内均方组间均方==wbMSMSFcountingrhymingadjectiveimageryintentionaltotal971112108913111966816148661151061491041111231166131214531310157810191177111111Total(Tj)7069110134120503=∑X用原始数值计算30.43552.35182.78652.35118.50607.54115050310120697082.78618.50605847505031189222222222222===========btwjbtSSSSSSNXnTSSNXXSS方差分析表变异来源自由度平方和均方F处理k-1SSbMSbMSb/MSw误差N-kSSwMSw总N-1SSt变异来源自由度平方和均方F处理4351.5287.889.08误差45435.309.67总49786.821.2.5方差分析的基本过程•建立假设H0:无处理效应H1:有处理效应•求平方和•确定自由度•求均方•进行F检验,单侧•列出方差分析表wbwbwwbbwbbtwjbtMSMSdfdfFkNSSMSkSSMSnkkNdfkdfSSSSSSNXnTSSNXXSS=========,11122221.2.6方差齐性检验哈特莱Hartley法各组方差符合齐性。例:,则认为方差齐性。若)(查临界值和根据==========,11.709.633.327.2033.3,27.20,91,54841)05.0max(max2min2max)max(max)max(2min2maxmaxFFSSndfkFFPFndfkSSF1.2.7方差分析和实验设计•因素单因素多因素•设计完全随机设计随机区组设计1.2.7.1完全随机设计Completerandomizeddesign•把被试随机分成若干组,每个组随机指派一种实验处理。完全随机分组后,各实验组的被试之间是相互独立的,因而这种设计又称“独立组设计”或“被试间设计”•不足之处误差项包括实验本身的误差又包括个体差异引起的误差1.2.7.2随机区组设计randomizedblockdesign•原则:同一组内的被试应尽量“同质”一个被试作为一个区组,不同的被试(区组)均需接受全部k个实验处理每一区组内被试的人数是实验处理的整数倍区组内的基本单元标识是以一个团体为单元•同一区组接受所有实验处理,实验处理之间有相关,所以也称为“相关组设计”或“被试内设计”•区组效应和误差变异的分离总平方和=组间平方和+区组平方和+误差平方和2.单因素方差分析2.1单因素完全随机设计•等重复设计各实验处理组的样本容量相同•不等重复设计各实验处理组样本容量不同•有各组均值、方差、样本容量而无原始数据2.1.1等重复设计•各实验处理组的样本容量相同k个处理组,每个组样本容量均为n•例为研究不同科目的教师当班主任,对学生某一学科的学习是否有影响。把40名学生随机分派到5名教不同科目的班主任负责的班级中,经过一段时间以后对这40名学生进行数学考试,结果见下表。请检验5组不同班主任的学生数学成绩是否有显著差异。数学语文生物地理物理76766265677867706871657069687272647371697167716174728369697983727365767973696984X596572556536592(X)2(X)2/n4440240898386423591243808(X)2/nX24462441152387263598244024X2之间有显著差异因此,各班的数学成绩解:64.235,425.317.246.7817.24335846,6.7844.314,35,4151,8464.3144.1160,4.314402852203662,4.1160402852204508:05.0bb222222543210============================FMSMSFdfSSMSdfSSMSkNdfkdfSSSSSSNXnXSSNXXSSH不等重复设计•各实验处理组样本容量不同计算组间平方和时,注意公式中的各组的nj不同kNdfkdfnNNXnXSSwbjjb====,1,,222.1.3有样本统计量无原始值(p.173)=======2222211,,jwtjbjtjjjwtjjbjjjtjjjSnSSXXnSSkXXnnSnSSXXnSSnXnXnSX对等重复设计,各已知若各实验处理组84686.3071.31714.3143.715.7483.71574675.695.715.74222=========jwtjbjtSnSSXXnSSkXX数学语文生物地理物理nj88888jX74.5071.5069.5067.0074.002jS31.7136.2912.0010.0030.86•例:把20名被试随机分成4组,每组(5人)接受一种教学方法,问四种教学方法是否有显著差异?教学方法:ABCD每组人数:5555每组平均数:55.487.2每组方差:1.991.041.201.762.2单因素随机区组设计方差分析•有四种小学语文实验教材,分别代号为A、B、C、D。为比较其教学效果,按随机区组设计原则,将小学分为城镇重点小学、城镇一般小学和乡村小学三个区组,分别代号为I、II、III,并分别在每个区组中随机地抽取4所小学,它们分别被随机地指派实验一种教材。经一年教学后通过统一考试得到各校的平均成绩如下表。问四种教材的教学效果是否一致?处理区组ABCDXi.iXI9164.583.575.5314.578.625II92.55991.57431779.25III91.55483.571300.075X.j275177.5258.5220.59