2020/4/6《统计学实验》第5章方差分析5-1统计学实验—SPSS和R软件应用与实例主编:费宇2020/4/6《统计学实验》第5章方差分析5-2第5章方差分析2020/4/6《统计学实验》第5章方差分析5-3一、实验目的1.熟悉分析(Analyze)菜单里比较均值子菜单(CompareMeans)中单因素方差分析(One-WayANOVA);2.熟悉一般线性模型子菜单(GeneralLinearModel)中单变量多因素方差分析(Univariate)模块的主要功能,3.掌握运用SPSS进行方差分析的基本操作过程,并能读懂SPSS输出的结果。2020/4/6《统计学实验》第5章方差分析5-4二、实验环境1.系统软件Windows2000或WindowsXP或Windows7;2.统计软件SPSS16.0或更高版本。2020/4/6《统计学实验》第5章方差分析5-5三、实验内容1.单因素方差分析2.多因素方差分析2020/4/6《统计学实验》第5章方差分析5-6第5章方差分析5.1单因素方差分析5.2双因素方差分析2020/4/6《统计学实验》第5章方差分析5-75.1单因素方差分析【例5.1】(数据文件为li5.1.sav)为研究咖啡因对人体的影响,进行如下的试验:咖啡因剂量取三个水平:0mg,100mg,200mg。挑选同一年龄,体质大致相同的30名健康的男大学生进行手指叩击训练。训练结束后,对每个水平随机的选定其中10个人,在服用咖啡因2小时后,请每个人做手指叩击,记录下每分钟叩击的次数。该试验进行双盲试验,即试验者和生物学家均不知道他们接受的是哪一种剂量的咖啡因,只有统计人员知道。试验数据如下表:2020/4/6《统计学实验》第5章方差分析5-8表5.1咖啡因试验数据咖啡因剂量重复数据0mg242245244248247248242244246242100mg248246245247248250247246243244200mg246248250252248250246248245250(数据来源:费宇等,《统计学》第5章,高等教育出版社,2019)(1)给定显著性水平,比较试验中咖啡因用量是否对人体神经功能有显著影响?0.05(2)如果有显著差异,在0.05的显著性水平下,说明试验中咖啡因用量在哪些水平上有显著差异?2020/4/6《统计学实验》第5章方差分析5-9【统计理论】在一个实验中,因素A有r个水平,,,,在每个水平下作了次实验。那么,在水平下的第次试验的观测值为描述方差分析的统计模型为1A2ArAiniAj),1,,,1(iijnjriyijiijy2020/4/6《统计学实验》第5章方差分析5-10其中,表示观测指标值的总平均,表示因素第水平上的主效应,表示随机误差;主效应参数满足约束条件研究因素的影响是否显著可以归结为比较这个总体的均值,即检验如下假设【统计理论】iiAiji01riijr012:0rH该假设的检验可以通过平方和分解得到。2020/4/6《统计学实验》第5章方差分析5-11【统计理论】2..11rnijijSSTyy22111()()rnriiijiSSAyynyy211()rnijiijSSEyy总平方和:组间平方和:组内平方和:2020/4/6《统计学实验》第5章方差分析5-12三种“平方和”之间的关系平方和分解:SSTSSASSE【统计理论】2020/4/6《统计学实验》第5章方差分析5-13由于上述几种平方和的数值受到样本量和水平数的影响,一种更为科学的方法是将各部分平方和除以相应自由度,其比值称为均方和,简称均方(meansquare,MS),即,,11SSTSSASSEMSTMSAMSEnrrnrr上式中分母的数值为对应平方和的自由度。【统计理论】2020/4/6《统计学实验》第5章方差分析5-14/(1)~(1,)/()MSASSArFFrnrrMSESSEnrr(1,)Frnrr0H,则拒绝零假设,即认为因素A对指标值(或试验结果)有显著影响,否则认F统计量的数值大于对给定置信水平,A没有显著影响。为因素为了检验,定义F统计量0H【统计理论】2020/4/6《统计学实验》第5章方差分析5-15将上述主要结果总结成一个表格,称为方差分析表,可以直观反映方差分析的计算及检验过程。表5.2单因素方差分析表【统计理论】2020/4/6《统计学实验》第5章方差分析5-16【统计理论】如果检验的结论是拒绝,则说明因素的个水平效应有显著差异,也就是说个均值之间有显著差异。但这仅仅说明在中至少有两个存在显著差异,这时我们还需要对每一对和作一对一的比较,即多重比较。具体的说就是要比较第组和第组平均数,即检验F0HArrr,,21ij0:{0,1,,,1,,,}ijHirjrij2020/4/6《统计学实验》第5章方差分析5-170ij0ji注意到与是等价的。因此该假设中共有(1)/2rr个不同的成对比较。【统计理论】多重比较的特点是它同时对多个成对假设进行比较。多种比较的思想有两种,一是寻找每一个成对假设的检验统计量,给出检验临界值,通过比较界定显著程度;二是使用同时置信区间(simultaneousconfidenceinterval)的概念。多重比较有许多种方法,使用比较多的包括Fisher的LSD方法,Turkey方法,Bonferroni方法等。2020/4/6《统计学实验》第5章方差分析5-18【菜单方式】打开数据文件li5.1.sav,选择Analyze→Comparemeans→One-wayANOVA,将因变量y选入到Dependentlist中,将因素KFTJL选入到Factor中,点击进入Option对话框,在Statistics下选择Homogeneityofvariancetest,点击Continue,最后点击OK。(1)这是单因素方差分析问题。2020/4/6《统计学实验》第5章方差分析5-19TestofHomogeneityofVariancesLeveneStatisticdf1df2Sig..292227.749ANOVASumofSquaresdfMeanSquareFSig.BetweenGroups61.400230.7006.181.006WithinGroups134.100274.967Total195.50029表5.3咖啡因用量实验的方差一致性检验表5.4咖啡因用量实验的方差分析表输出结果2020/4/6《统计学实验》第5章方差分析5-20【程序方式】ONEWAYCSHBYKFYJL/STATISTICSHOMOGENEITY/MISSINGANALYSIS.2020/4/6《统计学实验》第5章方差分析5-21【菜单方式】打开数据文件li5.1.sav,选择Analyze→Comparemeans→One-wayANOVA,将因变量y选入到Dependentlist中,将因素KFTJL选入到Factor中,(2)这是一个多重比较的问题。2020/4/6《统计学实验》第5章方差分析5-22在单因素方差分析的对话框中点击PostHoc…,进入后在EqualVarianceAssumed(假设方差齐性)下选定,Turkey,LSD和Bonferroni选项,点击Continue,最后点击OK。【菜单方式】2020/4/6《统计学实验》第5章方差分析5-23表5.5咖啡因用量实验的多重比输出结果2020/4/6《统计学实验》第5章方差分析5-24【程序方式】ONEWAYyBYKFYJL/MISSINGANALYSIS/POSTHOC=TUKEYLSDBONFERRONIALPHA(0.05).2020/4/6《统计学实验》第5章方差分析5-255.2双因素方差分析5.2.1有可加效应的双因素方差分析【例5.2】(数据文件为li5.2.sav)有四种品牌(brand)的饮料在五个地区(district)销售,在每一个地区对每一种品牌的饮料销售量观测两次(上半年一次,下半年一次)得到数据如表5.6所示。在0.05的置信水平下,问品牌及地区对饮料的销售量是否有显著影响?2020/4/6《统计学实验》第5章方差分析5-26因素A因素B123451360375356366367380336356375390228330130332531233332435529531033573703083253063303663863173304302312294310288301322340355370表5.6四种饮料品牌在五个地区的销售数据2020/4/6《统计学实验》第5章方差分析5-27【统计理论】在一个实验中,设有A和B两个因素,因素A有个水平,,,,因素B有个水平,,,,这样因素A和B就有个水平组合。在因素A,B的每一种水平组合下均有个样本观测值(次试验),第个样本值记为1A2ArArs1BB2sBsrnnk(1,,,1,,,1,,)ijkyirjskn2020/4/6《统计学实验》第5章方差分析5-28常数方差2。有可加效应的双因素方差分析模型ijkijijky1,,,1,,,1,,,irjskn其中,表示观测指标值的总平均,iAi表示因素第水平上的主效应,jBj表示因素第水平上的主效应,表示随机误差。ijk且,。10rii10sjj【统计理论】假设不同水平上观测数据相互独立,同一水平中,n个重复观测数据也相互独立,ijky具有2020/4/6《统计学实验》第5章方差分析5-29对双因素方差模型,将涉及两个因素主效应的检验。因素A的显著性假设为:012:0ArH而对因素B,显著性假设为012:0BsH【统计理论】双因素方差分析与单因素方差分析的统计原理基本相同,上述两个零假设也可以通过平方和分解进行检验。2020/4/6《统计学实验》第5章方差分析5-30221111()()rsnriiijkiSSAyynsyy221111()()rsnsjiijkjSSByynryy【统计理论】2111()rsnijkijijkSSEyyyy因素A的平方和:误差平方和:因素B的平方和:2020/4/6《统计学实验》第5章方差分析5-31可以证明,各平方和之间满足:SSTSSASSBSSE【统计理论】0AH0BH为了给出假设问题和的检验过程,定义如下两个F统计量:/(1)/(1)AMSASSArFMSESSEnrsrs/(1)/(1)BMSBSSBsFMSESSEnrsrs2020/4/6《统计学实验》第5章方差分析5-320AH(1,1)AFFrnrsrs可以证明,当成立时,当0BH成立时,(1,1)BFFsnrsrs【统计理论】1,1AFFrnrsrs时,当对给定的检验水平,拒绝,即认为因素A对指标值有显著影响。0AH1,1BFFsnrsrs时,当拒绝,即认为因素B对指标值有显著影响。0BH2020/4/6《统计学实验》第5章方差分析5-33【菜单方式】打开数据文件li5.2.sav,选择Analyze→GeneralLinearModel→Univariate,将因变量y选入到Dependentvariable中,将brand和district两个因素选入到Fixedfactor(s)中,点击Model,然后选择Custom(这样是模型中不包括交互效应),在Buildterm(s)中选择Maineffects,再把brand和dist