例题:为了检验甲乙丙三种分离机在析出某种有用物质效能上的高低,今抽取8批溶液,每批均分为三份,分别由甲乙丙机分解处理,其析出效果数据如下表所示。试问甲乙丙三种分离机在析出效能上有无差异(α=0.05)?甲乙丙三种分离机析出效能数据表样号12345678甲4.03.54.15.54.66.05.14.3乙3.03.03.82.14.95.33.12.7丙3.23.84.33.64.04.94.72.4打开共享文件中的“三种分离机.sav”执行Analyze→CompareMeans→Paired-sampleTtest。弹出Paired-sampleTtest对话窗口,将三个变量“甲机[x]”“乙机[y]”“丙机[z]”变量两两配对,组成三对配对变量放入TestVariables框中。其余均采用默认。PairedSamplesStatistics4.6388.8383.29643.48881.1051.39074.6388.8383.29643.8628.8141.28783.48881.1051.39073.8628.8141.2878甲机乙机Pair1甲机丙机Pair2乙机丙机Pair3MeanNStd.DeviationStd.ErrorMean配对样本统计量表PairedSamplesCorrelations8.309.4568.486.2228.596.119甲机&乙机Pair1甲机&丙机Pair2乙机&丙机Pair3NCorrelationSig.对于甲机与乙机的相关系数r=0.309,p=0.4560.05,可认为两配对变量无相关关系。甲机与丙机的相关系数r=0.486,p=0.2220.05,可认为两配对变量无相关关系。乙机与丙机的相关系数r=0.596,p=0.1190.05,也可认为两配对变量无相关关系。PairedSamplesTest1.1501.1625.4110.1782.1222.7987.027.775.8379.2963.0741.4762.6167.035-.375.9004.3183-1.128.378-1.1787.277甲机-乙机Pair1甲机-丙机Pair2乙机-丙机Pair3MeanStd.DeviationStd.ErrorMeanLowerUpper95%ConfidenceIntervaloftheDifferencePairedDifferencestdfSig.(2-tailed)对于甲机与乙机,p=0.0270.05,故可认为甲机与乙机之间有明显差异。对于甲机与丙机p=0.0350.05,也可认为甲机与丙机之间有明显差异。对于乙机与丙机p=0.2770.05,可认为乙机与丙机之间没有明显差异。上次内容上一章我们用了两均值之差的T检验,比较两独立样本的总体均值的差。但如果要比较的样本的组数超过两个,就显得十分繁琐。例如组数高达10组,就要进行45次的两两比较。每作一次假设检验,就犯了α水平的错误机会,作45次,显然犯错的机会增加很多。第7章方差分析过程单因素方差分析起源于对多套实验方案的效果的对比分析,可以用来检验多组相关样本之间均值,有无显著差异。例如:s项政策的效果,s个阶层的人对同一问题的评价,政策作用的s个评价程度与对应的效果,s组人员的工资水平,s种同功能药品的效果,s种训练方法的训练效果,s种饲料的作用,s台设备的故障率,s种工艺的效果,s种材料的强度等等,有无显著差异,都可以用单因素方差分析来解决。方差分析的两个基本假设前提观测变量各总体服从正态分布观测变量各总体方差应该相同基于上述两个基本假设,方差分析对各个总体是否有显著差异的推断就转化为各总体均值是否存在显著差异的推断了.方差分析分类(按照控制变量分)单因素方差分析多因素方差分析协方差分析7.1单因素方差分析用来分析一个控制变量的不同水平是否对观测变量产生了显著影响。由于仅研究单个因素,所以称为单因素方差分析表中,ni表示方案i的实验个数设有s个方案,Xij是各个方案的效果。μi表示方案i的平均效果。问;怎样判断这s个方案的效果,是否有显著区别?实际上是检验多个总体的均值是否相同的假设:H0:μ1=μ2=…=μs?实验效果方案1X11X12……X1n1μ1方案2X21X22……X2n2μ2………………方案sXs1Xs2……xsnsμs方差分析的基本思想第一步:明确观测变量和控制变量第二步:剖析观测变量的方差观测变量值的变动会受到控制变量和随机变量两方面的影响。据此,单因素方差分析将观测变量总的离差平方和分解为:组间离差平方和(BetweenGroups)组内离差平方和(WithinGroups)数学表述SST=SSA+SSE其中,SST为观测变量总离差平方和;SSA为组间离差平方和,是由控制变量不同水平造成的变差;SSE为组内离差平方和,是由抽样误差引起的变差。观测变量总的离差平方和k为控制变量的水平数;为控制变量第i水平下第j个样本值;为控制变量第i个水平下的样本个数;为观测变量均值。ijxinx211kinjijixxSST组间离差平方和其中,为控制变量第i水平下观测变量的样本均值。可见,组间离差平方和是各水平组均值与总均值离差的平方和,反映了控制变量不同水平对观测变量的影响。ix21xxnSSAikii组内离差平方和组内离差平方和是每个样本数据与本水平组均值离差的平方和,反映了抽样误差。211kinjiijjxxSSE第三步:比较观测变量总离差平方和各部分的比例通过比较观测变量总离差平方和各部分所占的比例,推断控制变量是否给观测变量带来了显著影响;在观测变量总离差平方和中,如果组间离差平方所占比例较大,则说明观测变量的变动主要是由控制变量引起的,可以主要由控制变量来解释,控制变量给观测变量带来了显著影响;如果组间离差平方所占比例较小,则说明观测变量的变动不是主要由控制变量引起的,观测变量值的变动是由随机变量影响的。单因素方差基本分析步骤为抽样误差。对实验结果产生的影响为控制变量ijiA,2,1,2,1(earjkieamxiijiij单因素方差分析的数学模型i=1,2,…………,kj=1,2,…………,r第一步:提出零假设P146iaiA单因素方差分析的零假设:控制变量不同水平下观测变量各总体的均值无差异,控制变量不同水平下的效应同时为0,记为:意味着控制变量的水平没有对观测变量产生显著影响。是控制变量对试验结果产生的附加影响。iaiAa1=a2=……=ak=0第二步:选择统计检验量/(1)/()SSAkMSAFSSEnkMSE-==-方差分析采用的检验统计量是F统计量,数学定义为MSA是平均组间平方和,MSE是平均组内平方和第三步:计算检验统计量的观测值和概率p值由SPSS自动完成。第四步:给出显著性水平α,并作出决策如果pα,则应拒绝零假设,认为控制变量不同水平下观测变量各总体的均值存在显著差异,控制变量的各个效应不同时为0,控制变量的不同水平对观测变量产生了显著影响;反之,如果pα,则不应拒绝零假设,认为控制变量不同水平下观测变量各总体的均值无显著差异,控制变量的各个效应同时为0,控制变量的不同水平对观测变量没有产生显著影响。单因素方差分析操作过程1.首先用系统默认值进行单因素方差分析;2.再通过设置选择项进行单因素方差分析。一.按照系统默认的选项作单因素方差分析例题1某灯泡厂使用4种不同材料的灯丝生产了4批灯泡,在每批灯泡中随机抽取若干只观测它们的寿命(单位:千小时),观测数据如表10-1所示。问这4种灯丝生产的灯泡的使用寿命有无显著差异?10-1灯泡样本寿命观测值表灯泡灯丝12345678甲1.601.611.651.681.701.721.80乙1.581.641.641.701.75丙1.461.551.601.621.641.661.741.82丁1.511.521.531.571.601.68方差分析的基本思想:1.同一种灯丝,样本的观测值不同。(随机误差)2.在不同种类灯丝,各观测值也不同。(随机误差或不同水平造成误差)3.误差水平用平方和来表示。有组间误差和组内误差。4.分析误差来源,判断灯丝材料不同对寿命是否有影响,也就是检验灯丝寿命存在差异的原因。如果这种差异主要是系统误差,即灯丝的不同材料对灯丝寿命有影响,在方差分析的前提条件下,这个问题实际上就是检验不同种类灯丝的平均寿命是否相等的问题。5.根据统计学原理,组间均方和组内均方的比值构成F分布。给定显著性水平,通过和F统计量的相伴概率值比较,推断出总体均值是否存在显著性差异。首先用系统默认值进行单因素方差分析1)建立适合于单因素方差分析过程的数据文件。(文件夹中例7.1.2(LampLife).sav)进行方差分析时数据的组织形式的特点:定义两个变量(1)观测变量值(2)控制变量水平值比较表10-1与SPSS数据文件7.1.2(LampLife).sav中的数据排列有何不同?打开数据文件例7.1.2(LampLife).sav把“寿命”作为一个变量排成一列,“灯丝”作为另一个变量排成另一列。它的作用是对“寿命”分组。点击Analyze→CompareMeans→One-wayANOVA,把“Life”送入Dependentlist框中,把“Filament”送入Factor(因素变量)框中。ANOVA灯泡寿命(千小时).0443.0152.149.123.15122.007.19625BetweenGroupsWithinGroupsTotalSumofSquaresdfMeanSquareFSig.使用系统默认值的灯泡寿命方差分析表此列为方差来源。说明是来源于组内的,还是组间的。此列为离差平方和。第一行是组间的离差平方和SSA,第二行是组内离差平方和SSE自由度:组间的自由度(s-1=3),组内自由度为(n-s=22)方差(离差平方和除以相应的自由度,离差平方和的均值)F观测值对应的概率P=0.1230.05,所以,接受假设H0。即可以认为使用4种灯丝生产的灯泡的平均寿命无显著性差异。统计量F的观测值:组间方差与组内方差的之比课堂练习见方差分析课堂作业1,2但是以上结果只是说明,总的说来四组灯丝材料生产的灯泡平均寿命没有显著差异,但并不说明任何两两不同种灯丝生产的灯泡的组间平均寿命差异情况。如果要了解具体哪两个组平均寿命有差异,需要再使用One-WayANOVA进行单因素方差分析时使用选择项。单因素方差分析的进一步分析方差齐性检验方差齐性检验是对控制变量不同水平下各观测变量总体方差是否相等进行分析。方差齐性检验采用了方差同质性(HomogeneityofVariance)的检验方法零假设:各水平下观测变量总体方差无显著差异多重比较检验单因素方差分析的基本分析只能判断控制变量是否对观测变量产生了显著影响。进一步还应确定,控制变量的不同水平对观测变量的影响程度如何,其中哪个水平的作用明显不同于其他水平,哪个水平的作用是不显著的等。上一章我们用了两平均数之差的T检验,比较两独立样本的总体平均数的差。但如果要比较的样本的组数超过两个,就显得十分繁琐。例如组数高达10组,就要进行45次的两两比较。除此而外,每作一次假设检验,就犯了α水平的错误机会,作45次,显然犯错的机会增加很多。因此,并不鼓励这么做。多重比较检验的零假设相应水平下观测变量的均值间不存在显著差异构造检验统计量P150它们有的适用于各总体方差相等的条件;有些则适用方差不等的条件。重点掌握LSD方法其他检验p153先验对比检验能够更精确地掌握各水平间或各相似性子集间均值的差异程度。趋势检验分析随着控制变量水平的变化,观测变量值变化的总体趋势是怎样的,是呈线性变化趋势,还是呈二次、三次等多项式变化。二.单因素方差分析选择项设置例题:为了评价不同行业的服务质量,消费者协会分别在零售业、旅游业、航空公司、家电制造