方差分析spss过程

整理文档很辛苦,赏杯茶钱您下走!

免费阅读已结束,点击下载阅读编辑剩下 ...

阅读已结束,您可以下载文档离线阅读编辑

资源描述

1随机从三个班级分别抽取5名同学参加数学竞赛,得分如下,问这三个班级同学在“数学竞赛得分”上有没有显著的差异?第五节SPSS方差分析过程2方差分析基本概念方差分析:从分解数据差异来源入手,检验两个以上总体均数是否相等或是否具有差异的方法。可用于寻找关键性的影响因素,分析影响因素的不同水平及其组合是如何影响观测变量的。观测变量:方差分析的因变量,即进行差异分析的数值型变量。控制变量:方差分析中的影响因素,分组变量、自变量。其不同类别,称为控制变量的不同水平。3如何分解数据差异?实习一的思考题:分组NMeanSD甲20788乙307210合计50??4方差分析的思路分解离均差平方和:SST=SSA+SSE分解自由度:n-1=(k-1)+(n-k)注:n=kl比较组间方差与组内方差有无异同:如果组间方差显著大于组内方差,超过F统计量的界值,则不能认为各组所代表的总体均数相同,只能认为三个班级的得分有显著差异。MSEMSAknSSEkSSAF)/()1/(211211211211)()()]()[()(kiljikiljiijkiljiiijkiljijxxxxxxxxxx5方差分析表ANOVAANOVASCORE40.000220.00030.000.0008.00012.66748.00014BetweenGroupsWithinGroupsTotalSumofSquaresdfMeanSquareFSig.组间方差MS离均差平方和SS差异来源组内自由度P0.05,显示三个班级竞赛得分有显著差异F值P值6与其他统计过程的联系方差分析常用于均数比较,研究控制因素(定性)与观测变量(定量)间的关系。与t检验:方差分析是检验多个总体的均值间差异是否具有统计意义的一种方法,比较时是通过分解方差进行分析的。与回归分析:方差分析是回归分析的一种特例,可以用回归模型来表示。7内容单因素方差分析多因素方差分析协方差分析8一、单因素方差分析拟研究:一个控制因素是否对一个观测变量有影响。即控制因素不同水平下观测变量均值是否有差异;多个总体间的均值比较问题。前提条件:各样本彼此独立各总体的方差相等观测变量各总体应服从正态分布9统计思想:观测变量的总方差可分解为组间方差和组内方差,前者反映控制因素的影响,后者体现随机误差,如果前者显著大于后者,则可认为控制因素对观测值有影响。分析步骤:明确控制因素和观测变量剖析观测变量的离均差平方和:SST=SSA+SSE分解自由度比较组间和组内的方差大小,根据F分布界值做出统计结论。10数学模型)0;,...,2,1;,...,2,1(1kiiijiijiiijiijarjkiaxax组别i观测值j11假设检验基本步骤提出假设H0:a1=a2=…=ak=0确定显著性水平α构造检验统计量并计算统计结论与结果解释MSEMSAknSSEkSSAF)/()1/(12SPSS单因素方差分析过程操作Analyze--CompareMeans--OneWayANOVA研究不同的广告形式是否对销售额有影响?13ANOVA销售额5866.08331955.36113.483.00020303.22140145.02326169.31143BetweenGroupsWithinGroupsTotalSumofSquaresdfMeanSquareFSig.说明广告形式不同对销售额有影响。14单因素方差分析的进一步分析多重比较检验:判断控制因素确有作用后,进一步确定控制因素不同水平对观测变量的影响程度,即各水平下观测变量的均值两两比较。为何不用t检验:弃真错误α的概率增大15多重比较方法LSD:LeastSignificantDifference,最小显著差法,检验统计量t服从n-k个自由度的t分布,并未对犯Ⅰ类错误的概率予以限制。是t检验的变形,只是在变异和自由度的计算上利用了整个样本信息。Bonferroni方法:是对LSD法的校正,将α除以两两检验的总次数N(α/N),使犯Ⅰ类错误的概率缩小N分之一。)11()()(jiiinnMSExxtjj16Tukey法:q检验,计算统计量q,服从(k,n-k)个自由度的q分布。适用于各水平样本量相等的情形,对犯Ⅰ类错误的最大试验误差率予以了控制。检验功效高于BON、SIDAK、Scheffe方法。Scheffe方法:采用S统计量,服从(k-1,n-k)个自由度的S分布。当各水平个案数不相等,或者想进行复杂的比较时用此法,结果与方差分析相容。但它相对比较保守。SNK:划分相似子集,适用于各水平样本量相等的情形。是运用最广泛的一种两两比较方法。它采用StudentRange分布进行所有各组均值间的配对比较。该方法保证在H0真正成立时总的α水准等于实际设定值,即控制了完全无效假设下的试验误差率。17Sidak法:依据Sidak不等式调整各组均值,对均值进行配对t检验。CER=1-(1-α)1/NDunnett:指定对照组,其他组均与对照组比较的两两比较法。可选择双尾或单尾检验18多重比较方法的选择策略尊重相关研究领域的统计惯例。如果存在明确的对照组,要进行的是验证性研究,即计划好的某两个或几个组间(和对照组)的比较,宜用Bonferroni(LSD)法若需要进行的是多个均数间的两两比较(探索性研究),且各组个案数相等,适宜用Tukey法;SNK也很常用。其它情况宜用Scheffe法。19其他检验先验对比检验:事先确定各均值的系数(∑Ci=0),对相似性子集进行差异比较的方法。趋势检验:当控制因素的不同水平为有序水平时,分析随着控制因素水平的等级变化,观测变量的变化趋势。方差齐性检验:Homogeneityofvariance,对多组数据的方差进行齐性检验。20SPSS单因素方差分析的其他选项Options选项:方差齐性检验;输出其他相关统计量;对缺失值的处理PostHoc选项:多重比较检验,提供了18种方法。Contrasts选项:先验对比检验和趋势检验。21222324例子:广告、城市与销售额控制因素:广告形式:报纸、广播、宣传品、体验城市:按照人口密度从高到低排列的18个城市观测变量:销售额,具体数值型变量分析要求:1.分析不同的广告形式对销售额是否有影响?2.分析不同的城市对销售额是否有影响?3.对城市与销售额的关系进行趋势检验。4.研究报纸的效果与广播、体验的两组的平均效果是否有差异?二、多因素方差分析26研究内容与前提条件拟研究:两个及以上控制因素对观测变量的影响,包括各因素的独立作用和交互作用。是实验设计的常用分析方法,常用于寻找最佳的实验因素组合。前提条件:同单因素方差分析,要求每一单元格的样本数据符合独立性、正态性及方差齐性。但对正态性和方差齐性的要求不严格。只要无极端值,前提条件稍有偏离是可以耐受的。单元格无重复数据时,不要求正态性及方差齐性。27双因子方差分析的数据结构28利用下表资料分析研究不同地区和不同时间对农民家庭人均纯收入(元)的影响29分析步骤确定观测变量和若干个控制变量剖析观测变量的离均差平方和SST控制变量的独立作用SSA、SSB控制变量的交互作用SSAB随机因素的影响SSESST=SSA+SSB+SSAB+SSE分解自由度比较各部分方差的大小30双因子方差分析数学模型设因素A有r个水平,因素B有s个水平,在每个单元格内有l个样本,则在因素A的Ai水平和因素B的Bj水平下的第k个样本值xijk,可定义为:0)()(00)(,),...,2,1;,...,2,1;,...,2,1()(1111risjijijsjjriijiijijjjiiijkijjiijkababbaxxxabxbxalksjriabbax,,且,,其中,31双因子(有交互作用)方差分析表32相关概念饱和模型(FullFactorial):即全因素模型,方差分析模型中包含所有因素的独立作用和可能的交互作用。不饱和模型:非全因素模型。主效应:控制变量的独立作用。交互效应:控制变量之间的相互作用,如果一个因素的效应大小在另一因素不同水平下明显不同,则二者存在交互效应。33交互作用25710024681012A1A2B1B22576012345678A1A2B1B2A、B无交互作用A、B有交互作用34固定效应与随机效应固定效应:考察因素的水平数是可控的,在研究中对该因素的所有可能水平都进行了考察,不需要进一步外推,如性别。因素的效应是固定。随机效应:考察因素难以控制在固定的水平上,或因素的所有可能水平并未都出现在样本中。因此要用样本来推论总体情况,包括未出现的水平。这不可避免的存在误差(即随机效应),需要估计该误差的大小,因而其效应具有随机性。如家庭。35基本步骤提出假设H0:各控制变量不同水平下观测变量各总体的均值无统计学差异。确定显著性水平α构造模型、并计算检验统计量固定效应模型(Fixedfactor)MSEMSABlrsSSEsrSSABFMSEMSBlrsSSEsSSBFMSEMSAlrsSSErSSAFABBA)1(/)1)(1/()1(/)1/()1(/)1/(36随机效应模型(Randomfactor):统计结论与结果解释MSEMSABlrsSSEsrSSABFMSABMSBsrSSABsSSBFMSABMSAsrSSABrSSAFABBA)1(/)1)(1/()1)(1/()1/()1)(1/()1/(37SPSS多因素方差分析过程(GLM)操作Analyze-GeneralLinearModel-Univariate,即单变量一般线性模型38TestsofBetween-SubjectsEffectsDependentVariable:销售额20094.306a71283.0183.354.000642936.6941642936.6947619.990.0005866.08331955.36123.175.0009265.30617545.0186.459.0004962.9175197.3121.153.2866075.0007284.375669106.00014426169.306143SourceCorrectedModelInterceptX1X2X1*X2ErrorTotalCorrectedTotalTypeIIISumofSquaresdfMeanSquareFSig.RSquared=.768(AdjustedRSquared=.539)a.饱和模型39多因素方差分析的其他选项不饱和模型的建立(Model)均值检验多重比较检验(PostHoc):两两比较对比检验(Contrast):单样本t检验的思想,检验值可指定:观测变量的均值(Deviation):选择忽略水平第一水平或最后水平的观测变量的均值(Simple)该水平前的所有水平的观测变量的均值(Difference)该水平后的所有水平的观测变量的均值(Helmert)前一水平的观测变量的均值(Repeated)多项式比较(Polynomial)4041TestsofBetween-SubjectsEffectsDependentVariable:销售额15131.389a20756.5698.431.000642936.6941642936.6947164.505.0005866.08331955.36121.789.0009265.30617545.0186.073.00011037.91712389.739669106.00014426169.306143SourceCor

1 / 65
下载文档,编辑使用

©2015-2020 m.777doc.com 三七文档.

备案号:鲁ICP备2024069028号-1 客服联系 QQ:2149211541

×
保存成功