方差分析基本原理

整理文档很辛苦,赏杯茶钱您下走!

免费阅读已结束,点击下载阅读编辑剩下 ...

阅读已结束,您可以下载文档离线阅读编辑

资源描述

一、线性模型与基本假定假设某单因素试验有k个处理,n次重复,完全随机设计,则共有nk个观察值,其数据结构和符号如表5-1所示。xij可以表示为ijiijx第一节方差分析的基本原理与步骤iji其中,为第i个处理观测值总体平均数;为试验误差、相互独立、且服从正态分布N(0,σ2)。若令kiik11ii则(5-1)式可以改写为ijiijx(5-4)其中,μ为全试验观测值总体平均数;i是第i个处理的效应,表示处理i对试验结果产生的影响。显然有01kii(5-4)式叫做单因素完全随机设计试验资料的数学模型。表示为总平均数μ、处理效应αi、试验误差εij之和。由εij相互独立且服从正态分布N(0,σ2),可知各处理Ai(i=1,2,…,k)所属总体亦应具正态性,即服从正态分布N(μi,σ2)。尽管各总体的均数可以不等或相等,σ2则必须是相等的。ijx所以,单因素完全随机设计试验资料的数学模型可归纳为:效应的可加性(additivity)分布的正态性(normality)方差的一致性(homogeneity)二、平方和与自由度的分解在方差分析中用样本方差即均方来度量资料的变异程度。在表5-1中,度量全部观测值总变异的总均方分解为度量处理间变异的处理间均方和度量处理内变异的处理内均方两部分。统计学上,这种分解是通过将总均方的分子──称为总离均差平方和,简称为总平方和,分解为处理间平方和与处理内平方和两部分;将总均方的分母──称为总自由度,分解为处理间自由度与处理内自由度两部分来实现的。(一)总平方和的分解在表5-1中,反映全部观测值总变异的总平方和是各观测值xij与总平均数的离均差平方和,记为SST。即..x211()knTijijSSxx因为221111()()()knknijiijiijijxxxxxx其中1()0nijijxx2211()2()()()kniiijiijiijxxxxxxxx2211111()2[()()]()kknkniiijiijiiijijnxxxxxxxx所以22211111()()()knkknijiijiijiijxxnxxxx21()kiinxxixx式中,为各处理平均数与总平均数的离均差平方和与重复数n的乘积,反映了重复n次的处理间变异,称为处理间平方和,记为SSt,即21()ktiiSSnxx211()knijiijxx为各处理内离均差平方和之和,反映了各处理内的变异即误差,称为处理内平方和或误差平方和,记为SSe,即211()kneijiijSSxx于是有SST=SSt+SSe3种平方和的简便计算公式211ktiiSSxCntTeSSSSSS2/Cxkn矫正数211knTijijSSxC(二)总自由度的分解()ijxx11()0knijijxx在计算总平方和时,资料中kn个观测值的离均差要受这一条件的约束,故总自由度等于资料中观测值的总个数减一,即kn-1。总自由度记为dfT,dfT=kn-1。()ixx1()0kiixx在计算处理间平方和时,k个处理均数的离均差要受这一条件的约束,故处理间自由度为处理数减一,即k-1。处理间自由度记为dft,dft=k-1()ijixx1()0nijijxx在计算处理内平方和时,kn个离均差要受k个条件的约束,即故处理内自由度为资料中观测值的总个数减k,即kn-k。处理内自由度记为dfedfe=kn-k=k(n-1)(i=1,2,…,k)1(1)()(1)(1)nkknkkkknetTdfdfdf因为所以tTetTdfdfdfkdfkndf11eeetttTTTdfSSMSdfSSMSdfSSMS,,2TS2tS2eS各项平方和除以各自的自由度便得到总均方、处理间均方和处理内均方,分别记为MST(或)、MSt(或)和MSe(或),即【例5-1】有一水稻施肥的盆栽试验,设置了5个处理:A1和A2分别施用两种不同工艺流程的氨水,A3施碳酸氢铵,A4施尿素,A5不施氮肥。每个处理各4盆(施氮处理的施肥量每盆皆为折合纯氮1.2克),共有5×4=20盆,随机置于同一盆栽场。其稻谷产量(g/盆)列于表5-2。各项平方和与自由度计算如下2252613833.845xCnk22222210898114126805301.2itxSSCCn402.2301.2101.0eTtSSSSSS2222243021402.2TijSSxCC301.275.304101.06.7315ttteeeSSMSdfSSMSdf120119Tdfnk1514tdfk19415eTtdfdfdf方差分析就是通过MSt与MSe的比较来推断是否为零即是否相等。i2三、F检验22211()011kkiiiikk相当于μ1=μ2=…=μk统计学已证明,在的条件下,服从自由度df1=k-1与df2=k(n-1)的F分布。即12(,)12~1,(1)tdfdfeMSFMSdfkdfkn20etMSMS),(05.021dfdfF20若实际计算的F值大于,则F值在α=0.05的水平上显著,我们以95%的可靠性(即冒5%的风险)推断MSt代表的总体方差大于MSe代表的总体方差,即这种用F值出现概率的大小推断一个总体方差是否大于另一个总体方差的方法称为F检验(F-test)。2210:01kiiHk对于单因素完全随机设计试验资料的方差分析:无效假设H0:μ1=μ2=…=μk备择假设HA:各μi不全相等或F=MSt/MSe,也就是要判断处理间均方是否显著大于处理内(误差)均方。221:01kiiAHk),(05.021dfdfF),(01.021dfdfF实际进行F检验时,是将由试验资料所算得的F值与根据df1=dft(大均方即分子均方的自由度)、df2=dfe(小均方即分母均方的自由度)查附表4所得的临界F值,相比较作出统计推断。),(05.021dfdfF20若F<,即p>0.05,不能否定统计学上,把这一检验结果表述为:各处理间差异不显著或简述为F值不显著,在F值的右上方标记“ns”,或不标记符号;H0:),(05.021dfdfF),(01.021dfdfF2020若≤F<即0.01<p≤0.05,否定H0:接受HA:统计学上,把这一检验结果表述为:各处理间差异显著或简述为F值显著,在F值的右上方标记“*”;),(01.021dfdfF2020若F≥,即p≤0.01,否定H0:,接受HA:统计学上,把这一检验结果表述为:各处理间差异极显著或简述为F值极显著,在F值的右上方标记“**”。对于【例5·1】,因为75.3011.19**6.73teMSFMS根据df1=dft=4,df2=dfe=15查附表4,得F0.01(4,15)=4.89,因为F>F0.01(4,15),即p<0.01,表明五种不同施肥处理的稻谷产量差异极显著,施肥处理不同,产量亦不同。表5-3表5-2资料方差分析表变异来源SSdfMSF值处理间301.2475.3011.19**处理内101.0156.73总变异402.219四、多重比较F值显著或极显著,否定无效假设HO,表明试验中各处理平均数间存在显著或极显著差异,但并不意味着每两个处理平均数间的差异都显著或极显著的,也不能具体说明哪些处理平均数间有显著或极显著差异,哪些差异不显著。下一张主页退出上一张有必要进行两两处理平均数间的比较,以具体判断两两处理平均数间的差异显著性。统计学上把多个平均数两两间的相互比较称为多重比较。多重比较的方法很多,常用的有最小显著差数法(LSD法)和最小显著极差法(LSR法)。此法的基本作法是:在F检验显著的前提下,先计算出显著水平为α的最小显著差数,然后将任意两个处理平均数的差数的绝对值与其比较:LSDjixx下一张主页退出上一张(一)最小显著差数法(LSD法)若>LSDα,则与在α水平上差异显著;反之,则在α水平上差异不显著。最小显著差数由下式计算:式中:为在F检验中误差自由度下,显著水平为α的临界t值,为均数差数标准误,jixxixjxjiexxdfaaStLSD)()(edftjixxSnMSSexxji/2下一张主页退出上一张其中为F检验中的误差均方,n为各处理的重复数。当显著水平α=0.05和0.01时,从t值表中查出和,得:利用LSD法进行多重比较时,可按如下步骤进行:eMS)(05.0edft)(01.0edftjiejiexxdfxxdfStLSDStLSD)(01.001.0)(05.005.0(2)计算最小显著差数和;(3)将平均数多重比较表中两两平均数的差数与、比较,作出统计推断。05.0LSD01.0LSD05.0LSD01.0LSD下一张主页退出上一张(1)列出平均数多重比较表比较表中各处理按其平均数从大到小自上而下排列;对于【例5-1】,多重比较如表5-4所示。6.73,15,4eeMSdfn226.731.83444ijexxMSSn0.050.05(15)2.1311.84333.9091ijxxLSDtS0.010.01(15)2.9471.84335.4060ijxxLSDtS0.05(15)0.01(15)2.131,2.947tt检验结果:差数2.5、1.5、3.0不显著;差数4.5、4.0、4.5显著;差数7.0、8.5、7.0和11.5极显著。表明:施尿素的稻谷平均产量极显著高于对照和施氨水2、显著高于施氨水1;施碳酸氢铵的稻谷平均产量极显著高于对照、显著高于施氨水2;施氨水1的稻谷平均产量极显著高于对照;施氨水2的稻谷平均产量显著高于对照;施尿素与施碳酸氢铵、施碳酸氢铵与施氨水1、施氨水1与施氨水2的稻谷平均产量差异不显著;以施尿素的稻谷产量最高。(二)最小显著极差法(LSR法)LSR法的特点是把平均数的差数看成是平均数的极差,根据极差范围内所包含的处理数(称为秩次距)k的不同而采用不同的检验尺度,以克服LSD法的不足。这些在显著水平α上依秩次距k的不同而采用的不同的检验尺度叫做最小显著极差(LSR)。因为LSR法是一种极差检验法,所以当一个平均数大集合的极差不显著时,其中所包含的各个较小集合极差也应一概作不显著处理。常用的LSR法有q检验法和新复极差法两种。1、q检验法此法是以统计量q的概率分布为基础的。q值由下式求得:/xqwS式中,w为极差,为标准误,分布依赖于误差自由度dfe及秩次距k。利用q检验法进行多重比较时,为了简便起见,不是将算出的q值与临界q值比较,而是将极差与比较,从而作出统计推断。为α水平上的最小显著极差:nMSSex/),(kdfaeqxkdfaSqe),(xkdfaSqe),(下一张主页退出上一张,(,)ekadfkxLSRqS(1)列出平均数多重比较表;(2)由自由度dfe、秩次距k查临界q值,计算最小显著极差LSR0.05,k,LSR0.01,k;(3)将平均数多重比较表中的各极差与相应的最小显著极差LSR0.05,k,LSR0.01,k比较,作出统计推断。下一张主页退出上一张对于【例5-1】,各处理平均数多重比较表见表5-5(同表5-4)。前已述及,在表5-5(即表5-4)中,极差4.5、3.0、1.5和3.0的秩次距为2;极差7.0、4.0和4.5的秩次距为3;极差8.5和7.0的秩次距为4;极差11.5的秩次距为5。查附表7,得df=15时

1 / 53
下载文档,编辑使用

©2015-2020 m.777doc.com 三七文档.

备案号:鲁ICP备2024069028号-1 客服联系 QQ:2149211541

×
保存成功