当比较的平均值的数目K≥3时,不能直接应用t测验或u测验的两两之间的假设测验方法1、当有k个处理平均数时,将有个差数,要对这诸多差数逐一进行检验,程序繁琐。2、试验误差估计的精确度降低。3、两两测验的方法会随着K的增加而大大增加犯I型错误的概率。第八章单因素方差分析Chapter8:One-factorAnalysisofVariance(One-WayANOVA)KC2第八章单因素方差分析方差分析:从总体上判断多组数据平均数(K≥3)之间的差异是否显著方差分析将全部数据看成是一个整体,分析构成变量的变异原因,进而计算不同变异来源的总体方差的估值。然后进行F测验,判断各样本的总体平均数是否有显著差异。若差异显著,再对平均数进行两两之间的比较。(byRAFisher)Chapter8:One-factorAnalysisofVariance品系IIIIIIIVV164.664.567.871.869.2265.365.366.372.168.2364.864.667.170.069.8466.063.766.869.168.3565.863.968.571.067.5和326.5322.0336.5354.0343.0平均数65.364.467.370.868.6例调查5个不同小麦品系株高是否差异显著•因变量(响应变量):连续型的数值变量株高•因素(Factor):影响因变量变化的客观条件•一个因素:“品系”单因素方差分析•水平(Level):因素的不同等级不同“处理”•五个水平:品系I-V•重复(Repeat):在特定因素水平下的独立试验•五次重复单因素方差分析的数据形式X因素的a个不同水平(处理)每个处理下n个重复11,,1,2,,niijiijxxxxian111,anijijxxxxan方差分析原理线性统计模型:模型中的xij是在第i次处理下的第j次观测值。μ是总平均数。αi是对应于第i次处理的一个参数,称为第i次处理效应(treatmenteffect)。εij是随机误差,是服从N(0,σ2)的独立随机变量。,,,,,,ijiiji12axj12n方差分析原理固定因素:①因素的a个水平是人为特意选择的。②方差分析所得结论只适用于所选定的a个水平。固定效应模型:处理固定因素所使用的模型。随机因素:①因素的a个水平是从水平总体中随机抽取的。②从随机因素的a个水平所得到的结论,可推广到该因素的所有水平上。随机效应模型:处理随机因素所使用的模型。固定效应模型其中αi是处理平均数与总平均数的离差,因这些离差的正负值相抵,因此如果不存在处理效应,各αi都应当等于0,否则至少有一个αi≠0。因此,零假设为:H0:α1=α2=…=αa=0备择假设为:HA:αi≠0(至少有一个i),,,,,,ijiiji12axj12nnii10固定效应模型平方和与自由度的分解22ananijijiii1j1i1j12ananan2ijiijiiii1j1i1j1i1j1xxxxxxxx2xxxxxxananijiiiijii1j1i1j1xxxxxxxx02anaan22ijiijii1j1i1i1j1xxnxxxx固定效应模型2anaan22ijiijii1j1i1i1j1xxnxxxxTSSeSSASS=+平方和的分割总平方和处理平方和误差平方和TdfAdfedf=+1an1aana自由度的分割总自由度处理自由度误差自由度/AAAMSSSdf/eeeMSSSdf处理均方误差均方固定效应模型单因素固定效应模型的方差分析表处理效应对均方的贡献固定效应模型方差分析统计量:,AeAdfdfeMSFMS若零假设成立,不存在处理效应,则组内变异和组间变异都只反映随机误差()的大小,此时处理均方()和误差均方()大小相当,F值则接近1,各组均数间的差异没有统计学意义;反之,如果存在处理效应,则处理变异不仅包含随机误差,还有处理效应引起的变异(),此时F值显著大于1,各组均数间的差异有统计学意义。故依据F值的大小可判断各组之间平均数有无显著差别。2AMSeMS2an固定效应模型平方和的简易计算2anan22Tijiji1j1i1j12aa22Aiii1i1xSSxxxnax1SSnxxxnna2xCnaC称为校正项。误差平方和SSe=SST-SSA减少计算误差利于编程品系IIIIIIIVV164.664.567.871.869.2265.365.366.372.168.2364.864.667.170.069.8466.063.766.869.168.3565.863.968.571.067.5和326.5322.0336.5354.0343.0平均数65.364.467.370.868.6例调查5个不同小麦品系株高,结果见下表:..........22an2Tiji1j1a2Aii1eTAx1682C11316496na55SSxC113312281131649614732156648355SSxC1131649613174n5SSSSSS14732131741558F4,20,0.05=2.87,F4,20,0.01=4.43。FF0.01,P0.01。因此,上述5个小麦品系的株高差异极显著。方差分析表:...;:()012aAiH0H0i至少有一随机效应模型,,,,,,ijiiji12axj12n其中处理效应αi为随机变量,服从μ=0的独立正态分布,其方差为在随机效应模型中,对单个αi的检验是无意义。若假设不存在处理效应,则αi的方差为零,即零假设为:备择假设为:2:20H0:2AH0随机效应模型单因素随机效应模型的方差分析表随机效应与固定效应的方差分析的比较①程序相同;②获得数据的方式不同;假设不同;均方期望不同;适用范围不同。方差分析应具备的条件1、可加性(Addictivity):各处理效应与误差效应是可加的。ananijiiiijii1j1i1j1xxxxxxxx0TSSeSSASS=+平方和的分割总平方和处理平方和误差平方和处理项与随机误差项的交叉乘积和=0方差分析应具备的条件2、正态性(Normality):ε:NID(0,σ2)应该是随机的、彼此独立的,服从正态分布。正态性不满足:但处理的误差趋向于处理平均数的函数关系。例如,二项分布数据,平均数期望为φ,方差期望为φ(1-φ)/n,方差与平均数有函数关系。如果这种函数关系是已知的,则可对观察值进行反正弦转换或对数转换、平方根值转换,从而使误差转化成近似的正态分布。方差分析应具备的条件3、方差齐性(Homogeneity):方差分析中的误差项方差是将各处理的误差合并而获得一个共同的误差方差,因此必须假定资料中有这样一个共同的方差σ2存在(Bartlett检验法)如果各处理的误差方差不齐,则在假设测验中处理效应得不到正确的反映。,(,)2ijiijijx0单因素方差分析的SPSS实现例8.1:小麦株高与品系的关系研究-单因素固定模型的方差分析SPSSone-wayANOVAoutputANOVA株高131.740432.93542.279.00015.58020.779147.32024BetweenGroupsWithinGroupsTotalSumofSquaresdfMeanSquareFSig.单因素方差分析的SPSS实现F4,20=42.279,P≈0.0000.01。因此,上述5个小麦品系的株高差异极显著。BetweenGroups:处理间WithinGroups:处理内多重比较当方差分析拒绝H0,为探究具体是在哪些组对之间存在显著差异,须对各处理平均数之间进行逐对比较,即多重比较(multiplecomparison)—post-ANOVAanalysis(PostHoctest)。如何进行多重比较?逐对进行双样本的平均数差的t-检验?增大了犯I型错误的概率,不可取多重比较方法:最小显著差数(LSD)检验Student-Newman-Keuls(SNK)q检验Duncan检验Dunnettt检验Tukey检验…多重比较多重比较最小显著差数法(Fisher’sLeastsignificantdifferencetest,LSD)是t检验的变形,在变异和自由度的计算上利用了整个样本信息,而不仅仅是所比较两组的信息。检验的敏感度最高,倾向于得出差异显著的结论,在比较时仍然存在放大1型错误的问题。多重比较最小显著差数法(LSD),121212exx12xxxx11tsMSsnn12exxtdfana2MSn..e120050052MSxxtLSDn12nn当时,当差异显著时,当差异不显著时,.12005xxLSD多重比较-Duncanmultiplerangetest***梯形列表法显示结果多重比较的SPSS实现例8.1:小麦株高与品系的关系研究-多重比较PostHocTest多重比较的SPSS实现SPSSDuncan’stestoutput(1)结果的解读:除品系1、2之间外,其它各品系间均存在显著差异。多重比较的SPSS实现SPSSDuncan’stestoutput(2)结果的解读:除品系1、2及3、5之间外,其它各品系间均存在极显著差异。科学论文中多重比较实例字母标记法显示结果各平均数间,凡有一个相同标记字母的即为差异不显著,没有相同标记字母的即为差异显著。字母大写表示极显著水平(α=0.01),小写表示显著水平(α=0.05)试用字母标记法表示如下多重比较的结果:结论:处理1、4,3、4,2、3之间差异极显著ABC处理均值差异显著性(α=0.01)118.00BC223.00AB314.00C429.00A