(三)、多重比较F测验是一种整体性质的测验。F值显著,否定了,接受了:,只是表明了试验中各个处理的平均数间存在显著差异。但是,是否各个平均数彼此间都有显著差异?还是仅有一部分平均数间有显著差异,而另一部分平均数间没有显著差异?F测验未曾提供任何信息。为了明确各个平均数彼此间的差异显著性,还需要进一步对两两平均数作相互比较,即多重比较(multiplecomparisons)。当然,如果资料分析至F测验,F值未达显著水准,则说明各个处理平均数间差异不显著,分析至此结束。多重比较的方法很多,但基本上都是从以下两种不同考虑出发的。(1)、以“比较”的错误率作为显著水平的标准(*错误率是多重比较中的概念,与第六章平均数比较时的α错误概念不完全相同,但为避免头绪过多,我们仍用α表示错误率)。比如,以5%的比较错误率作为显著的标准,是指在此标准下,每100次比较将会有5次比较是否定了正确的无效假设。(2)、以“试验”的错误率作为显著水平的标准。比如以5%的试验错误率作为显著的标准,是指在此标准下,每100次试验将会有5次试验至少各有一个比较是否定了正确的无效假设。以上两种标准的差别是相当大的。举例说,如果在同一个正态总体中每次抽出K=7个样本,共抽出100次,则每组样本都有(7×6)/2=21次比较。再假定每组样本都有一个比较否定了正确的无效假设,于是,比较错误率为100/2100=1/21=4.76%。而试验错误率却是100/100=100%。如果规定试验错误率为5%,即在100次试验中仅有五次试验各出现了至少一次比较是否定了正确的,则比较错误率一定大大降低,其最低值是5/2100=0.24%。1.介绍几种常用的多重比较方法。(1)、Fisher氏保护最小显著差数测验法这一方法是R.A.Fisher(1966)提出的,简称PISD法(protectedleastsignificantdifference)。它是以试验错误率保护下的比较错误率为准的。其程序为:在处理间的F测验为显著的前提下,计算出显著水平为α的最小显著差数;任何两个处理平均数的差数(),如果其绝对值,即为差异显著;若,为差异极显著;若,差异不显著,接受。我们知道,在两个样本平均数比较时,t=的|t|值若超过,即为在α水平上显著。如写出其最小显著差数即是:=×。因此将之推广于多个样本平均数的任两个平均数和之间的比较,即有:=×(9.11)而由前述内容可知,当两样本的n相等时,=,在方差分析中,因为自由度增大,此式中的有了更精确的数值。=而,同一试验的误差是一致的,每处理的观察值数目相等时,公式(9.11)中的:=(9.12)并按查出值。例9-2:试以PLSD法对例9-1资料中的四个处理平均数间的差异显著性作出测验。由表9-4已知F=21.9763为极显著,=0.0337=16查表=16时,=2.120=2.921则:=2.120×0.1161=0.2461(kg)=2.291×0.1161=0.3391(kg)这就是说,表9-3中的任意两个平均数,其差值的绝对值如果≥0.2461kg,为在α=0.05水平上显著,如果≥0.3391kg,则为在α=0.01水平上显著(也称极显著)。在将各个差数与比较以确定是否显著时,一般可将各平均数由大至小次序排列,然后以最大的平均数为准,减去最小的,次小的……次大的;以次大的平均数为准,减去最小的,次小的……。将所有比较的差值都计算出来。凡达显著的,在其差数的右上角标“*”号;凡达极显著的,在其差数的右上角标“**”号;不显著的不标“*”号。表9-3资料平均数的多重比较结果见表9-5。表9-5四个甘蓝自交系叶球重量的差异显著性(PLSD)法自交系(kg)-1.122-1.452-1.664差异显著性α=0.05α=0.0112.0400.9180.5880.376aA31.6640.5420.212bB41.4520.330*bBC21.122cC多重比较结果表明,在试验的四个自交系中,除3号和4号自交系的叶球重量没有差异外,其余自交系间均存在显著或极显著差异,且1号自交系的叶球重量最大,2号自交系的最小。PLSD法比较简便,但PLSD法的基本程序仍是t测验,故在发现显著的差数时,犯α错误的概率仍将随着K的增大而增大。但是,由于事先规定它必须在F测验为显著的基础上进行,而F测验的显著水平则是试验错误率,因而对减少PLSD法的α错误是一种有力的保护。(2).邓肯氏(Duncan)新复极差测验法这是D.B.Duncan(1955)提出的一种多重比较方法。这种测验法以比较错误率为准,又叫最短显著极差法,简记作SSR(shortestsignificantranges)或叫最小显著极差法,记作LSR(leastsignificantranges)。其特点是:依平均数秩次距的不同而采用一系列不同的显著值。这些显著值叫做多重极差(multiplerange),记作MR或R。平均数的秩次距是指某两平均数间所包含的平均数的个数(含此两个平均数)。比如说,有10个平均数要相互比较,则10个平均数依大小次序排列后的两极端平均数的差数(极差)的显著性,由()是否大于K=10时的决定;而其中9个平均数的极差(和)的显著性,则由这两个极差是否大于K=9时的决定;……这样逐次下降,直至任何两个相邻平均数差数(如、、……等)的显著性,由这些差数是否大于K=2时的决定为止。因此如有个K平均数要相互比较,需求得K-1个,以作为各秩次距平均数的极差是否显著的标准。在K=2时,=;当K≥3时,;K愈大,超过愈多。的定义为:=×(9.13)(9.13)的是保护水平为P=(、显著水平为α时,以平均数的标准误为单位的标准化最短极差。这里的保护水平是指不犯α错误的概率。当以α为显著水平测验两个平均数的差数时,不犯α错误的概率为P=(1-α),即保护水平为1-α;故在K个平均数时,K-1个独立极差的联合保护水平为:P=(1-α)教材后附表7列出了对应于不同的和K,保护水平为P=0.95、显著水平为α=0.05,保护水平为P=0.99、显著水平为α=0.01时的值,以供查用。测验时,首先计算出平均数标准误:=(9.14)再查下的K=2,3……时SSR值(附表7),进而计算出各个K下的值。如果平均数差数≥相应秩次距下的,则达到α水平上的显著,若,则为差异不显著或不极显著。例9-3:试以SSR法测验例9-1资料中的四个处理平均数间的差异显著性。已知:=0.0337=16n=5∴==0.0821查,并计算出值,见表8-6表9-6表9-3资料各K下的值K2343.003.153.234.134.344.450.24630.25860.26520.33910.35630.3653用各测验各平均数极差显著性的程序同PLSD法,仅是不同秩次距的比较用不同的。表9-7四个甘蓝自交系叶球重量的差异显著性(SSR法)自交系(kg)-1.122-1.452-1.664差异显著性α=0.05α=0.0112.0400.9180.5880.376aA31.6640.5420.212bB41.4520.330bBC21.122cC就同一资料而言,SSR测验所能发现的显著比较有时少于PLSD测验所发现的,最多是一样的。这里需要注意一个问题:SSR测验是一种极差测验,因此如果一个平均数大集合的极差不显著,则其中所包含的各个较小集合的极差应一概作不显著处理(尽管其中可能有些极差大于相应的)。根据Duncan原意,SSR测验并不要求F测验显著后才可进行。但是,如果F测验不显著,SSR测验却仍有可能发现某些极差是显著的。所以,SSR测验还是以在F测验为显著的基础上进行为妥,这样的话,SSR测验就不是纯粹以比较错误率为准的测验,而是有了以试验错误率保护的性质。SSR法对不同秩次距的平均数极差采用不同的显著尺度,是考虑到在同一总体抽样时,平均数的极差将随K的增大而增大。因而改进了PLSD测验中的不够合理的部分。但是测验的工作量较PLSD法大,且不同秩次距平均数极差的置信区间的长度也不相等。如本例:1号自交系与2号自交系叶球重量差数的95%的置信区间是(2.040-1.122)0.2652,而1号自交系与3号自交系叶球重量差数的95%的置信区间是(2.040-1.664)0.2463等。(3)、Tukey氏固定极差测验法这是J.W.Tukey(1952)提出的一种多重比较方法。这种测验是以试验错误率为标准的,又叫固定极差的q测验法。这个方法的特点是:根据k和的大小采用一个叫做固定极差(fixedrange简记作FR)的显著值。在K个平均数的所有可能比较中,不论是相邻的还是极端的比较,都以作为比较所得差数是否显著的标准尺度(平均数差数≥为显著,为不显著)。所以FR的形式和PLSD一样,只是其尺度比PLSD要大,但在K=2时,=。的定义为:=×(9.15)上式中的为平均数标准误,即(9.15),q的定义为:q=(9.16)上式中的和分别为K个中的最大和最小的。q的值随K和而异,可从教材所附表7查得。固定极差的q测验法不需依赖F测验,任一差数的1-α置信区间也很易计算,即:[=()-,=()-,](9.17)但是,这种测验的显著尺度较大,它对于两极端平均数来说,犯α错误(即否定正确的)的概率是降低了,而对相邻的平均数来说,犯β错误(即接受不正确的)的概率却增加了,因此目前常应用q值作多重极差测验,即以代替(9.13)式中的:=×(9.18)例9-4:试以q测验法对表9-3资料各处理平均数的差异显著性作出测验。由例9-3已知=0.0821=16查附表8得:表9-8表9-3资料各K下的值K2343.003.654.054.134.785.190.24630.29970.33250.33910.39240.4261表9-9四个自交系叶球重量的差异显著性(q测验法)自交系(kg)-1.122-1.452-1.664差异显著性α=0.05α=0.0112.0400.9180.5880.376aA31.6640.5420.212bB41.4520.330*bBC21.122cC从表9-6与表9-9的看出,SSR法与q测验法的显著尺度都随着秩次距k的增加而增加,且在相同的秩次距下,q测验法的显著尺度比SSR法的大。2.多重比较方法的选择一个试验资料,采用哪种多重比较方法,主要应根据否定一个正确的无效假设和接受一个不正确的无效假设的相对重要性而定。如果否定正确的(即犯α错误)是事关重大或后果严重的,应用q测验;这就是宁愿使犯β错误的风险较大而不使犯α错误有较大风险。如果接受不正确的(即β错误)是事关重大或后果严重的,则易采用PLSD测验或SSR测验,这是宁愿冒较大的α错误的风险,而不愿冒较大的β错误的风险。在一般的农业试验研究中,较为广泛应用的是PLSD测验法和SSR测验法。3.多重比较结果的表示方法(1)列三角形表示法将全部平均数从大到小顺序排列,然后算出各平均数间的差数(这些差数呈三角形形式)。凡达α=0.05水平显著的差数在其右上角标一个“*”号;凡达α=0.01水平显著的差数在其右上角标两个“**”号;未达α=0.05水平显著的差数则不予标记。见表9-5结果表示。(2)标记字母法先将全部平均数从大到小顺序排列,然后在最大的平均数上标上字母a,并将该平均数依次和其以下各平均数相比,凡差异不显著的都标字母a,直至某一个与之相差显著的平均数则标以字母b。再以该标有b的平均数为标准,与上方各个比它大的平均数比,凡不显著的也一律标以字母b;再以标有b的最大平均数为标准,与以下各未标记的平均数比,凡不显著的继续标以字母b,直至某一个与之相差显著的平均数则标以字母c……如此重复下去,直至最小的一个平均数有了标记字母为止。这样各平均数间,凡有一个标记相同字母的即为差异不显著,凡具不同标记字母的即为差异显著。在实际应用时,一般以大写字母A.B.C……表示α=0.01显著水平,以小写字母a.b.c……表示α=0.05显著水平。见表9-5结果。