第四章显著性检验下一张主页退出上一张假设检验又叫显著性检验是统计学中的一个重要内容。显著性检验的方法很多,常用的有u检验、t检验、F检验和2检验等。尽管这些检验方法的使用条件及用途不同,但检验的基本原理是相同的。下一张主页退出上一张第一节显著性检验的基本原理下一张主页退出上一张一、显著性检验的意义下一张主页退出上一张如,某地进行了两个水稻品种对比试验,在相同条件下,两个水稻品种分别种植10个小区,获得两个水稻品种的平均产量为:我们能否根据就判定这两个水稻品种平均产量不同?结论是,不一定。1510x2500x1210xx1210xx因为两个水稻品种平均产量、都是从试验种植的10个小区获得,仅是两个品种有关总体平均数的估计值。由于存在试验误差,样本平均数并不等于总体平均数,样本平均数包含总体平均数与试验误差二部分,即下一张主页退出上一张1x2x12,111x222x于是,下一张主页退出上一张121212()()xx其中,为试验的表面差异,为试验的真实差异,为试验误差。12()xx12()12()表明,试验的表面差异是由两部分组成:一部分是试验的真实差异;另一部分是试验误差。虽然真实差异未知,但试验的表面差异是可以计算的,借助数理统计方法可以对试验误差作出估计。所以,可将试验的表面差异与试验误差相比较间接推断真实差异是否存在,即进行差异显著性检验。下一张主页退出上一张12()xx12()12()12()12()xx12()xx12()显著性检验的目的在于判明,试验的表面差异主要是由试验的真实差异造成的,还是由试验误差造成的,从而得到可靠的结论。下一张主页退出上一张12()xx12()12()二、显著性检验的步骤下一张主页退出上一张【例4·1】已知某品种玉米单穗重~N(300,9.52),即单穗重总体平均数300g,标准差9.5g。在种植过程中喷洒了某种药剂的植株中随机抽取9个果穗,测得平均单穗重308g,试问这种药剂对该品种玉米的平均单穗重有无真实影响?x0x(一)提出假设下一张主页退出上一张首先对样本所在的总体作一个假设。假设喷洒了药剂的玉米单穗重总体平均数与原来的玉米单穗重总体平均数之间没有真实差异,即或。也就是假设表面差异是由抽样误差造成的。00000()x这种假设通常称为无效假设或零假设,记为。无效假设是待检验的假设,它有可能被接受,也有可能被否定。相应地还要有一个对应假设,称为备择假设。备择假设是在无效假设被否定时,准备接受的假设,记为或。通过检验,若否定无效假设,我们就接受备择假设。下一张主页退出上一张00:H000:AH(二)计算概率下一张主页退出上一张在假定无效假设成立的前提下,根据所检验的统计数的抽样分布,计算表面差异是由抽样误差造成的概率。0()x本例是在假定无效假设成立的前提下,研究在~N(300,9.52)这一已知正态总体中抽样所获得的样本平均数的分布。00:Hxx第三章已述及,若,则样本平均数,,,将其标准化,得下一张主页退出上一张2(,)xN2(,)xxxNxxn0xxxxxxun本例,得09,308300nxgg9.5g03083002.5269.59xun下面估计|u|≥2.526的两尾概率,即估计P(|u|≥2.426)是多少?我们知道,两尾概率为0.05的临界值为=1.96,两尾概率为0.01的临界值为=2.58,即:下一张主页退出上一张0.05uu0.01uP(||>1.96)=P(>1.96)+P(<-1.96)=0.05uuuP(||>2.58)=P(>2.58)+P(<-2.58)=0.01下一张主页退出上一张uuu根据样本数据计算所得的值为2.526,介于两个临界值之间,即:<2.426<uu0.05u0.01u所以,||≥2.526的概率P介于0.01和0.05之间,即0.01<p<0.05说明假定表面差异()是由抽样误差造成的概率在0.01—0.05之间。下一张主页退出上一张u0x(三)统计推断下一张主页退出上一张根据小概率事件实际不可能性原理作出否定或接受无效假设的推断。若随机事件的概率很小,例如小于0.05,0.01,0.001,称之为小概率事件。在统计学上,把小概率事件在一次试验中看成是实际上不可能发生的事件,称为小概率事件实际不可能原理。根据这一原理,当表面差异是抽样误差的概率小于0.05时,可以认为在一次抽样中表面差异是抽样误差实际上是不可能的,因而否定原先所作的无效假设H0:,接受备择假设HA:,即认为存在真实差异。当表面差异是抽样误差的概率大于0.05时,说明无效假设H0:成立的可能性大,不能被否定,因而也就不能接受备择假设HA:。下一张主页退出上一张0000显著性检验的结果表明:本例的样本平均数与原总体平均数之间的表面差异()除包含抽样误差外,还包含真实差异(),即喷洒了药剂的玉米单穗重总体平均数与原来的玉米单穗重总体平均数不同。下一张主页退出上一张0x00综上所述,显著性检验,从提出无效假设与备择假设,到根据小概率事件实际不可能性原理来否定或接受无效假设,这一过程实际上是应用所谓“概率性质的反证法”对样本所属总体所作的无效假设的统计推断。下一张主页退出上一张上述显著性检验利用了分布来估计出∣u∣≥2.562的两尾概率,所以称为检验.uu三、显著水平与两种类型的错误(一)显著水平下一张主页退出上一张用来否定或接受无效假设的概率标准叫显著水平,记作。在生物学研究中常取=0.05,称为5%显著水平;或=0.01,称为1%显著水平或极显著水平。对于上述例子的检验来说,若∣u∣<1.96,则说明试验的表面差异属于试验误差的概率p>0.05,即表面差异属于试验误差的可能性大,不能否定。统计学上把这一检验结果表述为:“总体平均数与差异不显著”,在计算所得的u值的右上方标记“”或不标记符号;下一张主页退出上一张u00:H0ns若≤||<,则说明试验的表面差异属于试验误差的概率p在0.01—0.05之间,即0.01<p≤0.05,表面差异属于试验误差的可能性较小,应否定H0:,接受HA:。统计学上把这一检验结果表述为:“总体平均数与差异显著”,在计算所得的值的右上方标记“*”;下一张主页退出上一张1.96u2.58000u若||≥2.58,则说明试验的表面差异属于试验误差的概率p不超过0.01,即p≤0.01,表面差异属于试验误差的可能性更小,应否定H0:,接受HA:。统计学上把这一检验结果表述为:“总体平均数与差异极显著”,在计算所得的值的右上方标记“**”。下一张主页退出上一张u000u可以看到,是否否定无效假设,是用实际计算出的检验统计数的绝对值与显著水平对应的临界值比较:若||≥,则在水平上否定若||<,则不能在水平上否定。下一张主页退出上一张00:Huuuuuuu00:H00:H下一张主页退出上一张区间和称为水平上的否定域,而区间则称为水平上的接受域。,u,u(,)uu因为在显著性检验中,否定或接受无效假设的依据是“小概率事件实际不可能性原理”,所以我们下的结论不可能有百分之百的把握。下一张主页退出上一张(二)两类错误例如,经检验获得“差异显著”的结论,我们有95%的把握否定无效假设H0,同时要冒5%下错结论的风险;经检验获得“差异极显著”的结论,我们有99%的把握否定无效假设H0,同时要冒1%下错结论的风险;而经检验获得“差异不显著”的结论,在统计学上是指“没有理由”否定无效假设H0,同样也要冒下错结论的风险。下一张主页退出上一张uuu显著性检验可能出现两种类型的错误:下一张主页退出上一张Ⅰ型错误与Ⅱ型错误。Ⅰ型错误又称为错误,就是把非真实的差异错判为是真实的差异,即实际上H0正确,检验结果为否定H0。犯Ⅰ类型错误的可能性一般不会超过所选用的显著水平;Ⅱ型错误又称为错误,就是把真实的差异错判为是非真实的差异,即实际上HA正确,检验结果却未能否定H0。犯Ⅱ类型错误的可能性记为,一般是随着的减小或试验误差的增大而增大,所以越小或试验误差越大,就越容易将试验的真实差异错判为试验误差。下一张主页退出上一张00因此,如果经检验获得“差异显著”或“差异极显著”,我们有95%或99%的把握认为,这两个样本所在的总体平均数不相同,判断错误的可能性不超过5%或1%;若经检验获得“差异不显著”,我们只能认为在本次试验条件下,这两个样本所在的总体平均数没有差异的假设H0:未被否定,这有两种可能存在:或者是这两个总体平均数确实没有差异,或者是这两个总体平均数有差异而因为试验误差大被掩盖了。下一张主页退出上一张uu12因而,不能仅凭统计推断就简单地作出绝对肯定或绝对否定的结论。“有很大的可靠性,但有一定的错误率”这是统计推断的基本特点。下一张主页退出上一张显著性检验的两类错误归纳如下:下一张主页退出上一张表4-1显著性检验的两类错误检验结果客观实际否定0H接受0H0H成立Ⅰ型错误()推断正确(1-)0H不成立推断正确(1-)Ⅱ型错误()为了降低犯两类错误的概率,一般从选取适当的显著水平和增加试验重复次数来考虑。因为选取数值小的显著水平值可以降低犯Ⅰ类型错误的概率,但与此同时也增大了犯Ⅱ型错误的概率,所以显著水平值的选用要同时考虑到犯两类错误的概率的大小。下一张主页退出上一张n对于田间试验,由于试验条件不容易控制完全一致,试验误差较大,为了降低犯Ⅱ型错误的概率,也有选取显著水平为0.10或0.20的(注意,在选用这些显著水平值时,一定要予以注明)。通常采用适当增加试验处理的重复次数(即样本容量),以降低试验误差,提高试验的精确度,降低犯Ⅱ型错误的概率。下一张主页退出上一张在【例4·1】中,对应于无效假设H0:的备择假设为HA:。HA实际上包含了或这两种情况。此时,在水平上否定域为和,对称地分配在分布曲线的两侧尾部,每侧尾部的概率为,如图4-1所示。这种利用两尾概率进行的检验叫两尾检验.为水平两尾检验的临界值。四、两尾检验与一尾检验下一张主页退出上一张0000,u,uu/2u0u两尾检验的目的在于判断与有无差异,而不考虑与谁大谁小。下一张主页退出上一张00在有些情况下两尾检验不一定符合实际情况。例如,目前我国大豆育种工作者认为,大豆籽粒蛋白质含量超过45%()的品种为高蛋白品种。如果进行样品含量检测,我们关心的是所在的总体平均数大于。此时的无效假设仍为H0:,但备择假设则为HA:。这时否定域位于分布曲线的右尾,即。例如当=0.05时,否定域为。下一张主页退出上一张0x000u[,)u[1.64,)下一张主页退出上一张又如,国家规定稻米中某种农药成分的残留物含量应低于0.1%()。在抽检中,我们关心的是所在的总体平均数小于(即该品种属于合格产品)。此时的无效假设仍为H0:,但备择假设则为HA:。这时否定域位于分布曲线的左尾,即。例如当=0.05时,分布的否定域为,见图4-2。0x000u(,]uu(,1.64]一尾检验的=两尾检验的=2.33。这种利用一尾概率进行的检验叫一尾检验。此时为一尾检验的临界值。显然,一尾检验的=两尾检验的。下一张主页退出上一张uuu2u例如,一尾检验的=两尾检验的=1.64,0.05u0.10u0.01u0.02u实际应用中,如何选用两尾检验或一尾检验,应根据专业的要求在试验设计时就确定。一般情况下,若事先不知道与谁大谁小,只是为了检验与是否存在差异,则选用两尾检验;如果凭借一定的专业知识和