第五章均数差异显著性检验(t检验)(难点与重点)抽样研究的目的是用样本信息来推断总体特征,这就是我们将重点讨论的统计推断问题。统计推断主要包括假设检验和参数估计两个内容。统计假设测验又叫显著性检验,其方法很多,常用的有t检验、F检验和2测验等。尽管这些检验方法的用途及使用条件不同,但其检验的基本原理是相同的。本章通过t测验介绍统计假设测验的原理,介绍几种t测验的方法。参数估计有点估计和区间估计。总体与样本间的关系从总体到样本从样本到总体统计推断(目的)抽样分布(基础)假设测验参数估计t检验F检验2检验区间估计点估计样本平均数的抽样分布t分布第一节显著性检验的基本原理第二节样本均数与总体均数的差异显著性检验第三节两样本平均数的差异显著性检验第四节二项性质的百分数资料差异显著性检验第五节总体参数的区间估计第一节显著性检验的基本原理一、显著性检验的意义二、样本平均数的抽样分布与t分布三、显著性检验的基本步骤四、显著水平与两类错误五、双侧检验与单侧检验第一节显著性检验的基本原理本节的内容主要是解决这样几个问题,即进行显著性检验的目的、检验对象、基本思想和基本前提是什么?下面结合具体例子来说明。(一)检验的目的长白猪大白猪1076.111111nSx头,头,10549.12.9222nSx头,头,例如:下面两个品种经产母猪产仔数相同吗?问题:能否仅凭这两个平均数的差值1.8头,立即得出长白与大白两品种经产母猪产仔数不同的结论呢?统计学认为,这样得出的结论是不可靠的。这是因为试验指标既受处理因素的影响,又受试验误差(或抽样误差)的影响。现实中,试验又不可能无限作下去。怎样通过样本来推断总体呢?——这正是假设测验要解决的问题。(二)检验对象在进行显著性检验时只能以样本平均数作为检验对象,更确切地说,以作为检验对象。这是因为样本平均数具有下述特征:1、离均差的平方和最小。说明样本平均数与样本各个观测值最接近,平均数是资料的最佳代表数。)(21xx2、样本平均数是总体平均数的无偏估计值。3、根据统计学中心极限定理,样本平均数服从或逼近正态分布。所以,以样本平均数作为检验对象,由两个样本平均数差异的大小去推断两个样本所属总体平均数是否相同是有其依据的。(三)基本思想iixx222111,xx)()()(212121xx两个样本均数之差(试验的表面效应)试验的处理效应试验误差样本一样本二进行假设测验就是要分析:表面差异主要由处理效应引起的,还是主要由试验误差所造成?虽然处理的真实差异未知,但试验的表面差异是可以计算的,借助数理统计方法试验误差又是可以估计的。所以,可从试验的表面差异与试验误差的权衡比较中间接地推断真实差异是否存在,这就是假设测验的基本思想。(四)基本前提——合理进行试验设计;——收集到正确、完整而又足够的资料目的:降低试验误差,避免系统误差。二、显著性检验的基本步骤(一)首先对试验样本所在的总体作假设本例假设,即假设长白猪和大白猪两品种经产母猪产仔数的总体平均数相等,其意义是试验的表面效应是试验误差,处理无效,这种假设称为无效假设(nullhypothesis),记作H0。无效假设是被直接测验的假设,通过测验可能被接受,也可能被否定。02121或提出无效假设的同时,相应地有一对应假设,称为备择假设,记作HA。备择假设是在无效假设被否定时准备接受的假设。本例,为备择假设,即假设长白猪与大白猪两品种经产母猪产仔数的总体平均数不相等,其意义是指试验的表面效应,除包含试验误差外,还含有处理效应在内。02121或(二)在无效假设成立的前提下,构造合适的统计量,并研究试验所得统计量的抽样分布,计算无效假设正确的概率对于上述例子,在无效假设成立的前提下,经统计学研究统计量的抽样分布服从t分布。)(21xx2121xxSxxt其中均数差异标准误;为两样本的含量、平均数、均方。)11()1()1()1()1()11()1()1()()(2121222211212122221121nnnnsnsnnnnnxxxxSxx21xxS22212121,,ssxxnn、、、根据前面两个样本的数据,计算得:8.12.91121xx742.0)101101()110()110(549.1)110(76.1)110(2221xxS*426.2742.08.12121xxSxxt下面进一步估计出查附表3,在时,两尾概率为0.05的临界t值,两尾概率为0.01的临界t值,即:由于根据两样本数据计算所得的t值为2.426,介于二个临界t值之间,?)426.2(tP18)110(2df101.2)18(05.0t878.2)18(01.0t05.0)101.2()101.2()101.2(tPtPtP01.0)878.2()878.2()878.2(tPtPtP01.005.0426.2tt|t|≥2.426的两尾概率所以,|t|≥2.426的概率P介于0.01和0.05之间,即说明试验处理效应不存在,试验的表面效应为试验误差的可能性在0.01~0.05之间。(三)根据“小概率事件实际不可能性原理”否定或接受无效假设。根据这一原理,当试验的表面效应是试验误差的概率小于0.05时,可以认为在一次试验中试验表面效应是试验误差实际上是不可能的,因而否定原先所作的无效假设HO,接受备择假设HA,即认为试验的处理效应是存在的。认为长白猪与大白猪两品种经产母猪产仔数总体平均数不相同(差异显著)。综上所述,显著性检验,从提出无效假设与备择假设到根据小概率事件实际不可能性原理来否定或接受无效假设,这一过程实际上是应用所谓“概率性质的反证法”对试验样本所属总体所作的无效假设的统计推断。三、显著水平与两类错误(一)显著水平在显著性检验中,否定或接受无效假设的依据是“小概率事件实际不可能性原理”。用来确定否定或接受无效假设的概率标准叫显著水平(significancelevel),记作α。在生物学研究中常取α=0.05或α=0.01。若,则说明试验的表面差异属于试验误差的概率P>0.05,即表面效应属于试验误差的可能性大,不能否定H0,这时称“差异不显著”,记为“ns”或不标记;05.0tt在均数显著性检验(t检验)中:若,则说明试验的表面差异属于试验误差的概率P在0.01~0.05之间,即0.01<P<0.05,亦即表面差异属于试验误差的可能性较小,应否定H0,接受HA,这时称“差异显著”,记为“*”;01.005.0ttt若,则说明试验的表面效应属于试验误差的概率P不超过0.01,即P≤0.01。亦即表面效应属于试验误差的可能性更小,应否定H0,接受HA,这时称“差异极显著”,记为“**”。01.0tt因为显著性检验是根据“小概率事件实际不可能性原理”来否定或接受无效假设的,所以不论是接受还是否定无效假设,都没有100%的把握。也就是说,在检验一个假设时可能犯两类错误。(二)两类错误第一类错误H0成立,却否定了它,犯了“弃真”错误,也叫Ⅰ型错误。犯Ⅰ型错误的概率不会超过α,Ⅰ型错误也叫α错误,在医学上还称为假阳性错误。第二类错误是H0实际不成立,却接受了它,了“纳伪”错误,也叫Ⅱ型错误。犯Ⅱ型错误的概率记为β,Ⅱ型错误又叫β错误,在医学上还称为假阴性错误。犯Ⅱ型错误可能性β的大小与α取值的大小、两均数差异大小等因素有关。由图不难看出,当α值变小时,β值变大;反之,α值变大时,β值变小。也就是说Ⅰ型错误α的降低必然伴随着Ⅱ型错误β的升高。两类错误示意图因此,在检验选用显著水平时,应考虑到这两种错误推断后果的严重性大小,还应考虑到试验的难易,试验结果的重要程度。(三)降低两类错误的措施选择合适的显著水平、增大样本含量可以同时降低犯两类错误的可能性。小结:因为显著性检验是根据“小概率事件实际不可能性原理”来否定或接受无效假设的,所以不论是接受还是否定无效假设,都没有100%的把握。若经t检验“差异显著”,对此结论有95%的把握,同时要冒5%下错结论的风险;“差异极显著”,对此结论有99%的把握,同时要冒1%下错结论的风险;“差异不显著”,是指在本次试验条件下,无效假设未被否定。“差异不显著”并一定是“没有差异”。这有两种可能:或者这两个样本所在的总体确实没有差异;或者这两个样本所在总体平均数有差异而因为试验误差大被掩盖了。因而不能仅凭统计推断就作出绝对肯定或绝对否定的结论。“有很大的可靠性,但有一定的错误率”,这是统计推断的基本特点。四、两尾检验与一尾检验(一)双侧检验(two-sidedtest)在显著性检验中,无效假设为,备择假设为。此时备择假设包括了或两种可能。这个假设的目的在于判断有无差异,而不考虑谁大谁小。此时,在α水平上否定域为两个,对称地分配在分布曲线的两侧尾部。这种利用两尾概率进行的检验叫双侧检验,也叫双尾检验。210:H21:AH2121x一尾检验两尾检验(二)一尾检验(one-sidedtest)无效假设应为,备择假设应为,这时的否定域在分布曲线的右尾(如图A所示)。若无效假设为,备择假设为,此时的否定域在分布曲线的左尾(如图B所示)。xx210:H210:H2121一尾检验两尾检验这种利用一尾概率进行的检验叫单侧检验也叫单尾检验。若对同一资料进行双侧检验也进行单侧检验,所得的结论不一定相同。双侧检验显著,单侧检验一定显著;反之,单侧检验显著,双侧检验未必显著(??)。在α水平上单侧检验显著,相当于双侧检验在2α水平上显著。(三)应用选用单侧检验还是双侧检验应根据专业知识及问题的要求(分析的目的)在试验设计时就确定。一般情况下,如不作特殊说明均指双侧检验第二节样本平均数与总体平均数差异的显著性检验检验一个样本均数与已知总体均数是否有显著差异,即检验某一处理是否有效。这里的一般为一些公认的指标(确定值)。如畜禽正常生产性能指标、经大量调查所得的平均值、经验数或规定的某种指标值。x00检验的基本步骤:(1)建立假设其中μ为样本所在总体均值。(2)在无效假设成立的条件下,计算t值其中,n为样本含量,为样本标准误。000:;:AHH1,0ndfSxtxnSSx/(3)根据计算出的自由度,查得临界值:。将计算所得t值的绝对值与其比较,作出推断。若,则P>0.05,不能否定H0,表明样本均数与总体均数差异不显著;若,则0.01<P≤0.05否定H0,接受HA,表明样本均数与总体均数差异显著;01.005.0,tt若,则P≤0.01,否定H0,接受HA,表明样本均数与总体均数差异极显著【例】在鱼塘中10个点取水样,测定水中含氧量,得数据:4.33,4.62,3.89,4.14,4.78,4.64,4.52,4.48,4.55,4.26(mg/l),能否认为该鱼塘中平均含氧量为4.50(mg/l)。显然,本例应进行双侧t检验。1.建立假设50.4:;50.4:0AHH01.0tt2.计算t值经计算得:=4.421,S=0.267,所以3.查临界t值,并作出推断由df=10-1=9查t值表(附表2)得,=2.262。因为,P>0.05,故不能否定,可以认为该鱼塘中平均含氧量为4.50(mg/l).x940.0084.0079.010/267.050.4421.40xSxt05.0t05.0tt50.4:0H第三节两样本均数的差异显著性检验对于两样本均数的显著性检验,因条件或试验设计不同,一般可分为两种情况。一是完全随机设计(非配对设计)两样本平均数的比较(成组数据的平均数比较);二是配对设计两样本平均数的比较(成对数据的平均数比较)。一、非配对设计两样本均数的差异显著性