第三章统计推断•前面第四章第六节讲了样本平均数抽样分布的问题。抽样研究的目的是用样本信息来推断总体特征,这就是我们将重点讨论的统计推断问题。•所谓统计推断是指根据样本以及问题的条件和假定模型对未知事物(即总体)作出的以概率形式表述的推断,它主要包括假设检验和参数估计两个内容。•假设检验又叫显著性检验,其方法很多,常用的有t检验、F检验和χ2检验等。•尽管这些检验方法的用途及使用条件不同,但其检验的基本原理是相同的。•本章以平均数的差异显著性检验为例阐明显著性检验的原理,介绍几种t检验的方法,然后介绍总体均数的区间估计。•第一节显著性检验的基本原理•第二节样本均数与总体均数的差异显著性检验•第三节两样本平均数的差异显著性检验•第四节显著性检验中应注意的问题•第五节总体均数的区间估计第一节显著性检验的基本原理•一、显著性检验的意义•二、显著性检验的基本步骤•三、显著水平与两类错误•四、双侧检验与单侧检验一、显著性检验的意义•本节的内容主要是解决这样几个问题,即进行显著性检验的目的、检验对象、基本思想和基本前提是什么?下面结合具体例子来说明。•(一)为什么要进行显著性检验?•在某种猪场随机抽测了甲、乙两品种经产母猪各10头的产仔初生窝重:•甲品种10头母猪产仔平均初生窝重•标准差;•乙品种10头母猪产仔平均初生窝重,•标准差。kgx50.131kgS81.11kgx63.111kgS63.12问题:能否仅凭这两个样本均数差值•立即得出甲、乙两品种母猪经产仔初生窝重不同的结论呢?•统计学认为,这样得出的结论是不可靠的。这是因为试验指标既受处理因素的影响,又受试验误差(或抽样误差)的影响。如果我们再分别随机抽测10头甲、乙两品种猪母猪产仔初生窝重,又可得到两个样本资料。两样本均数就不一定是13.5kg和11.63kg,其差值也不一定是1.87kg。•怎样通过样本来推断总体呢?——这正是显著性检验要解决的问题。kgxx87.121(二)检验对象•设甲品种猪经产母猪产仔初生窝重的总体均数为,乙品种的总体均数为。•试验研究(本例为抽样比较)的目的,就是要给、是否相同做出推断,由于总体均数、未知,在进行显著性检验时只能以样本均数、作为检验对象,更确切地说,是以作为检验对象。事实上,因为样本均数具有下述特征:•离均差的平方和最小。说明样本平均数与样本各个观察值最接近,平均数是资料的代表数。121212)(21xx21xx、2)(xx样本平均数是总体均数的无偏估计值,•统计学中心极限定理,样本平均数服从或逼近正态分布。•所以,以样本平均数作为检验对象,由两个样本均数差异的大小去推断样本所属总体平均数是否相同是有其依据的。•由上所述,一方面我们有依据由样本均数的差异来推断总体均数、相同与否,另一方面又不能仅据样本均数表面上的差异直接作出结论,其根本原因在于试验误差(或抽样误差)的不可避免性。)(xEx1221xx、(三)基本思想•我们所得到的观察值由两部分组成,即•若样本含量为n,则可得到n个观察值。于是样本平均数。说明样本均数并非总体均数,它还包含试验误差的成分。•对于接受不同处理的两个样本来说,则有:•iixnxxx,...,,21x222111,xx)()()(212121xx两个样本均数之差试验的处理效应试验误差样本平均数的差包含有试验误差,•它不只是试验的表面效应。因此,仅凭就对总体均数、是否相同下结论是不可靠的。只有通过显著性检验才能从中提取结论。•对进行显著性检验就是要分析:•主要由处理效应引起的,还是主要由试验误差所造成?•虽然处理效应未知,但试验的表面效应是可以计算的,借助数理统计方法试验误差又是可以估计的。)(21xx)(21xx12)(21xx)(21xx)(21xx)(21)(21•所以,可从试验的表面效应与试验误差的权衡比较中间接地推断处理效应是否存在,这就是显著性检验的基本思想。(四)基本前提•为了通过样本对其所在的总体作出符合实际的推断,要求合理进行试验设计,准确地进行试验与观察记载,尽量降低试验误差,避免系统误差,使样本尽可能代表总体。•只有从正确、完整而又足够的资料中才能获得可靠的结论。若资料中包含有较大的试验误差与系统误差,有许多遗漏、缺失甚至错误,再好的统计方法也无济于事。•因此,收集到正确、完整而又足够的资料是通过显著性检验获得可靠结论的基本前提。•小结:•(一)显著性检验要解决的问题——如何通过样本来推断估计总体。•(二)检验的对象及其依据——样本平均数(根据有三条)。•(三)显著性检验的基本思想——从试验的表面效应与试验误差的权衡比较中间接地推断处理效应是否存在。•(四)通过检验获得可靠结论的基本前提——收集到正确、完整而又足够的资料。二、显著性检验的基本步骤•(一)首先对试验样本所在的总体作假设。•这里假设,即假设甲、乙两品种猪经产母猪仔猪初生重的总体均数相等,其意义是试验的表面效应系试验误差,处理无效,故称为无效假设(nullhypothesis),记作。•无效假设是被检验的假设,通过检验可能被接受,也可能被否定。•提出的同时,相应地有一对应假设,称为备择假设(alternativehypothesis),记作。02121或kgxx87.1210H210:HAH备择假设是在无效假设被否定时准备接受的假设。•本例的备择假设是:甲、乙两品种猪经产母猪仔猪初生窝重的总体均数不相等,记作•亦即存在处理效应,试验的表面效应除包含试验误差外,主要的是含有处理效应在内。•(二)在无效假设成立的前提下,构造合适的统计量,并研究试验所得统计量的抽样分布。•就我们的例子,研究在无效假设成立的前提下,统计量的抽样分布。经统计学研究,得到一个的t分布。•(请联系上一章的内容思考如何得出该结论的??)21:AH210:H)(21xx)1()1(21nndf其中•为均数差异标准误;•分别为两样本的含量、平均数、均方。•根据前面两个样本的数据,计算得:•)11()1()1()1()1(212122221121nnnnsnsnSxx21xxS22212121,,ssxxnn、、、87.163.115.1321xx837.0)101101()110()110(93.1)110(81.1)110(2221xxS于是•下面进一步估计出的两尾概率,即估计是多少。•查附表3,在时,两尾概率为0.05的临界t值,两尾概率为0.01的临界t值,即:•由于根据两样本数据计算所得的t值为2.234,介于二个临界t值之间,*234.2837.087.12121xxSxxt)234.2(tP234.2t18)110()110(df101.2)18(05.0t878.2)18(01.0t05.0)101.2()101.2()101.2(tPtPtP01.0)878.2()878.2()878.2(tPtPtP01.005.0234.2tt所以,|t|≥2.234的概率P介于0.01和0.05•之间,即:•0.01<P<0.05•(三)根据“小概率事件实际不可能性原理”否定或接受无效假设。•当一事件发生的概率很小(例如小于0.05或0.01)时,在一次试验中可以认为其实际上不可能发生,这叫小概率事件实际不可能性原理。|t|≥2.234的两尾概率说明试验处理效应不存在,即试验的表面效应为试验误差的可能性在0.01~0.05之间。在生物学研究中常以0.05和0.01两个概率作为•某事件是否是小概率事件的标准。•若•本例中,按所建立的,表面效应为试验误差的概率在0.01~0.05之间,即无效假设属于小概率事件,根据小概率原理,故有理由否定,从而接受可以认为甲、乙两品种经产母猪的仔猪初生窝重总体平均数不相同。05.001.001.0PP或小概率事件不认为是小概率事件0H0H210:H21:AH•小结(显著性检验的基本步骤):•首先对试验样本所在的总体作假设(无效假设和备择假设)。•在无效假设成立的前提下,构造合适的统计量,并研究试验所得统计量的抽样分布。(得出无效假设成立的概率)•根据“小概率事件实际不可能性原理”否定或接受无效假设。(在一定的概率保证下,对无效假设是否成立作出判断)•综上所述,显著性检验,从建立假设到最后依概率的大小来决定接受还是否定假设,这一过程实际上应用所谓“概率性质的反证法”对试验样本所属总体所作假设的统计证明。•对于各种显著性检验的方法,除明确其应用条件,掌握有关统计运算方法外,正确的逻辑推理是不可忽视的。三、显著水平与两类错误•(一)显著水平(Significancelevel)•在显著性检验中,否定或接受无效假设的依据是“小概率事件实际不可能性原理”。•用来确定否定或接受无效假设的概率标准叫显著水平,记作α。在生物学研究中常取α=0.05或α=0.01。•(二)显著水平α在显著性检验(t检验)中的应用•若,则说明试验的表面效应属于试验误差的概率P>0.05,即表面效应属于试验误差的可能性大,不能否定。05.0tt0H这时称“差异不显著”,记为“ns”或不标记;•若,则说明试验的表面效应属于试验误差的概率P在0.01~0.05之间,即0.01<P<0.05,亦即表面效应属于试验误差的可能性较小,应否定,接受,这时称“差异显著”,记为“*”;•若,则说明试验的表面效应属于试验误差的概率P不超过0.01,即P≤0.01。亦即表面效应属于试验误差的可能性更小,应否定,接受,这时称“差异极显著”,记为“**”。01.005.0ttt0HAH01.0tt0HAH(三)两类错误•因为显著性检验是根据“小概率事件实际不可能性原理”来否定或接受无效假设的,所以不论是接受还是否定无效假设,都没有100%的把握。也就是说,在检验一个假设时可能犯两类错误。•第一类错误是真实情况为成立,却否定了它,犯了“弃真”错误,也叫Ⅰ型错误(typeⅠerror)•犯Ⅰ型错误的概率不会超过α,Ⅰ型错误也叫α错误,在医学上还称为假阳性错误。0H第二类错误是实际不成立,却接受了它,•犯了“纳伪”错误,也叫Ⅱ型错误(typeⅡerror)。•犯Ⅱ型错误的概率记为β。Ⅱ型错误又叫β错误,在医学上还称为假阴性错误。犯Ⅱ型错误可能性β的大小与α取值的大小、两均数差异大小等因素有关。•两类错误间的关系•如图所示,图中左边曲线是为真时,的分布密度曲线;右边曲线是•为真时,的分布密度曲线()。0H210:H)(21xx210:H)(21xx21•因此,在检验选用显著水平时,应考虑到这两种错误推断后果的严重性大小,还应考虑到试验的难易,试验结果的重要程度。两类错误示意图由图不难看出,当α值变小时,β值变大;反之,α值变大时,β值变小。也就是说Ⅰ型错误α的降低必然伴随着Ⅱ型错误β的升高。若一个试验耗费大,可靠性要求高,不允许•反复,那么α值应取小些;当一个试验结论的使用事关重大,容易产生严重后果,如药物的毒性试验,α值亦应取小些。•对于一些试验条件不易控制,试验误差较大的试验,可将α值放宽到0.1,甚至放宽到0.25。•在提高显著水平,即减小α值时,为了减小犯Ⅱ型错误的概率,可适当增大样本含量。增大样本含量可以同时降低犯两类错误的可能性。•两类错误的关系客观实际否定接受成立Ⅰ型错误(α)推断正确(1-α)不成立推断正确(1-β)Ⅱ型错误(β)0H0H0H0H•小结:•因为显著性检验是根据“小概率事件实际不可能性原理”来否定或接受无效假设的,所以不论是接受还是否定无效假设,都没有100%的把握。•若经t检验“差异显著”,对此结论有95%的把握,同时要冒5%下错结论的风险;•“差异极显著”,对此结论有99%的把握,同时要冒1%下错结论的风险