第三节假设检验在生物学试验和研究中,当进行检验一种试验方法的效果、一个品种的优劣、一种药品的疗效等试验时,所得的试验数据往往存在着一定的差异,这种差异是由随机误差引起的,还是由试验处理的效应所造成的呢?例如:同一种饲养条件下,饲养肉鸡各20只,饲料分别为A\B;在二月龄测得的平均体重分别为1.5kg和1.4kg,差值0.1kg的产生是由A\B处理的效应产生的还是由随机误差造成的?必须通过概率计算,采用假设检验的方法,才能做出正确的判断。假设检验(Hypothesis)概念:又称为显著性检验,就是根据总体的理论分布和小概率原理,对未知的或不完全知道的总体提出两种彼此对立的假设,然后由样本的实际结果,经过一定的计算,做出在一定概率意义上应该接受的那种假设的推断。如果抽样结果使小概率事件发生,则拒绝假设;如果抽样结果没有使小概率事件发生,则接受假设。生物统计学里,一般认为等于或小于0.05或0.01的概率为小概率。假设检验(Hypothesis)假设检验的基本原理:某种猪场场长对客户称该猪场种猪在100kg体重时的平均背膘厚为9mm,场长的态度导致4种可能:诚实确实为9mm不知道估计值,低于或高于9mm谨慎保守说法,实际低于9mm,吹牛夸大说法,实际高于9mm,9999第一种假设分别与第二、三、四种假设是对立的,即有三对对立的假设,对假设进行判断,就要进行假设检验假设检验(Hypothesis)如何进行检验:样本平均数总体均数推断样本随机抽样总体例如:假设我们从某种猪场随机抽取了10头猪,其平均背膘厚为8.7mm,已知该猪场100kg体重时的平均背膘厚服从N(9,2.52),试问该场长宣称的9mm是否可信?假设检验的基本步骤1、提出假设(成对的)H0:无效假设、原假设或零假设,被直接检验的假设,是对总体提出的一个假想目标。所谓“无效”意指处理效应与总体参数之间没有真实的差异,试验结果中的差异乃误差所致。否定或接受(nullhypothesis)HA:备择假设,是和无效假设相反的一种假设,即认为试验结果中的差异是由于总体参数不同所引起的。一旦否定原假设就接受备择假设。(alternativehypothesis)9:,9:AOHH假设检验的基本步骤2、构造并计算检验统计量(teststatistic)利用原假设所提供的信息,而且其抽样分布已知1623.310/5.297.810/5.29/xnxZ9:,9:AOHH假设检验的基本步骤3、确定显著水平,确定否定域(临界值)根据小概率事件原理,比较检验统计量和临界值的关系,确定其落在否定域还是接收域。-1.961.96接受区域95%否定区域2.5%否定区域2.5%0-2.582.58在进行无效假设和备择假设后,要确定一个否定H0的概率标准,这个概率标准叫显著水平,记作a。a是人为规定的小概率界限生物统计学中常取a=0·05和a=0·01两个显著水平。推断是否接受假设的原理:小概率原理一般来说,一个小概率事件在一次观测中是不应出现的,而现在它竟然出现了,一个合理的解释就是它实际上不是一个小概率事件,我们把它当作一个小概率事件是因为我们的统计假设不对,因此所算出来的它出现的概率也不对。在这种情况下,我们就应拒绝统计假设。假设检验的基本步骤4、对假设进行统计推断统计学中,常把概率小于0.05或0.01作为小概率。所以根据小概率原理作出是否接受H0。如果计算的概率大于0.05或0.01,则认为不是小概率事件,H0的假设可能是正确的,应该接受H0,同时否定HA;反之,所计算的概率小于0.05或0.01则否定H0,接受HA。把概率等于或小于0.05叫做差异显著标准,或差异显著水平;等于或小于0.01叫做差异极显著标准,或差异极显著水平。一般差异达到显著水平,则在资料的右上方标以“*”差异达到极显著水平,则在资料右上方标以“**”。上例中,所计算的概率为-3.16,小于0.05的显著水平,应接受H。,可以推断有显著差异,其差值0.3不是误差所致。假设检验的基本步骤4、对假设进行统计推断显著水平:0.01;0.05(1)差异不显著:接受原假设(2)差异显著:在0.05水平下,否定原假设,接受备择假设(3)差异极显著:在0.01水平下,否定原假设,接受备择假设58.216.3Z结论:否定原假设,接受备择假设在实际检验时,可将上述计算简化:已知P(︱u︱>1.96)=0·05P(︱u︱>2.58)=0.01u分布进行检验时if︱u︱>1.96,在a=0.05的水平上达到显著if︱u︱>2.58,在a=0.01的水平上达到极显著水平假设检验的步骤可概括为:(1)对样本所属总体提出无效假设H0和备择假设HA;(2)确定检验的显著水平a;(3)在H0正确的前提下,根据抽样分布的统计数,进行假设检验的概率计算;(4)根据显著水平a的u值临界值,进行差异是否显著的推断。二、双尾检验与单尾检验进行假设检验提出无效假设和备择假设时,其总体平均数μ可能大于μ0,也可能小于μ0在样本平均数的抽样分布中当α=0.05时,落在区间的有95%,落在这一区间之外的只有5%。当α=o.o1时,落在区间的有99%,落在这一区间之外的只有1%。在进行假设检验时,前者相当于接受的区域,称为接受区;后者相当于否定的区域,称为否定区。一般将接受区和否定区的两个临界值写作当在内为的接受区,和为的两个否定区,为左尾否定区为右尾否定区。假设检验的两个否定区,分别位于分布的两尾,称为双尾检验。当假设检验H0:μ=μ0HA:μ≠μ0这时备择假设就有两种可能,μ>μ0或μ<μ0,在μ≠μ0的情况下,样本平均数有可能落入左尾否定区,也有可能落入右尾否定区,这两种情况都属于μ≠μ0的情况。例如:检验某种新药与旧药的治病疗效是否有差别,就是说新药疗效比旧药好还是旧药疗效比新药好,两种可能性都存在,相应的假设检验就应该用双尾检验。在生物学研究中,双尾检验的应用是非常广泛的。在某些情况下例如,已经知道新药疗效不可能低于旧药无效假设H0:μ=μ0备择假设HA:μμ0这时仅有一种可能性,其否定区只有一个,相应的检验也只能考虑一侧的概率,这种具有左尾或右尾一个否定区的检验叫单尾检验。单尾检验的步骤与双尾检验相同,查u分布表或t分布表时,需将双尾概率乘以2,再进行查表。单尾测验与双尾测验的方法与步骤非常相似,只是在如何确定小概率事件的边界问题上不同例如:a=0.05的单尾检验时对H0:μ≥μ0,需进行左尾检验,否定区为对H0:μ≤μ0,需进行右尾检验,否定区为a=0.01的单尾检验时对H0:μ≥μ0,其否定区为对H0:μ≤μ0,其否定区为双尾检验的临界正态离差︱u︱大于单尾检验的︱u︱如:a=0.05时,双尾检验的︱u︱=1.96,而单尾检验的u=1.64或u=-1.64。a=0.01时,双尾检验的︱u︱=2.58,而单尾检验的u=2.33或u=-2.33所以单尾检验比双尾检验容易对H0进行否定因此,在采用单尾检验时,应有足够的依据。图5-3双侧检验图5-4单侧检验三、假设检验中的两类错误假设检验是根据一定概率显著水平对总体特征进行推断。否定了H。,并不等于已证明H。不真实;接受了H。,也不等于已证明H。是真实的。第一类错误:a错误第二类错误:β错误第一类错误:如果H。是真实的,假设检验却否定了它,就犯了一个否定真实假设的错误,这类错误又称a错误,亦称弃真错误。如:对样本平均数的抽样分布a=0.05时落在区间的概率为0.95;落在区间之外的概率为0.05,当一旦落在区间之外,假设检验时就会否定H0,接受HA,这样就会导致错误的结论。不过,犯这类错误的概率很小,只有0.05。a=0.01时落在区间的概率为0.99,落在区间之外的概率只有0.01,即犯a错误的可能性更小,只有0.01。第二类错误如果H。不是真实的,假设检验时却接受了H0否定了HA,这样就犯了接受不真实的错误,这类错误叫第二类错误,或称β错误,亦称纳伪错误。图5-2两类错误示意图μ1=μ0μ1≠μ0第一类错误和第二类错误的关系:区别:第一类错误只有在否定H0时才会发生第二类错误只有在接受H0时才会发生。联系:在样本容量相同的情况下,第一类错误减少,第二类错误就会增加;反之第二类错误减少,第一类错误就会增加大小犯第一类错误的大小恰好等于显著水平,而犯第二类错误的大小用表示。客观实际否定H0接受H0H0成立Ⅰ型错误(α)推断正确(1-α)H0不成立推断正确(1-β)Ⅱ型错误(β)如:将概率显著水平α从0.05提高到0.01,就更容易接受H0,因此犯第一类错误的概率就减少,但相应地增加了犯第二类错误的概率。所以显著水平如果定得太高,虽然在否定H0时减少了犯第一类错误的概率,但在接受H0时却可能增大第二类错误的概率。如何减少犯这两类错误的概率呢?(1)概率显著水平的确定与犯两类错误有密切的关系α取值太高或太低都会导致某一种错误的增加。一般的作法是,将概率显著水平不要定得太高以取α=0.05作为小概率比较合适,这样可使犯两类错误的概率都比较小。降低在样本容量固定时,减小第一类错误的概率必然增大犯第二类错误的概率,反之亦然.但如果样本容量增加,则两类错误的概率都可减小。当固定时,单尾测验的小于双尾测验的。图5-2两类错误示意图(3)在计算正态离差u时,总体平均数μ和样本平均数之间的差值不是随意能够进行主观改变,但在试验研究中,却是可以减小的。从理论上讲,可通过精密的试验设计和增大样本容量而减小到接近0的程度,这样正态分布中接受区就变得十分狭窄,μ和之间的差别就比较容易发现,所以减小是减少两类错误的关键。因此,在试验和研究中应用假设检验时,要有合理的试验设计和正确的试验技术,尽量增加样本容量,以减小标准误。综合起来可以归纳如下:样本容量n固定的情况下,提高显著水平,如从5%提高到1%,则将增大第二类错误的概率值。在n和显著水平相同的情况下,真总体平均数和假设平均数0的相差越大,则犯第二类错误的概率值愈小。为了降低犯两类错误的概率,需采用一个较低的显著水平,如=0.05,同时适当增加样本容量。改进试验技术,增加样本容量。第二节样本平均数的假设检验一、大样本平均数的假设检验一u检验(一)一个样本平均数的u检验(二)两个样本平均数比较的u检验二、小样本平均数的假设检验一t检验(一)一个样本平均数的假设检验(二)成组数据平均数比较的假设检验(三)成对数据平均数比较的假设检验(一)一个样本平均数的u检验根据总体方差是否已知,一个样本平均数的u检验分为两种情况。1.总体方差已知时的检验当总体方差为已知时,检验一个样本平均数的总体平均数μ是否属于某一指定平均数μ0的总体,不论其样本容量是否大于30,均可采用u检验法例4.l某鱼场按常规方法所育鲢鱼苗一月龄的平均体长7.25cm,标准差为1.58cm,为提高鱼苗质量,现采用一新方法进行育苗,一月龄时随机抽取100尾进行测量,测得其平均体长为7.65cm,试问新育苗方法与常规方法有无显著差异?(1)无效假设H0:μ=μ0=7.25cm,备择假设HA:μ≠μ0(2)选取显著水平a=0.05;(3)检验计算:(4)推断:u分布中,当α=0.05时,uo.o5=1.96。实得︱u︱>1.96,P<0.05,故在0.05显著水平上否定H。,接受HA,认为新育苗方法一月龄体长与常规方法有显著差异。2.总体方差未知时的检验当总体方差未知时,只要样本容量n>30,可用样本方差来代替总体方差,仍可用u检验法。例4.2生产某种纺织品,要求棉花纤维长度平均为30mm以上,现有一棉花品种以n=400进行抽查,测得其纤维平均长度为30.2mm,标准差为2.5mm,问该棉花品种的纤维长度是否符合纺织品的生产?可知,μ=30mm,=30.2mm,s=2.5mm,而未知,但由于n=400,属于大样本,故可用来代替进行u检验;由于棉花纤维只有大于30mm才符合要求,故用单尾检验。(1)假设H0:μ≤30mm,即该棉花品种纤