第九章假设检验(一)1§9.1假设检验的基本概念假设检验:对一个或多个总体的概率分布或参数的假设.所作的假设可以是正确的,也可以是错误的.为判断所作的假设是否正确,从总体中抽取样本,根据样本的取值,按一定的原则进行检验,然后,作出接受或拒绝所作假设的决定.何为假设检验?2例1.某厂有一批产品,按国家规定标准,次品率不得超过4%才能出厂。现从中任取10件进行检验(每次取1件,取后放回),发现有4件次品,问该批产品能否出厂?1.问题的提出假设该批产品的次品率为p,问题:检验假设p4%是否成立?利用抽样的结果来判断这一假设是否成立。3若以X表示折断力,那么这个例子的问题就化为:如何根据抽样的结果来判断等式:“EX=570”是否成立。例2.某车间生产的一种铜丝,其折断力服从N(570,64)。现改变生产工艺,并从新产品中抽取10个样品进行测量,得=575.2(N),问折断力大小与原来是否相同?(假定方差不会改变)。x上述例子的共同特点是:先对总体的参数或总体的分布函数的形式作某种假设H0,然后由抽样结果对假设H0是否成立进行推断。在数理统计学中,称检验假设H0的方法为假设检验。5在假设检验中,通常把那个需要我们去检验是否为真的假设H0称为原假设或者零假设。如例1中的假设H0:p4%,例2中的假设H0:EX=570,等等。例1,例2是对总体参数的假设进行判断,这类问题称为参数的假设检验。6检验假设的依据是“小概率事件在一次试验中实际上是不可能发生”原理(概率论中称它为实际推断原理).它是指这样一个信念:概率很小的事件在一次实际试验中是不可能发生的。如果发生了,人们宁愿认为该事件的前提条件起了变化。2.假设检验的基本思想7假设检验的基本思想...因此我们拒绝假设=50...如果这是总体的假设均值样本均值=50抽样分布H0这个值不像我们应该得到的样本均值...209总体假设检验的过程抽取随机样本均值x=20我认为人口的平均年龄是50岁提出假设拒绝假设别无选择!作出决策10假设检验所以可行,其理论背景为实际推断原理,即“小概率原理”假设检验的内容参数检验非参数检验总体均值、均值差的检验总体方差、方差比的检验分布拟合检验符号检验等假设检验的理论依据11某厂生产的螺钉,按标准强度为68克/mm2,而实际生产的螺钉强度X服从N(,3.62).若E(X)==68,则认为这批螺钉符合要求,否则认为不符合要求.为此提出如下假设:H0:=68称为原假设或零假设原假设的对立面:H1:68称为备择假设现从该厂生产的螺钉中抽取容量为36的样本,其样本均值为,问原假设是否正确?5.68x引例12若原假设正确,则23.6~(68,)36XN68~(0,1)3.66XN故取较大值是小概率事件683.66X因而,即偏离68不应该太远,是小概率事件,偏离较远由于()68EXX13规定为小概率事件的概率大小,通常取=0.05,0.01,…例如,取=0.05,则96.1025.0112zzc因此,可以确定一个常数c,使得683.66XPc14由(,66.824)与(69.18,+)为检验的拒绝域而区间681.963.66X69.1866.824XX或现落入接受域,则接受原假设H0:=6868.5x为检验的接受域(实际上没理由拒绝),称的取值区间(66.824,69.18)X15显著性水平和拒绝域(双侧检验)0临界值临界值/2/2样本统计量拒绝H0拒绝H0抽样分布1-置信水平16显著性水平和拒绝域(双侧检验)0临界值临界值/2/2样本统计量拒绝H0拒绝H0抽样分布1-置信水平17显著性水平和拒绝域(双侧检验)0临界值临界值/2/2样本统计量拒绝H0拒绝H0抽样分布1-置信水平18由引例可见,在给定的前提下,接受还是拒绝原假设完全取决于样本值,因此所作检验可能导致以下两类错误的产生:第一类错误弃真错误第二类错误取伪错误19H0为真H0为假真实情况所作判断接受H0拒绝H0正确正确第一类错误(弃真)第二类错误(取伪)假设检验的两类错误犯第一类错误的概率通常记为犯第二类错误的概率通常记为20H0:无罪假设检验中的两类错误(决策结果)陪审团审判裁决实际情况无罪有罪无罪正确错误有罪错误正确H0检验决策实际情况H0为真H0为假未拒绝H0正确决策(1–)第Ⅱ类错误()拒绝H0第Ⅰ类错误()正确决策(1-)假设检验就好像一场审判过程统计检验过程错误和错误的关系你不能同时减少两类错误!和的关系就像翘翘板,小就大,大就小22希望所用的检验方法尽量少犯错误,但不能完全排除犯错误的可能性.在样本的容量给定的情形下,不可能使两者都很小,降低一个,往往使另一个增大.假设检验的指导思想是:控制犯第一类错误的概率不超过,然后,若有必要,通过增大样本容量的方法,减少.23所以,拒绝H0的概率为,又称为显著性水平,越大,犯第一类错误的概率越大,即越显著.本引例中犯第一类错误的概率=P(拒绝H0|H0为真)(66.82469.18)PXX0.05若H0为真,则23.6~(68,)36XN246062.56567.57072.5750.020.040.060.080.10.1267.57072.57577.58082.50.020.040.060.080.10.12/2/2H0真H0不真25一般,作假设检验时,先控制犯第一类错误的概率,在保证的条件下使尽量地小.要降低一般要增大样本容量.本课程仅考虑控制.备择假设可以是单侧的,也可以是双侧的.引例中的备择假设是双侧的.如果根据以往的生产情况,0=68.现采用了新工艺,关心的是新工艺能否提高螺钉强度,越大越好.此时,可作如下的假设检验:注1º注2º26右侧检验:原假设H0:=68;备择假设H1:68当原假设H0:=0=68为真时,取较大值的概率较小0X当备择假设H1:68为真时,取较大值的概率较大0X给定显著性水平,根据01XPzn可确定拒绝域01(,)xzn27因而,接受域称这种检验为右侧检验.原假设H0:=0=68备择假设H1:68左侧检验01(,)xzn类似可确定拒绝域0(,)xzn因而,接受域0(,+)xzn28显著性水平和拒绝域(左侧检验)0临界值样本统计量拒绝H0抽样分布1-置信水平观察到的样本统计量29显著性水平和拒绝域(左侧检验)0临界值样本统计量拒绝H0抽样分布1-置信水平30显著性水平和拒绝域(右侧检验)0临界值样本统计量拒绝H0抽样分布1-观察到的样本统计量置信水平31显著性水平和拒绝域(右侧检验)0临界值样本统计量抽样分布1-置信水平拒绝H032关于零假设与备择假设的选取H0与H1地位应平等,但在控制犯第一类错误的概率的原则下,使得采取拒绝H0的决策变得较慎重,即H0得到特别的保护.因而,通常把有把握的、有经验的结论作为原假设,或者尽可能使后果严重的错误成为第一类错误.注3º33假设检验的步骤根据实际问题所关心的内容,建立原假设H0与备择假设H1在H0为真时,选择一个合适的检验统计量V,它的分布是已知的,由H1确定拒绝域的形式给定显著性水平,对应的拒绝域双侧检验221()()VVVV右边检验1()VV左边检验()VV其中1()PVV34第二节正态总体均值和方差的假设检验一.设X~N(,2),而2为已知.U检验(1)已知2.待检验的假设:H0:=0,检验水平:(给定的小量)----双边检验第一步提出假设H0:=0(原假设);H1:0(备选假设).第二步构建检验统计量)0~0,1/XUNn35第三步确定拒绝域222111{||}(,)(,)PUzuzz第四步由样本提供的信息计算出u的值,并对H0的正确性进行推断.0/xun若则拒绝原假设(H0伪)若则接受原假设(H0真)21||uz21||uz第五步给出结论假设检验统计量拒绝域推断结论36例1我国健康成年男子的脉搏平均为72次/分,标准差为6.4次/分,现从某体院男生中,随机抽出25人,测得平均脉搏为68.6次/分.根据经验脉搏X服从正态分布.如果标准差不变,试问该体院男生的脉搏与一般健康成年男子的脉搏有无差异?并求出体院男生脉搏的置信区间.)05.0解:此例是在已知=6.4的情况下,0~(0,1)/xUNn第二步统计量第一步检验假设H0:=72,370068.672||2.6566.4/5xun对于=0.05,查标准正态分布表得96.1975.021zz因为|u0|=2.6561.96,故拒绝H0.第三步确定拒绝域拒绝域:|u|1.96第五步结论该体院男生的脉搏与一般健康成年男子的脉搏存在差异。第四步现在n=25,=68.6,x由于126.468.61.9666.125xzn126.468.61.9671.125xzn所以,该体院男生脉搏的95%的置信区间为[66.1,71.1]。39H0原假设;H1备选假设第一步提出假设H0:=0(原假设);H1:0(备选假设).第二步构建检验统计量)0~0,1/XUNn(2)(右边检验)H0:=0;H1:0,此时样本信息显示0x第三步确定拒绝域11{}(,)PUzuz第四步由样本提供的信息计算出的值,并对H0的正确性进行推断.0/xun若则拒绝原假设(H0伪)若则接受原假设(H0真)1uz1uz第五步给出结论类似可以由左边检验。相应的拒绝域形式为11{}(,)PUzuz例2已知某零件的质量X~N(,2),由经验知=10g,2=0.05.技术改新后,抽取8个样品,测得质量(单位:g)为9.8,9.5,10.1,9.6,10.2,10.1,9.8,10.0,若方差不变,问平均质量是否比10为小?(取=0.05)解本例是一个左边检验问题,检验假设:01:10;:10HH选取统计量0/xUn42645.195.01zz由样本值计算出9.9x计算nxU/10的试验值并比较查标准正态分布表得10645.126.11005.0109.9/10znxu故接受假设10:0H在H0为真的条件下10~(0,1)/xUNn43作业•习题九344