第四章假设检验参数估计与假设检验的关系:参数估计和假设检验是推断统计方法的两个重要组成部分。共同点:都是利用样本信息对总体数量特征进行推断。不同点:推断的角度不同4.1假设检验的基本问题1、假设检验——是指先对总体的参数或分布形式提出某种假设,然后利用样本信息判断假设是否成立的过程;包括参数检验和非参数检验;逻辑上运用的是概率反证法;统计依据为小概率原理。2、小概率事件——若事件A发生的概率P(A)很小很小或接近于0。一般在假设检验中,通常要求P(A)≤0.05。3、原假设——又称零假设,是指研究者想收集证据予以反对的假设,表示为H0。总是有符号、或备择假设——也称研究假设,是指研究者想收集证据予以支持的假设,表示为H1。总是有符号、或4、原假设和备择假设是一个完备事件组,而且相互对立。在一项假设检验中,原假设和备择假设必有一个成立,而且只有一个成立;先确定备择假设,再确定原假设。因为备择假设大多是人们关心并想予以支持和证实的,一般比较清楚和容易确定;等号“=”总是放在原假设上;因研究目的不同,对同一问题可能提出不同的假设,也可能得出不同的结论。假设检验主要是搜集证据来推翻和拒绝原假设。5、双侧检验——是指备择假设没有特定的方向性,并含有符号的假设检验,又称为双尾检验。单侧检验——是指备择假设具有特定的方向性,并含有符号或的假设检验,又称为单尾检验。备择假设的方向为,称为左侧检验备择假设的方向为,称为右侧检验假设双侧检验单侧检验左侧检验右侧检验原假设H0:m=m0H0:mm0H0:mm0备择假设H1:m≠m0H1:mm0H1:mm06、第Ⅰ类错误(弃真错误)原假设为真时拒绝原假设。第Ⅰ类错误的概率记为α,又被称为显著性水平。又称为显著性水平,常被用于检验结论的可靠性度量;既是一个概率值;又是抽样分布拒绝域面积的大小(表示犯第Ⅰ类错误概率的最大允许值);常用的值有0.01,0.05,0.10;由研究者事先确定。第Ⅱ类错误(取伪错误)原假设为假时未拒绝原假设。第Ⅱ类错误的概率记为β。确定了显著性水平就等于控制了第Ⅰ类错误的概率,但犯第Ⅱ类错误概率的具体数值却很难确定,其受影响因素包括:随假设总体参数的减少而增大;当减少时增大;当增大时增大;当n减少时增大。7、检验统计量——是指根据样本观测结果计算得到的,并据以对原假设和备择假设作出决策的某个样本统计量。标准化的检验统计量可表示为:点估计量的抽样标准差假设值点估计量标准化检验统计量8、拒绝域——是指能够拒绝原假设的统计量的所有可能取值构成的集合。大小等于显著性水平。位置取决于检验是单侧还是双侧。双侧拒绝域在分布两侧;单侧拒绝域在左侧或右侧。临界值——根据给定的显著性水平确定的拒绝域的边界值。9、决策步骤①给定显著性水平,查表得出相应的临界值z或z/2,t或t/2②将计算出的检验统计量的值与临界值比较③作出决策双侧检验:|统计量|临界值,拒绝H0左侧检验:统计量-临界值,拒绝H0右侧检验:统计量临界值,拒绝H010、利用p值进行决策p值——又称为观察到的显著性水平,在原假设为真的条件下,所得到的样本结果会像实际观测结果那么极端或更极端的概率。α是指原假设正确时被拒绝的概率,或拒绝原假设犯错误的最大允许值;p值与原假设的对或错的概率无关,它是关于数据的概率。如果原假设正确,p值表示这样的观测数据会有多么的不可能得到。或是犯错误的实际概率。不论是单侧检验还是双侧检验,用p值进行决策的规则:若p值,拒绝H0若p值,不拒绝H0p值反映实际观测到的数据与原假设H0之间不一致的程度的一个概率值。p值越小,说明实际观测到的数据与原假设H0之间不一致的程度就越大,检验的结果也就越显著。11、假设检验步骤(1)、提出原假设和备择假设;(2)、确定一个适当的检验统计量,并利用样本数据算出其具体数值;(3)、根据显著性水平,计算出其临界值,指定拒绝域;(4)、将统计量的值与临界值进行比较,作出决策。统计量的值落在拒绝域,拒绝H0,否则不拒绝H0也可以直接利用p值作出决策4.2一个正态总体的检验一、总体均值的检验1、总体方差已知的检验当总体方差已知的情况,无论样本是大样本,还是小样本时,都使用z检验统计量。)1,0(~0Nnxz【例1】某厂生产铜丝,其主要质量指标为折断力X,根据历史资料统计,可假定X∼N(570,82)。今新换材料生产,抽取30个样本值为:577、578、579、569、565、577、568、587、578、572、570、568、572、581、582、569、570、570、572、596、584,598、588、563、577、587、567、587欲检验新材料生产的铜丝的折断力X有无明显变化。假定方差σ2=82保持不变,α=0.05【解】此题为正态总体均值的假设检验H0:µ=570H1:µ≠570由于铜丝折断力X为大样本且总体方差已知,故可以采用Z检验法。依题意,样本均值为:4.53830587567...578577nxx检验统计量64.2146.16.313085704.5380nxZα=0.05,查表得Zα/2=1.96检验统计量|Z|=21.64Zα/2=1.96所以应拒绝H0,表明新材料生产的铜丝的折断力X有明显的变化。【练习1】完成生产线上某件工作所需的平均时间不少于15.5分钟,标准差为3分钟,对随机抽选的36名职工讲授一种新方法,训练期结束后这36名职工完成此项工作所需的平均时间为13.5分钟,这个结果是否提供了充分证据,说明用新方法所需的时间短?设α=0.05,并假定完成这件工作的时间服从正态分布。解:H0:µ≥15.5H1:µ15.5由于大样本且总体方差已知,故采用Z检验法。依题意已知:336n5.13x检验统计量43635.155.130nxZα=0.05,临界值Zα=1.645Z=-4-Zα=-1.645,所以拒绝原假设H0,表明有充分的证据说明用新方法所需的时间更短。总体方差已知,检验方法的总结假设双侧检验左侧检验右侧检验假设形式H0:m=m0H1:mm0H0:mm0H1:mm0H0:mm0H1:mm0统计量无论样本容量大小nxz0拒绝域2/zzzzzzP值决策P拒绝H02、总体方差未知的检验总体服从正态分布,但总体方差未知时,样本容量的大小决定了所用的检验统计量,大样本)1,0(~0Nnsxz小样本)1(~0ntnsxt【例2】某车床加工一种零件,要求其长度为150mm,现从一批加工后的这种零件中随机抽取9个,测得其长度为:147、150、149、154、152、153、148、151、155如果零件长度服从正态分布,问这批零件是否合格?(α=0.05)【解】所要检验的假设为:H0:μ=150H1:μ≠150根据题中数据,计算样本均值和样本标准差分别为:739.2151sx,又知n=930,属于小样本,故应采用t检验法095.19739.21501510nSxt当α=0.05时,查表得306.212nt因为:306.21095.1||2ntt所以不拒绝原假设H0,可以认为该批零件是合格的。【练习3】某公司年度报表指出其应收账款的平均计算误差不超过50元,审计师从该公司年度应收账款账户中随机抽取16笔进行调查,测得应收账款的平均计算误差为56元,标准差为8元。假定应收账款的平均计算误差服从正态分布。问:当检验水平α=0.01时,该公司应收账款的平均计算误差是否超过50元?解:所要检验的假设为:H0:µ≤50H1:µ50依题意:856sx,又知总体服从正态分布,总体方差σ²未知,且n=1630属于小样本,故采用t检验法。检验统计量316850560nSxt当α=0.01时,查t分布表得6025.2116101.0ttn因为:6025.213ntt所以应拒绝H0,可以认为该公司应收账款的平均计算误差超过50元。【练习4】某番茄罐头中,维生素C的含量X服从正态分布,按规定标准,维生素C的含量不得少于21mg。现从一批罐头中随机抽取49罐,测得样本均值为23mg,样本标准差为3.98,试问该批罐头中维生素C的含量是否合乎标准?(α=0.05)【解】此题属于正态总体、总体方差未知且大样本(n=4930),故采用Z检验法。所要检验的假设为:H0:µ≥21H1:µ21检验统计量Z的计算如下:52.34998.321230nSxZ当α=0.05时,查Z分布表得出临界值为:645.1Z因为:645.152.3ZZ所以不拒绝H0,可以认为该批罐头中维生素C的含量合乎标准总体方差未知检验方法小结假设双侧检验左侧检验右侧检验假设形式H0:m=m0H1:mm0H0:mm0H1:mm0H0:mm0H1:mm0统计量大样本nsxz0小样本nsxt0拒绝域)1(2/ntt)1(ntt)1(nttP值决策P拒绝H0二、总体比率的检验根据抽样分布知识,在大样本情况下,总体比例可用正态分布来近似。检验可用z统计量)1,0(~)1(000Nnpz【例3】某公司经理希望估计一下其所在城市居民参加财产保险的比例。业务科长认为大约有80%的居民参加了财产保险,而统计科统计人员随机调查了150户居民了解到有70%的居民参加了财产保险。经理希望在α=0.05的显著性水平下检验一下业务科长的说法是否可信?依题意,可建立如下假设H0:π=0.8H1:π≠0.8又知样本比例p=0.7,n=10530,属于大样本,故采用Z检验法。检验统计量为:06.303266.01.01502.08.08.07.01000npZα=0.05,查表得出临界值96.12Z因为96.106.32ZZ所以应拒绝H0,由此可以判定业务科长的说法不可信,即参加保险的户数不足80%。【练习5】某生产商向供应商购一批西红柿,双方规定若优质西红柿的比例在40%及以上按一般市场价格收购,否则按低于市场价格收购。现随机抽取了100个西红柿,只有34个为优质品。于是,生产商欲按低于市场价格收购,而供应商则认为样本比例不足40%是由随机因素引起的。请用α=0.05进行检验并加以说明。依题意,可建立如下假设H0:P≥0.4H1:P0.4又知样本比例p=0.7,n=15030,属于大样本,故采用Z检验法。检验统计量为:22.104899.006.01006.04.04.034.01000npZ当α=0.05时,查表得出左侧检验临界值:645.1Z因为:645.122.1ZZ所以不拒绝原假设H0,即根据样本数据还不能认为优质西红柿的比例显著地低于40%,故而生产商仍应按一般市场价格收购。大样本总体比例的检验小结假设双侧检验左侧检验右侧检验假设形式H0:=0H1:0H0:0H1:0H0:0H1:0统计量npz)1(000拒绝域P值决策拒绝H0三、总体方差的检验通常假设总体近似服从正态分布,使用2分布。其检验统计量为:)1(~)1(22022nsn【例4】已知某种零件的尺寸服从N(23.02,1.52)现从这批零件中任取7件进行测量,测得尺寸数据(单位:mm)如下:21.0022.0422.3224.0124.6825.0221.63能否认为该批零件的方差是否和以往一样?(α=0.05)依题意可归结为以下假设:H0:σ²=1.52H1:σ²≠1.52,由于总体服从正态分布,采用χ²检验。又知5331.22s2/zzzzzzP检验统计量为:7549.65.15331.2)17()1(22022