1概率论与数理统计福建师范大学福清分校数计系2第八章假设检验第1讲3假设检验的基本概念若对参数有所了解但有怀疑猜测需要证实之时用假设检验的方法来处理若对参数一无所知用参数估计的方法处理4假设检验是指施加于一个或多个总体的概率分布或参数的假设.所作假设可以是正确的,也可以是错误的.为判断所作的假设是否正确,从总体中抽取样本,根据样本的取值,按一定原则进行检验,然后作出接受或拒绝所作假设的决定.何为假设检验?5假设检验所以可行,其理论背景为实际推断原理,即“小概率原理”假设检验的内容参数检验非参数检验总体均值,均值差的检验总体方差,方差比的检验分布拟合检验符号检验秩和检验假设检验的理论依据6引例某产品出厂检验规定:次品率p不超过4%才能出厂.现从一万件产品中任意抽查12件发现3件次品,问该批产品能否出厂?若抽查结果发现1件次品,问能否出厂?01.00097.0)1()3(9331212ppCP代入04.0p解假设0.04,p04.0p这是小概率事件,一般在一次试验中是不会发生的,现一次试验竟然发生,故认为原假设不成立,即该批产品次品率,则该批产品不能出厂.7这不是小概率事件,没理由拒绝原假设,从而接受原假设,即该批产品可以出厂.3.0306.0)1()1(11111212ppCP若不用假设检验,按理不能出厂.注104.0083.012/1直接算注2本检验方法是概率意义下的反证法,故拒绝原假设是有说服力的,而接受原假设是没有说服力的.因此应把希望否定的假设作为原假设.8对总体提出假设1~(;)(1),0,1xxXfxpppx04.0:;04.0:10pHpH要求利用样本观察值)13(121orxii对提供的信息作出接受(可出厂),还是接受(不准出厂)的判断.0H1H),,,(1221xxx出厂检验问题的数学模型9§1假设检验10统计推断的另一类重要问题是假设检验问题.在总体的分布函数完全未知或只知其形式,但不知道参数的情况,为了推断总体的某些未知特性,提出某些关于总体的假设.例如,提出总体服从泊松分布的假设,又如,对正态总体提出数学期望等于m0的假设等.我们是要根据样本对所提出的假设作出是接受,还是拒绝的决策.假设检验是作出这一决策的过程.11例1某车间用一台包装机包装葡萄糖.包得的袋装糖重是一个随机变量,它服从正态分布.当机器正常时,其均值为0.5公斤,标准差为0.015公斤.某日开工后为检验包装机是否正常,随机地抽取它所包装的糖9袋,称得净重为(公斤):0.497,0.506,0.518,0.524,0.498,0.511,0.520,0.515,0.512问机器是否正常?12以m,s分别表示这一天袋装糖重总体X的均值和标准差.由于长期实践表明标准差比较稳定,就设s=0.015.于是X~N(m,0.0152),这里m未知.问题是根据样本值来判断m=0.5还是m0.5.为此,我们提出两个相互对立的假设H0:m=m0=0.5和H1:m0.5.然后给一个合理的法则,利用已知样本作出是接受假设H0,还是接受假设H1.如果接受H0,则认为机器工作正常,否则不正常.13由于要检验的假设涉及总体均值m,故首先想到是否可借助样本均值`X这一统计量来进行判断.`X是m的无偏估计,其观察值的大小在一定程度上反映m的大小.如果假设H0为真,则观察值`x与m0的偏差|`xm0|一般不应太大.若|`xm|过分大,就怀疑假设H0的正确性而拒XHHNnxxnmsmms00000,~(0,1),||.绝考虑到当为真时而衡量的大小可归结为衡量的大小14因此,可适当选定一正数k,使当观察值`x满足00||,.就接受假设xkHnms000000{}{}{}.当为真拒绝或拒绝或拒绝HPHHPHPHmm然而,因为决策的依据是样本,当实际上H0为真时仍可能做出拒绝H0的决策(这种可能性是无法消除的),这是一种错误,犯这种错误的概率记为15因无法排除犯这类错误的可能性,因此自然希望将犯这类错误的概率控制在一定的限度之类.即给出一个较小的数a(0a1),使犯这类错误的概率不超过a,即使得P{当H0为真拒绝H0}a.(1.1)0,.为确定常数考虑统计量由于只允许Xknms0000{}.当为真拒绝XPHHPknmmas犯这类错误的概率最大为a,令(1.1)式取等号,16态分布分位点的定义得:k=za/2.000000{}.,~(0,1),当为真拒绝由于当为真时由标准正XPHHPknXHZNnmmasms0a/2za/2a/2za/217因而,若Z的观察值满足,||2/0asmzknxz则拒绝H0,而若,||2/0asmzknxz则接受H018例如,在本例中取a=0.05,则有k=z0.05/2=z0.025=1.96,又已知n=9,s=0.015,再由样本算得`x=0.511,即有,96.12.29015.05.0511.00nxsm于是拒绝H0,认为这天包装机工作不正常.19上例中所采用的检验法则是符合实际推断原理的.因通常a总是取得较小,一般取a=0.01,0.05.因而若H0为真,即当m=m0时,02/,ams是一个小概率事件根据实际推Xzn02/,ams几乎是不会发生的现在居然发生xzn断原理,就可以认为,如果H0为真,则由一次试验得到的观察值`x,满足不等式了,则我们有理由怀疑H0为假,拒绝H0.20上例中,当样本容量固定时,选定a后,可确定0,数然后按照统计量的观察值的XkZnms绝对值|z|大于等于k还是小于k来作出决策.数k是检验上述假设的一个门槛值.如果|z|k,则称`x与m0的差异是显著的,这时拒绝H0;反之,如果|z|k,则称`x与m0的差异是不显著的,这时接受H0.数a称为显著性水平,上面关于`x与m0有无显著差异的判断是在显著性水平a之下作出的.统计量Z称为检验统计量.21前面的检验问题常叙述成:在显著性水平a下,检验假设H0:m=m0,H1:mm0.(1.2)也常说成在显著性水平a下,针对H1,检验H0.H0称为原假设或零假设,H1称为备择假设.要进行的工作是,根据样本,按上述检验方法作出决策,在H0与H1中择其一.当检验统计量取某个区域C中的值时,我们拒绝原假设H0,则C称为拒绝域,拒绝域的边界点称为临界点,如上例中拒绝域为|z|za/2,而zza/2,z=za/2为临界点.22由于检验法则是根据样本作出的,总有可能作出错误的决策.如上面所说,在假设H0实际上为真时,可能犯拒绝H0的错误,称这类弃真错误为第I类错误.又当H0实际上不真时,也有可能接受H0.称这类取伪错误为第II类错误.犯第II类错误的概率记为}.{}{0001HPHHPH接受或不真接受当m23一般来说,当样本容量固定时,若减少犯一类错误的概率,则犯有另一类错误的概率往往增大.一般来说,总是控制第I类错误的概率,使它不大于a,a的大小视具体情况而定,通常a取0.1,0.05,0.01,0.005等值.这种只对犯第I类错误的概率加以控制,而不考虑犯第II类错误的概率的检验,称为显著性检验.形如(1.2)式中的备择假设H1,表示m1可能大于也可能小于m0,称为双边备择假设,而称形如(1.2)式的假设检验为双边假设检验.24有时只关心总体均值是否增大.例如试验新工艺以提高材料的强度.这时,所考虑的总体的均值应该越大越好.此时,我们需要检验假设H0:mm0,H1:mm0.(1.3)形如(1.3)的假设检验,称为右边检验.类似地,有时需要检验假设H0:mm0,H1:mm0.(1.4)形如(1.4)的假设检验,称为左边检验.右边检验和左边检验统称为单边检验.25下面讨论单边检验的拒绝域.设总体X~N(m,s2),s为已知,X1,X2,...,Xn是来自X的样本.给定显著性水平a.来求检验问题H0:mm0,H1:mm0(1.3)的拒绝域.因H0中的全部m都比H1中的m要小,当H1为真时,观察值`x往往偏大,因此,拒绝域的形式为`xk(k是某一正常数).26下面来确定常数knknXPnknXPkXPHHPHsmsmsmsmmmmmm00000000}{}{为真拒绝当)5.1(.00asmsmmmnknXP令27)6.1(.,,),1,0(~)5.1(.000000aaaammsmsmsmsmsmasmsmznxzznxznkznkNnXnknXP即即拒绝域为由上式得到由于28)6.1(.0asmznxz0aza29类似地,可得左边检验问题H0:mm0,H1:mm0(1.4)的拒绝域为)7.1(0asmznxz30例2公司从生产商购买牛奶.公司怀疑生产商在牛奶中掺水以谋利.通过测定牛奶冰点,可以检验出牛奶是否掺水.天然牛奶的冰点温度近似服从正态分布,均值μ1=-0.545oC,标准差σ=0.008oC.牛奶掺水可使冰点温度升高而接近于水的冰点温度(0oC).测得生产商提交的5批牛奶的冰点温度,其均值为=-0.535oC,问是否可以认为生产商在牛奶中掺了水?取α=0.05x310010:0.545:HHmmmm解:假设0~0,1xzNnms取检验统计量0.051.645z查表得0.051.645zz则拒绝域为0.5350.5452.79511.6450.0085z现在观察值0Ha落入拒绝域,所以在显著性水平=0.05下拒绝原假设即认为牛奶商在牛奶中掺了水。32例3某工厂生产的固体燃料推进器的燃烧率服从正态分布N(m,s2),m=40cm/s,s=2cm/s.现在用新方法生产了一批推进器.从中随机取n=25只,测得燃烧率的样本均值为`x=41.25cm/s.设在新方法下总体均方差仍为2cm/s,问用新方法生产的推进器的燃烧率是否较以往生产的推进器的燃烧率有显著的提高?取显著性水平a=0.05.33解按题意需检验假设H0:mm0=40(假设新方法没有提高燃烧率),H1:mm0(假设新方法提高了燃烧率).这是右边检验问题,其拒绝域如(1.6)式所示,645.1125.32524025.41.645.105.00zznxz而现在smz的值落在拒绝域中,所以在显著性水平a=0.05下拒绝H0,认为新法的燃烧率有显著提高.34综上所述,处理参数的假设检验问题步骤为:1.根据实际问题的要求,提出原假设H0及备择假设H1;2.给定显著性水平a以及样本容量n;3.确定检验统计量以及拒绝域的形式;4.按P{当H0为真拒绝H0}a求出拒绝域;5.取样,根据样本观察值作出决策,是接受H0还是拒绝H0.35§2正态总体均值的假设检验36(一)单个总体N(m,s2)均值m的检验1,s2已知,关于m的检验(Z检验)在§1中已讨论过正态总体N(m,s2)当s2已知时关于m的检验问题(1.2),(1.3),(1.4).在这些检验问题中,我们都是利用统计量.0来确定拒绝域的nXZsm这种检验法常称为Z检验法.37mm0mm0mm0mm0mm0mm02UzaUzaUzaZ检验法(s2已知)原假设H0备择假设H1检验统计量及其H0为真时的分布拒绝域nXU/0sm)1,0(~N382,s2未知,关于m的检验(t检验)设总体X~N(m,s2),其中m,s2未知,我们来求检验问题H0:m=m0,H1:mm0的拒绝域(显著性水平为a).设X1,X2,...,Xn是来自总体X的样本,由于s2未,.Xnms知现在不能利用来确定拒绝域了注意.0作为检验统计量nSXtm到S2是s2的无偏估计,我们用S来代替s,采用39域的形式为拒绝过分大时就拒绝当观察值,||0Hnsxtm.||0knsxt