5-1第五章假设检验第一节假设检验概述第二节总体参数检验第三节非参数检验5-2第一节假设检验概述一、假设检验的基本概念假设检验是统计推断的另一种方式,它与区间估计的差别主要在于:区间估计是用给定的大概率推断出总体参数的范围,而假设检验是以小概率为标准,对总体的状况所做出的假设进行判断。假设检验与区间估计结合起来,构成完整的统计推断内容。假设检验分为两类:一类是参数假设检验,另一类是非参数假设检验。本章分别讨论这两类检验方法。5-3小概率原理:即指概率很小的事件在一次试验中实际上不可能出现。这种事件称为“实际不可能事件”。5-4例1:消费者协会接到消费者投诉,指控品牌纸包装饮料存在容量不足,有欺骗消费者之嫌。包装上标明的容量为250毫升。消费者协会从市场上随机抽取50盒该品牌纸包装饮品,测试发现平均含量为248毫升,小于250毫升。这是生产中正常的波动,还是厂商的有意行为?消费者协会能否根据该样本数据,判定饮料厂商欺骗了消费者呢?5-5消费者协会实际要进行的是一项统计检验工作。检验总体平均=250是否成立。这就是一个原假设(nullhypothesis),通常用表示,即::=2500H0H5-6与原假设对立的是备选假设(alternativehypothesis),备选假设是在原假设被否定时另一种可能成立的结论。备选假设比原假设还重要,这要由实际问题来确定,一般把期望出现的结论作为备选假设。1H5-7构造一个统计量来决定是“接受原假设,拒绝备选假设”,还是“拒绝原假设,接受备选假设”。对不同的问题,要选择不同的检验统计量。检验统计量确定后,就要利用该统计的分布以及由实际问题中所确定的显著性水平,来进一步确定检验统计量拒绝原假设的取值范围,即拒绝域。在给定的显著性水平α下,检验统计量的可能取值范围被分成两部分:小概率区域与大概率区域。小概率区域就是概率不超过显著性水平α的区域,是原假设的拒绝区域;大概率区域是概率为1-α的区域,是原假设的接受区域。5-8二、两种类型的错误接受拒绝真实判断正确弃真错误(第一类错误或α错误)不真实取伪错误(第二类错误或β错误)判断正确0H0H0H0H5-9三、检验功效在犯第一类错误概率得到控制的条件下,犯取伪错误的概率也要尽可能地小,或者说,不取伪的概率1-β应尽可能增大。1-β越大,意味着当原假设不真实时,检验判断出原假设不真实的概率越大,检验的判别能力就越好;1-β越小,意味着当原假设不真实时,检验结论判断出原假设不真实的概率越小,检验的判别能力就越差。可见1-β是反映统计检验判别能力大小的重要标志,我们称之为检验功效或检验力。5-10第二节总体参数检验一、单侧检验与双侧检验α/21–αα/2-Zα/2Zα/2α–Zα0α0Zα双侧检验左侧检验右侧检验5-11用单侧检验还是双侧检验,使用左侧检验还是右侧检验,决定于备选假设中的不等式形式与方向。与“不相等”对应的是双侧检验,与“小于”相对应的是左侧检验,与“大于”相对应的是右侧检验。5-12二、参数检验参数检验都是先对样本所属总体的性质作出若干的假定,或对总体的分布形状加以限定,然后对总体的有关参数情况进行统计假设检验。因此,参数检验又称为限定分布检验。如在总体服从正态分布条件下,对其均值进行检验。下面通过具体例子来说明参数检验方法。5-13在例1中,按历史资料,总体的标准差是4毫升。我们通过检验总体均值是否等于250毫升,来判断饮料厂商是否欺骗了消费者。程序如下:5-14第一步:确定原假设与备选假设。:=250;:250以上的备选假设是总体均值小于250毫升,因为消费者协会希望通过样本数据推断出厂商的欺骗行为(大于250毫升一般不会发生)。因此使用左侧检验。0H1H5-15第二步:构造出检验统计量。我们知道,如果总体的标准差已知,则正态总体(正常情况下,生产饮料的容量服从正态分布)的抽样平均数,也服从正态分布,对它进行标准化变换,可得到:可用z作为检验统计量。1,0~0NnXz5-16第三步:确定显著性水平,确定拒绝域。通常显著水平由实际问题确定,我们这里取α=0.05,左侧检验,拒绝域安排在左边,查标准正态分布表得临界值:-=-1.645,拒绝域是z-1.645。z5-17第四步:计算检验统计量的数值。样本平均数,n=50,代入检验统计量得:248X645.154.35042502480nXz5-18第五步:判断。检验统计量的样本取值落入拒绝域。拒绝原假设,接受备选假设,认为有足够的证据说明该种纸包饮料的平均容量小于包装盒上注明的250毫升,厂商有欺诈之嫌。5-19总体标准差未知时对总体均值检验经常用t统计量:但是,在大样本场合(样本容量n大于30时),t-统计量与标准正态分布统计量近似,通常用z检验代替t检验。)1(~0ntnsXt5-20总体成数的检验当样本容量较大时,下列统计量服从标准正态分布:上式中,ρ代表总体的成数,p代表样本的成数。以上的z统计量可以用作总体成数检验的检验统计量。1pzn5-21例2:某企业声明有30%以上的消费者对其产品质量满意。如果随机调查600名消费者,表示对该企业产品满意的有220人。试在显著性水平α=0.05下,检验调查结果是否支持企业的自我声明。5-22解:第一步:作出假设。:ρ=30%,:ρ30%。以上的备选假设是企业自我声明的结论,我们希望该企业说的是实话。因此使用右侧检验。0H1H5-23第二步:构造z检验统计量。第三步:确定拒绝域。显著水平α=0.05,查标准正态分布表得临界值:=1.645,拒绝域是z1.645。z5-24第四步:计算检验统计量的数值。样本成数p=220/600=0.37,总体假设的成数ρ=0.3,代入z检验统计量得:0.370.33.510.310.3/600pzn5-25第五步:判断。检验统计量的样本取值z=3.51.645,落入拒绝域。拒绝原假设,接受备选假设,认为样本数据证明该企业声明属实。5-26三、p-值检验p-值检验就是通过计算p-值,再将它与显著性水平α作比较,决定拒绝还是接受原假设。所谓p-值就是拒绝原假设所需的最低显著性水平。p-值判断的原则是:如果p-值小于给定的显著性水平α,则拒绝原假设;否则,接受原假设。或者,更直观来说就是:如果p-值很小,拒绝原假设,p-值很大,接受原假设。请大家注意的是这里的p-值是指概率,不要与成数指标相混淆。5-27z检验的p-值:检验统计量为z统计量的p-值计算公式,表示检验统计量的抽样数据,则p-值的计算方法如下:如果:,p-值=2如果:,p-值=如果:,p-值=0z1H1H1H0000zzp0zzp0zzp5-28例3:利用p-值检验重新检验例1。解:第一、第二步与例1完全相同,故省略之。第三步:计算样本统计的数值。样本平均数,n=50,代入检验统计量得:248X54.350425024800nXz5-29第四步:计算p-值。使用左侧检验,p-值=。查标准正态分布表得:p-值=[1-F(3.54)]/2=(1-0.9998)/2=0.00010zzp5-30第五步:判断。p-值小于给出的显著性水平(0.05),拒绝原假设,接受备选假设,与例1的结论相同。5-31第三节非参数检验非参数检验是对总体的分布不作任何限制的统计检验。故非参数检验又称为自由分布检验。正因为如此,非参数检验成为管理科学中应用较为广泛的一种统计检验方法。5-32一、自由分布检验概述自由分布检验对比参数检验,具有以下优点:首先,检验条件比较宽松,适应性强。其次,自由分布检验的方法比较灵活,用途广泛。对于那些不能进行加、减、乘、除运算的定类数据与定序数据,可使用符号检验、秩和检验等方法进行检验。再次,自由分布检验的计算相对简单。由于自由分布的检验方法不用复杂计算,一般使用计数方法就可以了,它的计数过程与结果都比较简单、直观与明显。5-33自由分布检验缺点:由于它对原始数据中包含的信息利用得不够充分,检验的功效相对较弱。当总体的分布形式已知时,基于这种分布类型的参数方法,一般说来比非参数方法为佳。例如,对于一批资料,可同时适用于参数的t-检验、非参数的符秩检验和符号检验。其检验功效是,t-检验的最好,符秩检验次之,符号检验最差。这主要是由于符号检验对信息的利用最不充分。5-34二、符号检验该方法是建立在以正、负号表示样本数据与假设参数值差异关系基础上的,因此称之为符号检验。该方法既适用于单样本场合,也适用于配对样本场合。5-35(一)单样本场合的符号检验中位数检验::=A样本每个数据都减去A,只记录其差数的符号。n+与n-分别是正、负符号的个数,当原假设为真是时,n+与n-应该很接近;若两者相差太远,就有有理由拒绝原假设。0HeM5-36例4:设有20个工人,他们一天生产的产品件数,抽样结果如下:168,163,160,172,162,168,152,153,167,165,164,142,173,166,160,165,171,186,167,170。试以α=0.10的检验水平,判定总体中位数是否是160。5-37解:第一步:作出假设。:=160,:160由备选假设知,这个检验是双侧的。第二步:计数。对样本数据,大于160的记下“+”,小于160的记下“-”,等于160的,予以剔除(以0记之),结果如下:++0+++--+++-++0+++++计数以上“+”的个数是n+=15,“-”的个数n-=3,剔除数据2个。最后有效的样本个数为n=n++n-=18。0HeM1HeM5-38第三步:确定拒绝域。显著水平α=0.10,由于进行双侧检验,拒绝域分布在两边,每侧概率α/2=0.05,查二项分布临界值表,得到拒绝域的临界值是13。第四步:选择n+、n-较大者,再与临界值比较。结果是1513。第五步:判断。由于上一步的比较结果可知,样本落入拒绝域,所以拒绝原假设,认为样本数据不能证明总体中位数等于160件。5-39(二)配对样本场合的符号检验样本配对场合与单样本场合的符号检验,基本原理是一致的。设从两个总体中分别抽出一个容量相等的样本,然后将两样本的数据进行一一配对,得到一组配对值。再将各对配对值相减,记录下差数的符号,计算出“+”的个数n+与“-”的个数n-。如果两个样本的总体差异不显著,配对值之差的正负号出现的概率各是1/2,则n+与n-应当非常接近;如果n+、n-相差太大的话,说明两总体存在显著差异。例子见书上的。5-40三、秩和检验秩和检验也称Wilcoxon-Man-Whitney检验。该检验方法可用于检验两个独立的样本是否来自同一个总体,或判断总体间是否存在显著性的差异。它和符号检验最主要的区别是,符号检验只考虑样本间差数的符号,而秩和检验还要考虑差数的顺序,比符号检验利用数据信息更加充分,因此,检验功效就更强。5-41秩和检验原理:设分别从两个未知的总体独立、随机地抽取容量为n1和n2的样本,把样本容量较小的总体称为总体Ⅰ。如果两样本容量相等,就把任意一个总体称作总体Ⅰ,另一个总体称作总体Ⅱ,这里不妨设n1n2。现将两个样本混合起来,并按数据的大小,从小到大排列编号,每个数值的编号就是它的秩次。如果混合样本中有若干个相同的数值,则把它们的秩次进行简单算术平均,用此平均值作为这些数值的秩次,计算来自总体Ⅰ的n1个数据在混合样本中的秩次之和,记为T。5-42显然T最小的可能值是:T1=1+2+3+…+n1=[n1(n1+1)]/2;最大的可能值是T2=(n2+1)+(n2+2)+…+(n2+n1)=n1[(n2+1)+(n2+n1)]/2。如果两个总体分布无显著差异,则T值