第八章假设检验2章节目录8.1假设检验的基本问题8.2一个总体参数的检验8.3两个总体参数的检验8.4检验问题的进一步说明38.1假设检验的基本问题•8.1.1假设问题的提出•8.1.2假设的表达式•8.1.3两类错误•8.1.4假设检验的流程•8.1.5利用P值进行决策•8.1.6单侧检验48.1.1假设问题的提出:引例•由统计资料得知,1989年某地新生儿的平均体重为3190克。现从1990年的新生儿中随机抽取100个,测得其平均体重为3210克。•问1990年的新生儿与1989年相比,体重有无显著差异?58.1.2假设的表达式1、原假设(nullhypothesis):是待检验的假设,又称“零假设”。统计的语言是用一个等式或不等式表示问题的原假设。表示为H0。2、备择假设(alternativehypothesis):与原假设互斥的假设,又称“替换假设”。表示为H1。3、肯定原假设,意味着放弃备择假设;否定原假设,意味着接受备择假设。68.1.2假设的表达式假设检验背后的哲学:如果一个人说他从来没做过坏事,他能够证明吗?从这个例子中我们发现,要肯定某个事物往往是很难的,而否定某个事物则相对容易得多,这就是假设检验背后的哲学。假设检验的思想,可以用当代著名的科学哲学家波普尔的“否证”思想作出解释。这种思想认为科学研究的目的不是实证一个理论,而是竭力去否证一种猜想。78.1.2假设的表达式在假设检验中,一般要先设立一个假设(比如从来没做过坏事),然后从现实世界的数据中找出假设与现实的矛盾,从而否定该假设。所以,在多数统计教材当中,假设检验都是以否定事先设定的那个假设为目标的。如果搜集到的数据分析结构不能否定该假设,只能说明我们掌握的现实不足以否定该假设,但不能说明该假设一定成立。这是假设检验做结论的时候尤其要注意的一点。比如一个人在数次的观察中都没有干坏事,但并不说明他从来都没干过坏事。88.1.2假设的表达式从假设检验的原理来看,检验的结论是建立在概率的基础上的。不能拒绝原假设并不一定保证原假设为真。不拒绝原假设只是意味着我们所构造的与原假设相矛盾的小概率事件在我们所设定的显著性水平下没有发生,但是随着显著性水平的变化,我们没有办法证明所有的这些小概率事件都不会发生。因此,我们把假设检验中出现接受原假设的结果解释为“没有发现充足的证据反对原假设”,或更严格的解释为“在某显著性水平下没有发现充足的证据反对原假设”,而不用“接受原假设”这样的说法,因为我们无法证明原假设绝对是真的。98.1.2假设的表达式假设检验在整个思想的逻辑上,我们采用的是反证法,要想证明它成立,首先假设它不成立,然后找出一个矛盾,来否定我们的这个假设。所以,统计上依据的是一个小概率的原理。什么是小概率呢?就是在一次实验中,一个几乎不可能发生的事件发生的概率。统计学上,我们通常认为,在一次实验中,小概率事件一旦发生,我们就有理由拒绝原假设。所谓一次实验,在统计上其实就是一次抽样,你在这一次抽样当中,如果出现了小概率事件,那么我们就有理由去拒绝原来的那个假设。所以,我们在做假设检验之前,首先要设定小概率事件。著名的英国统计学家费希尔把小概率的标准定位0.05,即把0.05或比0.05更小的概率看成小概率。108.1.2假设的表达式根据假设检验的思想逻辑》在一次实验中,小概率事件是不容易发生的(或几乎不可能发生)。通俗的说,在一次实验中,假定某一事件发生的概率很大,这一事件发生了,人们认为这是正常的;反过来,某一事件发生的概率很小,这一事件发生了,人们认为这就不正常了。11一般来说,在研究问题的过程中,我们想要予以反对的那个结论,我们就把它作为原假设。比如,一家研究机构估计,某城市当中家庭拥有汽车的比例超过30%。为了验证这种估计是否正确,该研究机构随机的抽取了一个样本进行检验。试陈述用于检验的原假设和备择假设。解:研究者想要收集证据予以支持的假设是:“该城市中家庭拥有汽车的比例超过30%”。因此,原假设是总体比例小于等于30%,备择假设是总体比例大于30%。可见,通常我们应该先确定备择假设,再确定原假设。8.1.2假设的表达式128.1.2假设的表达式例1:某厂生产的化纤纤度服从正态分布,纤维的纤度的标准均值为1.4。某天测得25根纤维的纤度的均值为1.39,检验与原来设计的标准均值相比是否有所变化,要求的显著水平为α=0.05。试陈述用于检验的原假设和备择假设。解:对于参数假设检验问题,原假设一定是“等于”、“大于等于”、“小于等于”某值这三种情况。因此,H0:μ=1.4;H1:μ≠1.4。138.1.2假设的表达式例2:某一贫困地区估计营养不良人数高达20%,然而有人认为这个比例实际上还要高,要检验该说法是否正确,试陈述用于检验的原假设和备择假设。解:“有人认为这个比例实际上还要高”,因此这个就是想要证明的观点,把它放在备择假设的位置上。因此,H0:π≤20%;H1:π>20%。148.1.2假设的表达式例3:一个零件的标准长度为5厘米,要检验某天生产的零件是否符合标准要求,试陈述用于检验的原假设和备择假设。解:对于参数假设检验问题,原假设一定是“等于”、“大于等于”、“小于等于”某值这三种情况。因此,H0:μ=5;H1:μ≠5。158.1.2假设的表达式例4:一项研究表明,中学生中吸烟的比例高达30%,为检验这一说法是否属实,试陈述用于检验的原假设和备择假设。解:对于参数假设检验问题,原假设一定是“等于”、“大于等于”、“小于等于”某值这三种情况。因此,H0:π=30%;H1:π≠30%。168.1.2假设的表达式例5:一项研究表明,司机驾车时因接打手机而发生事故的比例超过20%,试陈述用于检验的原假设和备择假设。解:通常我们看到“一项研究表明”这样的论述,论述当中的观点都是研究者想要证明的观点,所以放在备择假设的位置上。因此:H0:π≤20%;H1:π>20%。178.1.2假设的表达式例6:某企业每月发生事故的平均次数为5次,企业准备制定一项新的安全生产计划,希望新计划能减少事故次数。用来检验这一计划有效性的原假设和备择假设是?解:企业希望证明的是新计划的有效性,即新计划能减少事故次数。所以把它放在备择假设上。因此,H0:μ≥5;H1:μ<5。188.1.2假设的表达式因研究目的的不同,对同一个问题可能提出不同的假设(也可能得出不同的结论)。198.1.3两类错误•1.第一类错误(弃真错误或error)–原假设为真时拒绝原假设–弃真错误发生的概率为•被称为显著性水平(significantlevel)•2.第二类错误(取伪错误或error)–原假设为伪时接受原假设–第二类错误的概率为20项目没有拒绝H0拒绝H0H0为真1-α(正确)α(弃真错误)H0为假β(取伪错误)1-β(正确)8.1.3两类错误假设检验中各种可能结果的概率218.1.3两类错误α和β的关系:1、α和β的关系就像跷跷板,α小β就大,α大β就小。因为,要减少弃真错误α,就要扩大接受域。而扩大接受域,就必然导致取伪错误的可能性增加。因此,不能同时做到犯两种错误的概率都很小。要使α和β同时变小,唯一的办法就是增大样本量。α和β两者的关系就像是区间估计当中可靠性和精确性的关系一样。2、在假设检验中,大家都在执行这样一个原则,即首先控制犯α错误原则。228.1.4假设检验的流程提出原假设和备择假设确定适当的检验统计量规定显著性水平计算检验统计量的值(z值检验)作出统计决策:接受or拒绝238.1.4假设检验的流程1、检验统计量:是用于假设检验决策的统计量。选择统计量的方法与参数估计相同,需考虑是大样本还是小样本;总体方差已知还是未知。248.1.4假设检验的流程2、计算检验统计量值的方式,类似我们前面讲过的相对位置度量当中的标准分数计算。引例中,假设新生儿体重的标准差为80克,则有μ=3190,σ=80,n=100。根据抽样分布的原理,当α=0.05时的置信区间为(3174.32,3205.68)。3210落在这个区间之外,所以拒绝原假设。假设检验中我们采用类似标准分数的转化方式,将3210转化为标准分数,也就是求3210对应的Z值,看它是否落在(-1.96,+1.96)的接受域范围内。我们可以求得Z值为2.5,落在接受域之外,所以拒绝原假设。25统计量检验是我们事先给出的一个显著性水平,以此为标准进行决策,无法知道实际的显著性水平究竟是多少。–比如,根据统计量进行检验时,只要统计量的值落在拒绝域,我们拒绝原假设得出的结论都是一样的,即结果显著。但实际上,统计量落在拒绝域不同的地方,实际的显著性是不同的。比如,统计量落在临界值附近与落在远离临界值的地方,实际的显著性就有较大差异。8.1.5利用P值进行决策268.1.5利用P值进行决策为了精确地反映决策的风险度,可以利用P值(P-Value)进行决策。例如:引例中,如果我们想要了解随机抽取出的100个样本,其均值大于3210的概率有多大?我们把这个概率称为P值,所以P值就是原假设为真时所得到的样本观察结果或更极端结果出现的概率。P值的手工计算非常复杂,根据引例,我们可以通过计算机求出P值为0.01242,这就是说,如果原假设成立,样本均值大于等于3210的概率只有0.01242,这是很小的,由此我们可以拒绝原假设。278.1.5利用P值进行决策如果P值很小,说明这种情况发生的概率很小,而如果出现了,根据小概率原理,我们就有理由拒绝原假设。P值越小,我们拒绝原假设的理由就越充分。P值的长处在于它反映了观察到的实际数据与原假设之间不一致的概率值,与传统的拒绝域范围相比,P是一个具体的值,这样就提供了更多的信息。281.传统的显著性水平,如1%、5%、10%等等,已经被人们普遍接受为“拒绝原假设足够证据”的标准,我们大概可以说:10%代表有“一些证据”不利于原假设;5%代表有“适度证据”不利于原假设;1%代表有“很强证据”不利于原假设。2.有了P值,我们并不需要用5%或1%这类传统的显著性水平。P值提供了更多的信息,它让我们可以选择任意水平来评估结果是否具有统计上的显著性,从而可根据我们的需要来决定是否要拒绝原假设。–只要你认为这么大的P值就算是显著了,你就可以在这样的P值水平上拒绝原假设。8.1.5利用P值进行决策29•要证明原假设不正确,P值要多小,才能令人信服呢?–原假设的可信度又多高?如果H0所代表的假设是人们多年来一直相信的,就需要很强的证据(小的P值)才能说服他们–拒绝的结论是什么?如果拒绝H0而肯定H1,你就需要有很强的证据显示要支持H1。比如,H1代表要花很多钱把产品包装改换成另一种包装,你就要有很强的证据显示新包装一定会增加销售量(因为拒绝H0要花很高的成本)8.1.5利用P值进行决策308.1.6单侧检验假设研究的问题双侧检验左侧检验右侧检验H0m=m0mm0mm0H1m≠m0mm0mm031抽样分布H0值临界值临界值/2/2样本统计量拒绝域拒绝域接受域1-置信水平双侧检验有两个拒绝域,两个临界值,每个拒绝域的面积为α/2。328.1.6单侧检验H0值临界值样本统计量拒绝域抽样分布1-置信水平左单侧检验,所考察的数值越大越好,如灯泡的使用寿命,轮胎的行驶里程数等。338.1.6单侧检验H0值1-置信水平拒绝域接受域抽样分布临界值样本统计量右单侧检验,所考察的数值越小越好,如废品率、生产成本等。348.2一个总体参数的检验•8.2.1检验统计量的确定•8.2.2总体均值的检验•8.2.3总体比例的检验•8.2.4总体方差的检验358.2.1检验统计量的确定在一个总体参数的检验中,用到的检验统计量主要有三个:z统计量,t统计量,χ2统计量。其中z统计量和t统计量常用于均值和比例的检验,χ2统计量则用于方差的检验。选择什么统计量进行检验主要考虑两方面的因素:样本量的大小,总体的标准差是否已知。368.2.1检验统计量的确定1、在大样本的情况下,无论总体方差是否已知,都可以把