《概率论与数理统计》第七章假设检验.

整理文档很辛苦,赏杯茶钱您下走!

免费阅读已结束,点击下载阅读编辑剩下 ...

阅读已结束,您可以下载文档离线阅读编辑

资源描述

第1页**共23页第七章假设检验学习目标知识目标:理解假设检验的基本概念小概率原理;掌握假设检验的方法和步骤。能力目标:能够作正态总体均值、比例的假设检验和两个正态总体的均值、比例之差的假设检验。参数估计和假设检验是统计推断的两种形式,它们都是利用样本对总体进行某种推断,然而推断的角度不同。参数估计是通过样本统计量来推断总体未知参数的取值范围,以及作出结论的可靠程度,总体参数在估计前是未知的。而在假设检验中,则是预先对总体参数的取值提出一个假设,然后利用样本数据检验这个假设是否成立,如果成立,我们就接受这个假设,如果不成立就拒绝原假设。当然由于样本的随机性,这种推断只能具有一定的可靠性。本章介绍假设检验的基本概念,以及假设检验的一般步骤,然后重点介绍常用的参数检验方法。由于篇幅的限制,非参数假设检验在这里就不作介绍了。第一节假设检验的一般问题关键词:参数假设;检验统计量;接受域与拒绝域;假设检验的两类错误一、假设检验的基本概念(一)原假设和备择假设为了对假设检验的基本概念有一个直观的认识,不妨先看下面的例子。例7.1某厂生产一种日光灯管,其寿命X服从正态分布)200,(2N,从过去的生产经验看,灯管的平均寿命为1550小时,。现在采用新工艺后,在所生产的新灯管中抽取25只,测其平均寿命为1650小时。问采用新工艺后,灯管的寿命是否有显著提高?这是一个均值的检验问题。灯管的寿命有没有显著变第2页**共23页化呢?这有两种可能:一种是没有什么变化。即新工艺对均值没有影响,采用新工艺后,X仍然服从)200,1550(2N。另一种情况可能是,新工艺的确使均值发生了显著性变化。这样,1650X和15500之间的差异就只能认为是采用新工艺的关系。究竟是哪种情况与实际情况相符合,这需要作检验。假如给定显著性水平05.0。在上面的例子中,我们可以把涉及到的两种情况用统计假设的形式表示出来。第一个统计假设1550表示采用新工艺后灯管的平均寿命没有显著性提高。第二个统计假设1550表示采用新工艺后灯管的平均寿命有显著性提高。这第一个假设称为原假设(或零假设),记为0H:1550;第二个假设1550称为备择假设,记为1H:1550。至于在两个假设中,采用哪一个作为原假设,哪一个作为备择假设,要看具体的研究目的和要求而定。假如我们的目的是希望从子样观察值对某一陈述取得强有力的支持,则把该陈述的否定作为原假设,该陈述本身作为备择假设。譬如在上例中,我们的目的当然是希望新工艺对产品寿命确有提高,但又没有更多的数据可以掌握。为此,我们取“寿命没有显著性提高)1550(”作原假设,而以“寿命有显著性提高)1550(”作为备择假设。(二)检验统计量假设检验问题的一般提法是:在给定备择假设1H下对原假设0H作出判断,若拒绝原假设0H,那就意味着接受备择假设1H,否则就接受原假设0H。在拒绝原假设0H或接受备择假设1H之间作出某种判断,必须要从子样),,,(21nXXX出发,制定一个法则,一旦子样),,,(21nxxx的观察值确定之后,利用我们制定的法则作出判断:拒绝原假设0H还是接受原假设0H。那么检验法则是什么呢?它应该是定义在子样空间上的一个函数为依据所构造的一个准则,这个函数一般称为检验统计量。如上面列举的原假设0H:)1550(00,第3页**共23页那么子样均值X就可以作为检验统计量,有时还可以根据检验统计量的分布进一步加工,如子样均值服从正态分布时将其标准化,nXZ/0作为检验统计量,简称Z检验量。或者在总体方差2未知的条件下,nSXtn/0作为检验量,称为t检验量。(三)接受域和拒绝域假设检验中接受或者拒绝原假设0H的依据是假设检验的小概率原理。所谓小概率原理,是指发生概率很小的随机事件在一次实验中几乎是不可能发生的,根据这一原理就可以作出接受或是拒绝原假设的决定。如,一家厂商声称其某种产品的合格率很高,可以达到99﹪,那么从一批产品(如100件)中随机抽取一件,这一件恰好是次品的概率就非常之小,只有1﹪。如果把厂商的宣称,即产品的次品率仅为1﹪作为一种假设,并且是真的。那么由小概率原理,随机抽取一件是次品的情形就几乎是不可能发生的。如果这种情形居然发生了,这就不能不使人们怀疑原来的假设,即产品的次品率仅为1﹪的假设的正确性,这时就可以作出原假设为伪的判断,于是否定原假设。接受域和拒绝域是在给定的显著性水平下,由检验法则所划分的样本空间的两个互不相交的区域。原假设0H为真时的可以接受的可能范围称为接受域,另一区域是当原假设0H为真时只有很小的概率发生,如果小概率事件确实发生,就要拒绝原假设,这一区域称为拒绝域(或否定域)。落入拒绝域是个小概率事件,一旦落入拒绝域,就要拒绝原假设而接受备择假设。那么应该确定多大的概率算作小概率呢?这要根据不同的目的和要求而定,一般选择05.0或者01.0,通常用表示。它说明用多大的小概率来检验原假设。显然愈小愈不容易推翻原假设,而一旦拒绝原假设,原假设为真的可能性就越小。所以在作假设检验时通常要事先给定显著性水平.(1称为置信水平)。图7-1所示Z检验时的拒绝域和接受域。第4页**共23页(四)假设检验中的两类错误由前面已知,假设检验是在子样观察值确定之后,根据小概率原理进行推断的,由于样本的随机性,这种推断不可能有绝对的把握,不免要犯错误。所犯错误的类型有两类:一类错误是原假设0H为真时却被拒绝了。这类错误称为弃真错误,犯这种错误的概率用表示,所以也叫错误或第一类错误。另一类错误是指原假设0H为伪时,却被人们接受而犯了错误。这是一种取伪的错误,这种错误发生的概率用表示,故也称错误或第二类错误。在厂家出售产品给消费者时,通常要经过产品质量检验,生产厂家总是假定产品是合格的,但检验时厂家总要承担把合格产品误检为不合格产品的某些风险,生产者承担这些风险的概率就是,所以也称为生产者风险。而在消费者一方却耽心把不合格产品误检为合格品而被接受,这是消费者承担的某些风险,其概率就是,因此第二类错误也称为消费者风险。正确的决策和犯错误的概率可以归纳为表7.1。自然,人们希望犯这两类错误的概率愈小愈好。但对于一定的子样容量n,不可能同时做到犯这两类错误的概率都很小。通常的假设检验只规定第一类错误,即显著性水平,而不考虑第二类错误,并称这样的检验为显著性检验。表7.1假设检验中各种可能结果的概率接受0H拒绝0H,接受1H0H为真1(正确决策)(弃真错误)第5页**共23页(五)双边检验和单边检验根据假设的形式,可以把检验分为双边检验和单边检验,单边检验又进一步分为右检验和左检验。1、双边检验例如,检验的形式为:0H:01H:0由于我们在这里提出的原假设是等于某一数值0,所以只要0或0二者之中有一个成立,就可以否定原假设,这种假设检验称为双边检验,它的拒绝域分为两个部分,有两个临界值,在给定显著性水平下,每个拒绝域的面积为2/。双边检验如图7.2所示。2、单边检验在有些情况下,我们关心的假设问题带有方向性。例如产品的次品率则要求愈低愈好,它不能高于某一指标,当高于某一指标,就要拒绝原假设,这就是单边检验。这时拒绝域的图形在右侧,就称作单边右检验。检验的形式可以写为:0H:0,1H:0。又例如,灯管的使用寿命,药物的有效成分这类产品质量指标是愈高愈好,它不能低于某一标准,当低于某一标准时就要拒绝原假设,这时拒绝域的图形在0H为伪(取伪错误)1(正确决策)第6页**共23页左侧,就称为单边左检验。检验的形式为:0H:0,1H:0。二、假设检验的一般步骤一个完整的假设检验过程,一般包括五个主要步骤:(一)提出原假设和备择假设确定是双边检验还是单边检验,例如双边检验为:0H:0,1H:0。单边左检验为:0H:0,1H:0。单边右检验为:0H:0,1H:0。(二)建立检验统计量建立检验统计量是假设检验的重要步骤。譬如上例中,在总体X服从正态分布)200,(2N的假定下,当原假设0H:1550成立时,建立检验统计量nXZ/2001550,那么Z就服从标准正态分布)1,0(N。在具体问题里,选择什么统计量作为检验统计量,需要考虑的因素与参数估计相同。例如,用于进行检验的样本是大样本还是小样本,总体方差是已知还是未知等等,在不同条件下应选择不同的检验统计量。第7页**共23页(三)规定显著性水平,确定0H的拒绝域例如,当原假设0H:0成立时,检验统计量U服从标准正态分布)1,0(N,那么给定显著性水平()10,按双边检验,在标准正态分布表中查得临界值2z,使得}{2zZP,或者1}{22zZzP。若由子样),,,(21nXXX的一组观察值),,,(21nxxx算得统计量Z的值z落在),(2z或),(2z时,则拒绝或否定0H,),(2z及),(2z组成0H的拒绝域,称2z为临界值。(四)计算实际检验量在例7.1中,5.225/20015501650/0nXz。(五)判断将实际检验量的数值与临界值比较,以确定接受或拒绝0H。在本例中,645.105.0uz。实际检验量u之值大于临界值645.1,即落入拒绝域,故拒绝0H:1550,接受假设1H:1550,即可认为采用新工艺后日光灯管的平均寿命有显著性提高。第8页**共23页第二节正态总体的参数检验关键词:总体均值的检验;总体比例的检验;单边右检验;单边左检验;两个总体均值之差;两个总体比例之差一、一个正态总体的参数检验(一)总体均值的检验1、正态总体且方差2已知例7.2某厂生产一种耐高温的零件,根据质量管理资料,在以往一段时间里,零件抗热的平均温度是12500C,零件抗热温度的标准差是1500C。在最近生产的一批零件中,随机测试了100个零件,其平均抗热温度为12000C。该厂能否认为最近生产的这批零件仍然符合产品质量要求,而承担的生产者风险为0.05。解:从题意分析知道,该厂检验的目的是希望这批零件的抗热温度高于12500C,而低于12500C的应予拒绝,因此这是一个左边检验问题。(1)提出假设:0H:,12501H:1250。(2)建立检验统计量为:nXZ/0。(3)根据给定的显著性水平05.0,查表得临界值645.105.0z,因此拒绝域为)645.1,(。(4)计算检验量的数值33.3100/15012501200/0nXz。(5)因为)645.1,(33.3,落入拒绝域,故拒绝原假设或接受备择假设,认为最近生产的这批零件的抗高温性能低于12500C,不能认为产品符合质量要求。2、大样本,总体分布和总体方差2未知第9页**共23页在大样本的条件下,不论总体是否服从正态分布,由中心极限定理可知,样本均值X近似服从正态分布),(2nN,(为总体均值,2为总体方差,n为样本容量)。总体方差未知时,可用大样本方差2121)(11XXnSniin代替总体方差2来估计。所以总体均值的检验量为:nSXZn/10。例7.3某阀门厂的零件需要钻孔,要求孔径cm10,孔径过大过小的零件都不合格。为了测试钻孔机是否正常,随机抽取了100件钻孔的零件进行检验,测得cmX6.9,cms1。给定05.0,检验钻孔机的操作是否正常。解:从题意可知,这是一个总体均值的双边检验问题。(1)提出假设:0H:,101H:10。(2)建立检验统计量:nSXZn/10。(3)由给定的显著性水平05.0,查表得临界值96.12/z,因此拒绝域为)96.1,(及),96.1(。(4)计算实际检验量的数值:4100/1106.9/10nSXzn。(5)因为)96.1

1 / 23
下载文档,编辑使用

©2015-2020 m.777doc.com 三七文档.

备案号:鲁ICP备2024069028号-1 客服联系 QQ:2149211541

×
保存成功