第七章-假设检验PPT

整理文档很辛苦,赏杯茶钱您下走!

免费阅读已结束,点击下载阅读编辑剩下 ...

阅读已结束,您可以下载文档离线阅读编辑

资源描述

第七章假设检验第七章假设检验学习目标:1.理解假设检验的基本思想和基本步骤;2.理解假设检验的两类错误及其关系;3.熟练掌握总体平均数、总体成数和总体方差的各种假设检验方法;4.利用P-值进行假设检验。7.1假设检验中的基本问题7.1.1假设检验中的小概率原理7.1.2假设检验的一些基本概念7.1.3假设检验的步骤7.1.1假设检验中的小概率原理小概率原理:指发生概率很小的随机事件在一次试验中是几乎不可能发生的。小概率指p5%。假设检验的基本思想是应用小概率原理。例如:某厂产品合格率为99%,从一批(100件)产品中随机抽取一件,恰好是次品的概率为1%。随机抽取一件是次品几乎是不可能的,但是这种情况发生了,我们有理由怀疑该厂的合格率为99%.这时我们犯错误的概率是1%。7.1.2假设检验的一些基本概念1.原假设和备择假设原假设:用H0表示,即虚无假设、零假设、无差异假设;备择假设:用H1表示,是原假设被拒绝后替换的假设。若证明为H0为真,则H1为假;H0为假,则H1为真。对于任何一个假设检验问题所有可能的结果都应包含在两个假设之内,非此即彼。2.检验统计量用于假设检验问题的统计量称为检验统计量。与参数估计相同,需要考虑:总体是否正态分布;大样本还是小样本;总体方差已知还是未知。7.1.2假设检验的一些基本概念7.1.2假设检验的一些基本概念3.显著性水平用样本推断H0是否正确,必有犯错误的可能。原假设H0正确,而被我们拒绝,犯这种错误的概率用表示。把称为假设检验中的显著性水平(Significantlevel),即决策中的风险。显著性水平就是指当原假设正确时人们却把它拒绝了的概率或风险。通常取=0.05或=0.01或=0.001,那么,接受原假设时正确的可能性(概率)为:95%,99%,99.9%。7.1.2假设检验的一些基本概念4.接受域与拒绝域接受域:原假设为真时允许范围内的变动,应该接受原假设。拒绝域:当原假设为真时只有很小的概率出现,因而当统计量的结果落入这一区域便应拒绝原假设,这一区域便称作拒绝域。例:=0.05时的接受域和拒绝域7.1.2假设检验的一些基本概念5.双侧检验与单侧检验假设检验根据实际的需要可以分为:双侧检验(双尾):指只强调差异而不强调方向性的检验。单侧检验(单尾):强调某一方向性的检验。左侧检验右侧检验大还是小比是否有差异,不关心,只关注0101011010::HH1110011010::::HHHH假设检验中的单侧检验示意图拒绝域拒绝域(a)右侧检验(b)左侧检验7.1.2假设检验的一些基本概念6.假设检验中的两类错误假设检验是依据样本提供的信息进行推断的,即由部分来推断总体,因而假设检验不可能绝对准确,是可能犯错误的。两类错误:错误(I型错误):H0为真时却被拒绝,弃真错误;错误(II型错误):H0为假时却被接受,取伪错误。假设检验中各种可能结果的概率:接受H0,拒绝H1拒绝H0,接受H1H0为真1-(正确决策)(弃真错误)H0为伪(取伪错误)1-(正确决策)X(1)与是两个前提下的概率。即是拒绝原假设H0时犯错误的概率,这时前提是H0为真;是接受原假设H0时犯错误的概率,这时前提是H0为伪。所以+不等于1。(2)对于固定的n,与一般情况下不能同时减小。对于固定的n,越小,Z/2越大,从而接受假设区间(-Z/2,Z/2)越大,H0就越容易被接受,从而“取伪”的概率就越大;反之亦然。即样本容量一定时,“弃真”概率和“取伪”概率不能同时减少,一个减少,另一个就增大。与(3)要想减少与,一个方法就是要增大样本容量n。。与概率从而减少了两种错误的变小,则分布就瘦长,变小,就会中,~,在样本平均数的分布若增大nnnNXn22),(与7.1.3假设检验的步骤1、建立原假设和备择假设;2、确定适当的检验统计量;3、指定检验中的显著性水平;4、利用显著性水平根据检验统计量的值建立拒绝原假设的规则;5、搜集样本数据,计算检验统计量的值;6、作出统计决策:(两种方法)(1)将检验统计量的值与拒绝规则所指定的临界值相比较,确定是否拒绝原假设;(2)由步骤5的检验统计量计算p值,利用p值确定是否拒绝原假设。7.2总体均值的检验7.2.1Z-检验7.2.2T-检验7.2.1Z-检验1、当总体分布为正态分布,总体标准差为已知时,检验原假设。当H0成立时,由于总体~N(,);所以样本均值。从而统计量为:0/XZn~(0,1)NX0[例7-2]某市历年来对7岁男孩的统计资料表明,他们的身高服从均值为1.32米、标准差为0.12米的正态分布。现从各个学校随机抽取25个7岁男学生,测得他们平均身高1.36米,若已知今年全市7岁男孩身高的标准差仍为0.12米,问与历年7岁男孩的身高相比是否有显著差异(取=0.05)。解:从题意可知,=1.36米,=1.32米,=0.12米。(1)建立假设:H0:=1.32,H1:1.32(2)确定统计量:1.361.321.67/0.12/25XZnX0(3)Z的分布:Z~N(0,1)(4)对给定的=0.05确定临界值。因为是双侧备择假设所以查表时要注意。因概率表是按双侧排列的,所以应查1-0.05=0.95的值,查得临界值=1.96。(5)检验准则。|Z|1.96,接受H0,反之,拒绝H0。(6)决策:因Z=1.67<1.96;落在了接受域,因此认为今年7岁男孩平均身高与历年7岁男孩平均身高无显著差异,即不能拒绝零假设。1/2Z2.对来自两个正态总体的两个独立样本,已知样本容量、均值和总体方差分别为和,可用Z检验法检验零假设H0:。可以证明,若则所以,在H0成立的前提下,有2111,,nX2222,,nX122211112222~(,/),~(,/),XNnXNn2212121212()~(,)XXNnn12221212~(0,1)XXZNnn7.2.1Z-检验[例7-4]由长期积累的资料知道,甲、乙两城市20岁男青年的体重都服从正态分布,并且标准差分别为14.2公斤和10.5公斤,现从甲、乙两城市各随机抽取27名20岁男青年,则测得平均体重分别为65.4公斤和54.7公斤,问甲、乙两城市20岁男青年平均体重有无显著差异(0.05)?解:从题意可知,公斤,=14.2公斤,=54.7公斤,=10.5公斤;。(I)建立假设:H0:,H1:。165.4X12X21227nn1212(2)确定统计量:3.15(3)Z的分布:Z~N(0,1)(4)对给定的=0.05确定临界值。因为是双侧备择假设所以查表时要注意。因概率表是按双侧排列的,所以应查1-0.05=0.95的值,查得临界值=1.96。(5)检验准则。|Z|1.96,接受H0,反之,拒绝H0。(6)决策:因Z=3.151.96,落在了拒绝域,因此拒绝零假设。认为甲、乙两城市20岁男青年平均体重有显著差异。122222121265.454.710.514.22727XXZnn1/2Z7.2.2T-检验t检验法是使用服从t分布的统计量检验正态总体平均值的方法。1.当正态总体标准差未知时,检验零假设H0:。可以证明,在H0成立的前提下,有:(其中,样本标准差)00~(1)/1XttnSn21()niiXXSn[例7-5]某制药厂试制某种安定神经的新药,给10个病人试服,结果各病人增加睡眠量如表7-2所示。表7-1病人服用新药增加睡眠量表试判断这种新药对病人有无安定神经的功效(=0.05)。解:(1)建立假设H0:(没有功效);H1:(有功效)(单侧备择假设)(2)计算统计量:=1.24=1.45病人号码12345678910增加睡眠(小时)0.7-1.1-0.21.20.13.43.70.81.82.01niiXXn21()niiXXsn00=2.57(3)确定统计量分布。本例中,。(4)对于给定的显著性水平0.05,查自由度为9的t分布表,单侧临界值为1.833。(5)建立检验规则。|t|1.833,接受H0,否则,拒绝H0。(6)结论。因为本例t=2.57﹥1.833,所以,拒绝H0,即,认为这种新药对病人有安定神经的功效。01.240/11.45/101XtSn9~tt2.若两个正态总体的标准差未知,但知道其值相等,可用t检验来检验零假设H0:。当H0成立时,可证明统计量:1212122211221112121222211221212()()11()2~11()2nniiiinnXXtXXXXnnnnXXtnsnsnnnn7.2.2T-检验[例7-6]某工业管理局在体制改革前后,分别调查了l0个和12个企业的劳动生产率情况,得知改革前、后平均劳动生产率(元/人)为=2089、=2450,劳动生产率的方差分别为=7689;=6850。又知体制改革前、后企业劳动生产率的标准差相等.问:在显著性水平0.05下,改革前、后平均劳动生产率有无显著差异?解:(1)建立假设H0:(没有差别)。H1:(有差别)(左单侧备择假设)(2)计算统计量:=-9.451X2X21s22s12122211221212208924501076891268501111()()1012212102XXtnsnsnnnn21(3)确定统计量分布。本例中,。(4)对于给定的显著性水平0.05,查自由度为20的t分布表,左单侧临界值为-1.725(5)建立检验规则。t小于-1.725,拒绝H0,否则,接受H0。(6)结论。因为本例t=-9.45-1.725,所以,拒绝H0,即,在显著性水平0.05下,改革前、后平均劳动生产率有显著差异,改革后的劳动生产率高于改革前的劳动生产率。20~tt7.3总体比例的假设检验7.3.1单个总体比例检验7.3.2两个总体比例检验7.3.1单个总体比例检验当样本容量n很大,np和n(1-p)两者都大于5时,二项分布可以用正态分布来逼近。在抽样比例n/N小于0.05的情形下,关于单个总体比例的假设的检验统计量为:其中,是假设的总体比例,是样本比例)1()1(NnNnpZp7.3.1单个总体比例检验这个检验统计量近似服从标准正态分布。如果抽样比例n/N很小时,也可以使用下列形式:(1)pZn[例7-7]某企业的产品畅销国内市场。据以往调查,购买该产品的顾客有50%是30岁以上的男子。该企业负责人关心这个比例是否发生了变化,而无论是增加还是减少。于是,该企业委托了一家咨询机构进行调查,这家咨询机构从众多的购买者中随机抽选了400名进行调查,结果有210名为30岁以上的男子。该厂负责人希望在显著性水平0.05下检验“50%的顾客是30岁以上的男子”这个假设。解:(1)建立假设由题意可知,这是双侧检验,故建立假设H0:=50%.H1:50%(2)计算统计量由于样本容量=400>30,=400×50%=200,=200,皆大于5,所以可以使用正态分布进行检验。(3)Z~N(0,1)(4)对应于0.05的显著性水平,双侧检验临界值为1.96。(5)若Z值不大于1.96,则接受原假设,否则,拒绝之。(6)本例中,Z=1,处于接受域,故接受“50%的顾客是30岁以上的男子”这个假设。0.5250.51(1)0.5(10.5)/400pZnnn(1)n1.检验两个总体比例是否相等的假设建立假设H0:P1=P2(或P1-P2=0);H1:P1P2(或P1–P20)适当的检验统计量是:由于假设P1=P2,且真正的P1、P2未知,所以用

1 / 60
下载文档,编辑使用

©2015-2020 m.777doc.com 三七文档.

备案号:鲁ICP备2024069028号-1 客服联系 QQ:2149211541

×
保存成功