6-1统计学STATISTICS第6章统计假设检验6-2统计学STATISTICS第6章统计假设检验§6.1假设检验的基本问题§6.2总体均值的假设检验§6.3总体比例的假设检验§6.4总体方差的显著性检验§6.5假设检验中的其他问题§6.6Excel应用6-3统计学STATISTICS学习目标1.假设检验的基本思想和原理2.假设检验的步骤3.一个总体参数的检验4.两个总体参数的检验5.P值的计算与应用6.用Excel进行检验6-4统计学STATISTICS§6.1假设检验的基本问题基本思想假设与检验两类可能的错误双边检验与单边检验6-5统计学STATISTICS假设检验在统计方法中的地位统计方法描述统计推断统计参数估计假设检验6-6统计学STATISTICS例子【例6.1.1】有一厂家生产了两批灯泡各10,000只,其中一批9,999只好的,仅有一只坏的,而另一批灯泡恰好相反,有9,999只是坏的,仅1只是好的,现卖给某一商场,据说这是好的那一批,可商场从这批灯泡中任抽一只发觉是坏的,于是拒绝买下这批货物商场拒买的理由是什么呢?假设这批灯泡是好的那批,那么“任抽一只是坏的”这样的随机事件发生的概率应是0.01%,这样小的概率在一次抽样中几乎不可能发生,而今任抽一只是坏的,这样的事件居然发生,于是拒绝接受“这是好的那批”的假设,肯定地认为将买到坏的那批,于是坚决拒买他会犯错误吗?6-7统计学STATISTICS假设检验中的小概率原理什么是小概率?1.在一次试验中,一个几乎不可能发生的事件发生的概率2.在一次试验中小概率事件一旦发生,我们就有理由拒绝原假设3.小概率由研究者事先确定什么是小概率?6-8统计学STATISTICS假设检验的基本思想...因此我们拒绝假设=50...如果这是总体的真实均值样本均值=50抽样分布H0这个值不像我们应该得到的样本均值...206-9统计学STATISTICS假设检验的基本思想这是一个带有概率性质的反证法:先假定一个假设是成立的,在这种假设下,将构成一个小概率事件,根据实际推断原理:“小概率事件在一次试验中几乎是不可能发生的”。然而这样的事件在一次试验中却发生了,那么我们自然要怀疑“假设”的正确性,于是“拒绝假设”。如果“小概率事件”末发生,则不能拒绝“假设”,而只能接受它6-10统计学STATISTICS假设的陈述6-11统计学STATISTICS什么是假设?(hypothesis)对总体参数的具体数值所作的陈述总体参数包括总体均值、比例、方差等分析之前必需陈述我认为这种新药的疗效比原有的药物更有效!6-12统计学STATISTICS什么是假设检验?(hypothesistest)1.先对总体的参数(或分布形式)提出某种假设,然后利用样本信息判断假设是否成立的过程2.有参数检验和非参数检验一种是当总体分布类型已知,所涉及到的是分布中所包含的几个未知参数的假设检验,这种假设检验叫参数假设检验。另外一种是除上述假设检验以外的其它假设检验,称为非参数假设检验3.逻辑上运用反证法,统计上依据小概率原理6-13统计学STATISTICS总体假设检验的过程抽取随机样本均值x=20我认为人口的平均年龄是50岁提出假设拒绝假设别无选择!作出决策6-14统计学STATISTICS原假设与备择假设6-15统计学STATISTICS原假设(nullhypothesis)1.研究者想收集证据予以反对的假设2.又称“0假设”3.总是有符号,或4.表示为H0H0:=某一数值指定为符号=,或为什么叫0假设?6-16统计学STATISTICS1.研究者想收集证据予以支持的假设2.也称“研究假设”3.总是有符号,或4.表示为H1H1:某一数值,或某一数值例如,H1:10cm,或10cm备择假设(alternativehypothesis)6-17统计学STATISTICS【例】设某企业生产的某种产品,其产品寿命t(小时)遵从均值、方差为2的正态分布,记为t~N(,2)据过去的资料,已知均值为55万小时,方差为1,000小时2,现在由于改进了工艺流程和方法,出现均值大于55万小时,方差不变。但有时仍存在均值不超过55万小时的可能性,怎样来作假设提出假设(例题分析)解:生产者想收集证据予以证明的假设应该是“产品寿命有提高”。建立的原假设和备择假设为H0:55H1:556-18统计学STATISTICS【例】某厂生产一种产品,其直径尺寸d(毫米)服从正态分布N(200,42)。今采取新的工艺生产,从产品中随机抽取10件.检查新工艺生产的产品质量,得其平均直径为202.5毫米。试问,改革工艺前后产品直径平均尺寸有无显著变化?试陈述用于检验的原假设与备择假设提出假设(例题分析)解:研究者抽检的意图是倾向于证实改革工艺后产品直径平均尺度有变化。建立的原假设和备择假设为H0:=200H1:≠2006-19统计学STATISTICS1.原假设和备择假设是一个完备事件组,而且相互对立在一项假设检验中,原假设和备择假设必有一个成立,而且只有一个成立2.先确定备择假设,再确定原假设3.等号“=”总是放在原假设上4.因研究目的不同,对同一问题可能提出不同的假设(也可能得出不同的结论)提出假设(结论与建议)6-20统计学STATISTICS两类错误与显著性水平6-21统计学STATISTICS假设检验中的两类错误1.第Ⅰ类错误(弃真错误)原假设为真时拒绝原假设第Ⅰ类错误的概率记为被称为显著性水平2.第Ⅱ类错误(取伪错误)原假设为假时未拒绝原假设第Ⅱ类错误的概率记为(Beta)6-22统计学STATISTICSH0:无罪假设检验中的两类错误(决策结果)陪审团审判裁决实际情况无罪有罪无罪正确错误有罪错误正确H0检验决策实际情况H0为真H0为假未拒绝H0正确决策(1–)第Ⅱ类错误()拒绝H0第Ⅰ类错误()正确决策(1-)假设检验就好像一场审判过程统计检验过程6-23统计学STATISTICS错误和错误的关系你不能同时减少两类错误!和的关系就像翘翘板,小就大,大就小6-24统计学STATISTICS显著性水平(significantlevel)1.是一个概率值2.原假设为真时,拒绝原假设的概率被称为抽样分布的拒绝域3.表示为(alpha)常用的值有0.01,0.05,0.104.由研究者事先确定6-25统计学STATISTICS双侧检验与单侧检验6-26统计学STATISTICS1.备择假设没有特定的方向性,并含有符号“”的假设检验,称为双侧检验或双尾检验(two-tailedtest)2.备择假设具有特定的方向性,并含有符号“”或“”的假设检验,称为单侧检验或单尾检验(one-tailedtest)备择假设的方向为“”,称为左侧检验备择假设的方向为“”,称为右侧检验双侧检验与单侧检验6-27统计学STATISTICS双侧检验与单侧检验(假设的形式)假设双侧检验单侧检验左侧检验右侧检验原假设H0:=0H0:0H0:0备择假设H1:≠0H1:0H1:06-28统计学STATISTICS统计量与拒绝域6-29统计学STATISTICS1.根据样本观测结果计算得到的,并据以对原假设和备择假设作出决策的某个样本统计量2.对样本估计量的标准化结果原假设H0为真点估计量的抽样分布检验统计量(teststatistic)点估计量的抽样标准差假设值—点估计量标准化检验统计量3.标准化的检验统计量6-30统计学STATISTICS显著性水平和拒绝域(双侧检验)抽样分布0临界值临界值/2/2样本统计量拒绝H0拒绝H01-置信水平6-31统计学STATISTICS显著性水平和拒绝域(双侧检验)0临界值临界值/2/2样本统计量拒绝H0拒绝H0抽样分布1-置信水平6-32统计学STATISTICS显著性水平和拒绝域(双侧检验)0临界值临界值/2/2样本统计量拒绝H0拒绝H0抽样分布1-置信水平6-33统计学STATISTICS显著性水平和拒绝域(双侧检验)0临界值临界值/2/2样本统计量拒绝H0拒绝H0抽样分布1-置信水平6-34统计学STATISTICS显著性水平和拒绝域(单侧检验)0临界值样本统计量拒绝H0抽样分布1-置信水平6-35统计学STATISTICS显著性水平和拒绝域(左侧检验)0临界值样本统计量拒绝H0抽样分布1-置信水平观察到的样本统计量6-36统计学STATISTICS显著性水平和拒绝域(左侧检验)0临界值样本统计量拒绝H0抽样分布1-置信水平6-37统计学STATISTICS显著性水平和拒绝域(右侧检验)0临界值样本统计量拒绝H0抽样分布1-置信水平观察到的样本统计量6-38统计学STATISTICS显著性水平和拒绝域(右侧检验)0临界值样本统计量抽样分布1-置信水平拒绝H06-39统计学STATISTICS决策规则1.给定显著性水平,查表得出相应的临界值z或z/2,t或t/22.将检验统计量的值与水平的临界值进行比较3.作出决策双侧检验:I统计量I临界值,拒绝H0左侧检验:统计量-临界值,拒绝H0右侧检验:统计量临界值,拒绝H06-40统计学STATISTICS假设检验步骤的总结1.设立零假设H0和备择假设H1;2.选择统计量,计算被检验的实际统计量之值;3.确定统计量的抽样分布;4.确定显著性水平,根据显著性水平确定临界值5.根据临界值(或者p值),确定检验准则,即给出拒绝域和接受域;6.将计算的被检验实际统计量之值与临界值比较(或者根据p值大小判断),从而判定接受或拒绝零假设,完成统计假设检验6-41统计学STATISTICS§6.2总体均值的假设检验Z-检验T-检验6-42统计学STATISTICS总体均值的检验(z-检验)1.假定条件正态总体或非正态总体大样本(n30)2.使用z检验统计量2已知:2未知:)1,0(~0Nnxz)1,0(~0Nnsxz6-43统计学STATISTICS总体均值的检验(检验方法的总结)假设双侧检验左侧检验右侧检验假设形式H0:=0H1:0H0:0H1:0H0:0H1:0统计量已知:未知:拒绝域P值决策拒绝H0nxz0nsxz02/zzzzzzP6-44统计学STATISTICS总体均值的检验(2已知)(例题分析)【例】某市历年来对7岁男孩的统计资料表明,他们的身高服从均值为1.32米、标准差为0.12米的正态分布。现从各个学校随机抽取25个7岁男学生,测得他们平均身高1.36米,若已知今年全市7岁男孩身高的标准差仍为0.12米,问与历年7岁男孩的身高相比是否有显著差异?双侧检验6-45统计学STATISTICS总体均值的检验(2已知)(例题分析)H0:=1.32H1:1.32=0.05n=25临界值(c):检验统计量:z01.96-1.960.025拒绝H0拒绝H00.025决策:结论:不拒绝H0样本提供的证据表明:男孩平均身高没有显著提高67.12512.032.136.10nxz6-46统计学STATISTICS两个总体均值之差的检验(z-检验)1.假定条件两个样本是独立的随机样本正态总体或非正态总体大样本(n130和n230)2.检验统计量12,22已知:12,22未知:)1,0(~)()(2221212121Nnnxxz)1,0(~)()(2221212121Nnsnsxxz6-47统计学STATISTICS两个总体均值之差的检验(检验方法的总结)假设双侧检验左侧检验右侧检验假设形式H0:1-20H1:1-20H0:1-2