第6章假设检验§1假设检验的基本问题§2一个正态总体参数的检验§3两个正态总体参数的检验§4假设检验中的其他问题假设检验在统计方法中的地位•统计方法描述统计推断统计参数估计假设检验学习目标1.了解假设检验的基本思想2.掌握假设检验的步骤3.对实际问题作假设检验4.利用置信区间进行假设检验5.利用P-值进行假设检验§6.1假设检验的基本问题一.假设问题的提出二.假设的表达式三.两类错误四.假设检验中的值五.假设检验的另一种方法六.单侧检验让我们先看一个例子.基本概念生产流水线上罐装可乐不断地封装,然后装箱外运.怎么知道这批罐装可乐的容量是否合格呢?罐装可乐的容量按标准应为355毫升.基本概念每隔一定时间,抽查若干罐.如每隔1小时,抽查5罐,得5个容量的值X1,…,X5,根据这些值来判断生产是否正常.通常的办法是进行抽样检查.基本概念根据样本的信息检验关于总体的某个命题是否正确.这类问题称作假设检验问题.基本概念什么是假设?(hypothesis)对总体参数的的数值所作的一种陈述–总体参数包括总体均值、比例、方差等–分析之前必需陈述我认为该地区新生婴儿的平均体重为3190克!什么是假设检验?(hypothesistesting)1.事先对总体参数或分布形式作出某种假设,然后利用样本信息来判断原假设是否成立2.有参数假设检验和非参数假设检验3.采用逻辑上的反证法,依据统计上的小概率原理假设检验的基本思想...因此我们拒绝假设=50...如果这是总体的真实均值样本均值=50抽样分布H0这个值不像我们应该得到的样本均值...20总体假设检验的过程抽取随机样本均值X=20我认为人口的平均年龄是50岁提出假设拒绝假设!别无选择.作出决策假设检验的步骤提出假设确定适当的检验统计量规定显著性水平计算检验统计量的值作出统计决策提出原假设和备择假设什么是原假设?(nullhypothesis)1.待检验的假设,又称“0假设”2.研究者想收集证据予以反对的假设3.总是有等号,或4.表示为H0–H0:某一数值–指定为=号,即或–例如,H0:3190(克)为什么叫0假设?为什么叫0假设?之所以用零来修饰原假设,其原因是原假设的内容总是没有差异或没有改变,或变量间没有关系等等零假设总是一个与总体参数有关的问题,所以总是用希腊字母表示。关于样本统计量如样本均值或样本均值之差的零假设是没有意义的,因为样本统计量是已知的,当然能说出它们等于几或是否相等什么是备择假设?(alternativehypothesis)1.与原假设对立的假设,也称“研究假设”2.研究者想收集证据予以支持的假设总是有不等号:,或3.表示为H1–H1:某一数值,或某一数值–例如,H1:3910(克),或3910(克)提出原假设和备择假设什么检验统计量?1.用于假设检验决策的统计量2.选择统计量的方法与参数估计相同,需考虑–是大样本还是小样本–总体方差已知还是未知3.检验统计量的基本形式为确定适当的检验统计量nXZ0规定显著性水平(significantlevel)什么显著性水平?1.是一个概率值2.原假设为真时,拒绝原假设的概率–被称为抽样分布的拒绝域3.表示为(alpha)–常用的值有0.01,0.05,0.104.由研究者事先确定作出统计决策1.计算检验的统计量2.根据给定的显著性水平,查表得出相应的临界值z或z/2,t或t/23.将检验统计量的值与水平的临界值进行比较4.得出拒绝或不拒绝原假设的结论假设检验中的小概率原理什么小概率?1.在一次试验中,一个几乎不可能发生的事件发生的概率2.在一次试验中小概率事件一旦发生,我们就有理由拒绝原假设3.小概率由研究者事先确定什么是小概率?什么是小概率?概率是从0到1之间的一个数,因此小概率就应该是接近0的一个数著名的英国统计家RonaldFisher把20分之1作为标准,这也就是0.05,从此0.05或比0.05小的概率都被认为是小概率Fisher没有任何深奥的理由解释他为什么选择0.05,只是说他忽然想起来的假设检验中的两类错误1.第一类错误(弃真错误)–原假设为真时拒绝原假设–会产生一系列后果–第一类错误的概率为•被称为显著性水平2.第二类错误(取伪错误)–原假设为假时接受原假设–第二类错误的概率为(Beta)H0:无罪假设检验中的两类错误(决策结果)陪审团审判裁决实际情况无罪有罪无罪正确错误有罪错误正确H0检验决策实际情况H0为真H0为假接受H0正确决策(1–)第二类错误()拒绝H0第一类错误()正确决策(1-)假设检验就好像一场审判过程统计检验过程错误和错误的关系你不能同时减少两类错误!和的关系就像翘翘板,小就大,大就小影响错误的因素1.总体参数的真值–随着假设的总体参数的减少而增大2.显著性水平当减少时增大3.总体标准差当增大时增大4.样本容量n–当n减少时增大什么是P值?(P-value)1.是一个概率值2.如果原假设为真,P-值是抽样分布中大于或小于样本统计量的概率–左侧检验时,P-值为曲线上方小于等于检验统计量部分的面积–右侧检验时,P-值为曲线上方大于等于检验统计量部分的面积3.被称为观察到的(或实测的)显著性水平–H0能被拒绝的的最小值双侧检验的P值/2/2Z拒绝拒绝H0值临界值计算出的样本统计量计算出的样本统计量临界值1/2P值1/2P值左侧检验的P值H0值临界值样本统计量拒绝域抽样分布1-置信水平计算出的样本统计量P值右侧检验的P值H0值临界值拒绝域抽样分布1-置信水平计算出的样本统计量P值利用P值进行检验(决策准则)1.单侧检验–若p-值,不拒绝H0–若p-值,拒绝H02.双侧检验–若p-值/2,不拒绝H0–若p-值/2,拒绝H0双侧检验与单侧检验(假设的形式)假设研究的问题双侧检验左侧检验右侧检验H0=000H1≠000双侧检验(原假设与备择假设的确定)1.属于决策中的假设检验2.不论是拒绝H0还是不拒绝H0,都必需采取相应的行动措施3.例如,某种零件的尺寸,要求其平均长度为10cm,大于或小于10cm均属于不合格–我们想要证明(检验)大于或小于这两种可能性中的任何一种是否成立4.建立的原假设与备择假设应为•H0:10H1:10双侧检验(显著性水平与拒绝域)抽样分布H0值临界值临界值/2/2样本统计量拒绝域拒绝域1-置信水平双侧检验(显著性水平与拒绝域)H0值临界值临界值/2/2样本统计量拒绝域拒绝域抽样分布1-置信水平双侧检验(显著性水平与拒绝域)H0值临界值临界值/2/2样本统计量拒绝域拒绝域抽样分布1-置信水平双侧检验(显著性水平与拒绝域)H0值临界值临界值/2/2样本统计量拒绝域拒绝域抽样分布1-置信水平单侧检验(原假设与备择假设的确定)1.将研究者想收集证据予以支持的假设作为备择假设H1例如,一个研究者总是想证明自己的研究结论是正确的一个销售商总是想正确供货商的说法是不正确的备择假设的方向与想要证明其正确性的方向一致2.将研究者想收集证据证明其不正确的假设作为原假设H03.先确立备择假设H1单侧检验(原假设与备择假设的确定)一项研究表明,采用新技术生产后,将会使产品的使用寿命明显延长到1500小时以上。检验这一结论是否成立–研究者总是想证明自己的研究结论(寿命延长)是正确的–备择假设的方向为“”(寿命延长)–建立的原假设与备择假设应为H0:1500H1:1500单侧检验(原假设与备择假设的确定)一项研究表明,改进生产工艺后,会使产品的废品率降低到2%以下。检验这一结论是否成立–研究者总是想证明自己的研究结论(废品率降低)是正确的–备择假设的方向为“”(废品率降低)–建立的原假设与备择假设应为H0:2%H1:2%单侧检验(原假设与备择假设的确定)某灯泡制造商声称,该企业所生产的灯泡的平均使用寿命在1000小时以上。如果你准备进一批货,怎样进行检验检验权在销售商一方作为销售商,你总是想收集证据证明生产商的说法(寿命在1000小时以上)是不是正确的–备择假设的方向为“”(寿命不足1000小时)建立的原假设与备择假设应为H0:1000H1:1000单侧检验(显著性水平与拒绝域)H0值临界值样本统计量拒绝域抽样分布1-置信水平左侧检验(显著性水平与拒绝域)H0值临界值样本统计量拒绝域抽样分布1-置信水平观察到的样本统计量左侧检验(显著性水平与拒绝域)H0值临界值样本统计量拒绝域抽样分布1-置信水平右侧检验(显著性水平与拒绝域)H0值临界值样本统计量拒绝域抽样分布1-置信水平观察到的样本统计量右侧检验(显著性水平与拒绝域)H0值临界值样本统计量抽样分布1-置信水平拒绝域§6.2一个正态总体参数的检验一.检验统计量的确定二.总体均值的检验三.总体比例的检验四.总体方差的检验一个总体参数的检验Z检验(单尾和双尾)t检验(单尾和双尾)Z检验(单尾和双尾)2检验(单尾和双尾)均值一个总体比例方差总体均值的检验(检验统计量)总体是否已知?用样本标准差S代替t检验nSXt0小样本容量n否是z检验nXZ0z检验nSXZ0大总体均值的检验(2已知或2未知大样本)1.假定条件–总体服从正态分布–若不服从正态分布,可用正态分布来近似(n30)2.使用Z-统计量2已知:2未知:)1,0(~0NnXZ)1,0(~0NnSXZ2已知均值的检验(例题分析)【例】某机床厂加工一种零件,根据经验知道,该厂加工零件的椭圆度近似服从正态分布,其总体均值为0=0.081mm,总体标准差为=0.025。今换一种新机床进行加工,抽取n=200个零件进行检验,得到的椭圆度为0.076mm。试问新机床加工零件的椭圆度的均值与以前有无显著差异?(=0.05)双侧检验2已知均值的检验(例题分析)•H0:=0.081•H1:0.081=0.05•n=200•临界值(s):检验统计量:Z01.96-1.96.025拒绝H0拒绝H0.025决策:结论:在=0.05的水平上拒绝H0有证据表明新机床加工的零件的椭圆度与以前有显著差异83.2200025.0081.0076.00nxz2已知均值的检验(P值的计算与应用)•第1步:进入Excel表格界面,选择“插入”下拉菜单•第2步:选择“函数”点击•第3步:在函数分类中点击“统计”,在函数名的菜•单下选择字符“NORMSDIST”然后确定•第4步:将Z的绝对值2.83录入,得到的函数值为•0.997672537•P值=2(1-0.997672537)=0.004654•P值远远小于/2,故拒绝H02已知均值的检验(小样本例题分析)【例】根据过去大量资料,某厂生产的灯泡的使用寿命服从正态分布N~(1020,1002)。现从最近生产的一批产品中随机抽取16只,测得样本平均寿命为1080小时。试在0.05的显著性水平下判断这批产品的使用寿命是否有显著提高?(=0.05)单侧检验2已知均值的检验(小样本例题分析)•H0:1020•H1:1020=0.05•n=16•临界值(s):检验统计量:在=0.05的水平上拒绝H0有证据表明这批灯泡的使用寿命有显著提高决策:结论:4.214100102010800nxzZ0拒绝域0.051.6452未知大样本均值的检验(例题分析)【例】某电子元件批量生产的质量标准为平均使用寿命1200小时。某厂宣称他们采用一种新工艺生产的元件质量大大超过规定标准。为了进行验证,随机抽取了100件作为样本,测得平均使用寿命1245小时,标准差300小时。能否说该厂生产的电子元件质量显著地高于规定标准?(=0.05)单侧检验2未知大样本均值的检验(