假设检验假设检验在统计方法中的地位统计方法描述统计推断统计参数估计假设检验参数估计和假设检验参数估计和假设检验是统计推断的两个组成部分,都是利用样本对总体进行某种推断,但推断的角度不同。参数估计讨论的是用样本统计量估计总体参数的方法。假设检验讨论的是用样本信息去检验对总体参数的某种假设是否成立的程序和方法。一、假设检验的一般问题1、什么是假设检验2、假设检验的基本思想3、双侧检验和单侧检验4、假设检验中的拒绝域和接受域5、假设检验的两类错误6、假设检验的步骤1、什么是假设检验假设检验是推论统计的重要内容,是先对总体的未知数量特征作出某种假设,然后抽取样本,利用样本信息对假设的正确性进行判断的过程。统计假设有参数假设、总体分布假设、相互关系假设(两个变量是否独立,两个分布是否相同)等。参数假设是对总体参数的一种看法。总体参数包括总体均值、总体比例、总体方差等。分析之前必需陈述。我认为该企业生产的零件的平均长度为4厘米!•参数假设检验参数假设检验是通过样本信息对关于总体参数的某种假设合理与否进行检验的过程。即先对未知的总体参数的取值提出某种假设,然后抽取样本,利用样本信息去检验这个假设是否成立。如果成立就接受这个假设,如果不成立就放弃这个假设。下面主要讨论参数假设检验的问题。举例如下:•参数假设检验举例例1:根据1989年的统计资料,某地女性新生儿的平均体重为3190克。为判断该地1990年的女性新生儿体重与1989年相比有无显著差异,从该地1990年的女性新生儿中随机抽取30人,测得其平均体重为3210克。从样本数据看,1990年女新生儿体重比1989年略高,但这种差异可能是由于抽样的随机性带来的,也许这两年新生儿的体重并没有显著差异。究竟是否存在显著差异?可以先假设这两年新生儿的体重没有显著差异,然后利用样本信息检验这个假设能否成立。这是一个关于总体均值的假设检验问题。参数假设检验举例例2:某公司进口一批钢筋,根据要求,钢筋的平均拉力强度不能低于2000克,而供货商强调其产品的平均拉力强度已达到了这一要求,这时需要进口商对供货商的说法是否真实作出判断。进口商可以先假设该批钢筋的平均拉力强度不低于2000克,然后用样本的平均拉力强度来检验假设是否正确。这也是一个关于总体均值的假设检验问题。参数假设检验举例例3:某种大量生产的袋装食品,按规定每袋重量不得少于250克,现从一批该种食品中任意抽取50袋,发现有6袋重量低于250克。若规定食品不符合标准的比例达到5%就不得出厂,问该批食品能否出厂。可以先假设该批食品的不合格率不超过5%,然后用样本不合格率来检验假设是否正确。这是一个关于总体比例的假设检验问题。2、假设检验的基本思想假设检验所依据的基本原理是小概率原理。什么是小概率?概率是0~1之间的一个数,因此小概率就是接近0的一个数著名的英国统计家RonaldFisher把20分之1作为标准,也就是0.05,从此0.05或比0.05小的概率都被认为是小概率Fisher没有任何深奥的理由解释他为什么选择0.05,只是说他忽然想起来的•什么是小概率原理?小概率原理——发生概率很小的随机事件(小概率事件)在一次实验中几乎是不可能发生的。根据这一原理,可以先假设总体参数的某项取值为真,也就是假设其发生的可能性很大,然后抽取一个样本进行观察,如果样本信息显示出现了与事先假设相反的结果且与原假设差别很大,则说明原来假定的小概率事件在一次实验中发生了,这是一个违背小概率原理的不合理现象,因此有理由怀疑和拒绝原假设;否则不能拒绝原假设。检验中使用的小概率是检验前人为指定的。•小概率原理举例:某工厂质检部门规定该厂产品次品率不超过4%方能出厂。今从1000件产品中抽出10件,经检验有4件次品,问这批产品是否能出厂?如果假设这批产品的次品率P≤4%,则可计算事件“抽10件产品有4件次品”的出现概率为:可见,概率是相当小的,1万次实验中可能出现4次,然而概率如此小的事件,在一次实验中居然发生了,这是不合理的,而不合理的根源在于假设次品率P≤4%,因而认为假设次品率P≤4%是不能成立的,故按质检部门的规定,这批产品不能出厂。00042.0)04.01()04.0()4(6441010CP假设检验的基本思想...因此我们拒绝假设=50...如果这是总体的真实均值样本均值=50抽样分布H0这个值不像我们应该得到的样本均值...20XX•假设检验的两个特点:第一,假设检验采用逻辑上的反证法,即为了检验一个假设是否成立,首先假设它是真的,然后对样本进行观察,如果发现出现了不合理现象,则可以认为假设是不合理的,拒绝假设。否则可以认为假设是合理的,接受假设。第二,假设检验采用的反证法带有概率性质。所谓假设的不合理不是绝对的,而是基于实践中广泛采用的小概率事件几乎不可能发生的原则。至于事件的概率小到什么程度才算是小概率事件,并没有统一的界定标准,而是必须根据具体问题而定。如果一旦判断失误,错误地拒绝原假设会造成巨大损失,那么拒绝原假设的概率就应定的小一些;如果一旦判断失误,错误地接受原假设会造成巨大损失,那么拒绝原假设的概率就应定的大一些。小概率通常用α表示,又称为检验的显著性水平。通常取α=0.05或α=0.01,即把概率不超过0.05或0.01的事件当作小概率事件。•原假设和备择假设假设检验中,我们称作为检验对象的待检验假设为原假设或零假设,用H0表示。原假设的对立假设称为备择假设或备选假设,用H1表示。例如,设为总体均值的某一确定值。(1)对于总体均值是否等于某一确定值的原假设可以表示为:H0:(如H0:3190克)其对应的备择假设则表示为:H1:(如H1:≠3190克)0XX0XXXX0XX原假设和备择假设(2)对于总体均值X是否大于某一确定值X0的原假设可以表示为:H0:X≥X0(如H0:X≥2000克)其对应的备择假设则表示为:H1:X<X0(如H1:X<2000克)(3)对于总体均值X是否小于某一确定值X0的原假设可以表示为:H0:X≤X0(如H0:X≤5%)其对应的备择假设则表示为:H1:X>X0(如H1:X>5%)注意:原假设总是有等号:或或。3、双侧检验和单侧检验根据假设的形式不同,假设检验可以分为双侧假设检验和单侧假设检验。若原假设是总体参数等于某一数值,如H0:X=X0,即备择假设H1:X≠X0,那么只要X<X0和X>X0二者中有一个成立,就可以否定原假设。这种假设检验称为双侧检验。若原假设是总体参数大于等于或小于等于某一数值,如H0:X≥X0(即H1:X<X0);或H0:X≤X0(即H1:X>X0),那么对于前者当X<X0时,对于后者当X>X0时,可以否定原假设。这种假设检验称为单侧检验。可以分为左侧检验和右侧检验。双侧检验与单侧检验(假设的形式)假设研究的问题(总体均值检验)双侧检验左侧检验右侧检验H0X=X0XX0XX0H1X≠X0XX0XX04、假设检验中的拒绝域和接受域在规定了检验的显著性水平α后,根据容量为n的样本,按照统计量的理论概率分布规律,可以确定据以判断拒绝和接受原假设的检验统计量的临界值。临界值将统计量的所有可能取值区间分为两个互不相交的部分,即原假设的拒绝域和接受域。对于正态总体,总体均值的假设检验可有如下图示:•正态总体,总体均值假设检验图示:(1)双侧检验设H0:X=X0,H1:X≠X0,有两个临界值,两个拒绝域,每个拒绝域的面积为α/2。也称双尾检验。双侧检验示意图X0双侧检验示意图(显著性水平与拒绝域)抽样分布H0值临界值临界值a/2a/2样本统计量拒绝域拒绝域接受域1-a置信水平双侧检验示意图(显著性水平与拒绝域)H0值临界值临界值a/2a/2样本统计量拒绝域拒绝域接受域抽样分布1-a置信水平观察到的样本统计量双侧检验示意图(显著性水平与拒绝域)H0值临界值临界值a/2a/2样本统计量拒绝域拒绝域接受域抽样分布1-a置信水平观察到的样本统计量双侧检验示意图(显著性水平与拒绝域)H0值临界值临界值a/2a/2样本统计量拒绝域拒绝域接受域抽样分布1-a置信水平观察到的样本统计量(2)单侧检验有一个临界值,一个拒绝域,拒绝域的面积为α。分为左侧检验和右侧检验两种情况。单侧检验示意图(显著性水平与拒绝域)H0值临界值a样本统计量拒绝域接受域抽样分布1-a置信水平左侧检验设H0:X≥X0,H1:X<X0;临界值和拒绝域均在左侧。也称下限检验。X0左侧检验示意图(显著性水平与拒绝域)H0值临界值a样本统计量拒绝域接受域抽样分布1-a置信水平观察到的样本统计量左侧检验示意图(显著性水平与拒绝域)H0值临界值a样本统计量拒绝域接受域抽样分布1-a置信水平观察到的样本统计量右侧检验设H0:X≤X0,H1:X>X0;临界值和拒绝域均在右侧。也称上限检验。X0右侧检验示意图(显著性水平与拒绝域)H0值临界值a样本统计量拒绝域接受域抽样分布1-a置信水平观察到的样本统计量右侧检验示意图(显著性水平与拒绝域)H0值临界值a样本统计量接受域抽样分布1-a置信水平拒绝域观察到的样本统计量5、假设检验的两类错误根据假设检验做出判断无非下述四种情况:1、原假设真实,并接受原假设,判断正确;2、原假设不真实,且拒绝原假设,判断正确;3、原假设真实,但拒绝原假设,判断错误;4、原假设不真实,却接受原假设,判断错误。假设检验是依据样本提供的信息进行判断,有犯错误的可能。所犯错误有两种类型:第一类错误是原假设H0为真时,检验结果把它当成不真而拒绝了。犯这种错误的概率用α表示,也称作α错误(αerror)或弃真错误。第二类错误是原假设H0不为真时,检验结果把它当成真而接受了。犯这种错误的概率用β表示,也称作β错误(βerror)或取伪错误。假设检验的两类错误正确决策和犯错误的概率可以归纳为下表:假设检验中各种可能结果的概率接受H0拒绝H0,接受H1H0为真1-α(正确决策)α(弃真错误)H0为伪β(取伪错误)1-β(正确决策)•假设检验两类错误关系的图示以单侧上限检验为例,设H0:X≤X0,H1:X>X0从上图可以看出,如果临界值沿水平方向右移,α将变小而β变大,即若减小α错误,就会增大犯β错误的机会;如果临界值沿水平方向左移,α将变大而β变小,即若减小β错误,也会增大犯α错误的机会。图(a)X≤X0H0为真图(b)X=X1>X0H0为伪a错误和错误的关系a你不能同时减少两类错误!a和的关系就像翘翘板,a小就大,a大就小在样本容量n一定的情况下,假设检验不能同时做到犯α和β两类错误的概率都很小。若减小α错误,就会增大犯β错误的机会;若减小β错误,也会增大犯α错误的机会。要使α和β同时变小只有增大样本容量。但样本容量增加要受人力、经费、时间等很多因素的限制,无限制增加样本容量就会使抽样调查失去意义。因此假设检验需要慎重考虑对两类错误进行控制的问题。•两类错误的控制准则假设检验中人们普遍执行同一准则:首先控制弃真错误(α错误)。假设检验的基本法则以α为显著性水平就体现了这一原则。两个理由:统计推断中大家都遵循统一的准则,讨论问题会比较方便。更重要的是:原假设常常是明确的,而备择假设往往是模糊的。如H0:X=X0很清楚,而H1:X≠X0则不太清楚,是X<X0还是X>X0?大多少小多少都不清楚。对含义清晰的数量标准进行检验更容易被接受。因此,第一类错误成为控制两类错误的重点。6、假设检验的步骤㈠根据研究需要提出原假设H0和备择假设H1㈡确定适当的检验统计量㈢确定显著性水平α和临界值及拒绝域㈣根据样本数据计算检验统计量的值(或P值)㈤将检验统计量值与临界值比较,作出拒绝或接受原假设的决策假设检验的步骤㈠根据研究需要提出原假设H0和备择假设H1应该注意:⑴对任一假设检验问题,其所有可能结