……正如一个法庭宣告某一判决为“无罪(notguilty)”而不为“清白(innocent)”,统计检验的结论也应为“不拒绝”而不为“接受”。JanKmenta假设检验在统计方法中的地位统计方法描述统计推断统计参数估计假设检验第8章假设检验8.1假设检验的基本问题8.2一个总体参数的检验8.3假设检验中的其他问题8.1假设检验的基本问题8.1.1假设问题的提出8.1.2假设的表达式8.1.3两类错误8.1.4假设检验的流程8.1.5利用P值进行决策8.1.6单侧检验假设问题的提出什么是假设检验?(hypothesistest)1、先对总体的参数(或分布形式)提出某种假设,然后利用样本信息判断假设是否成立的过程2、逻辑上运用反证法,统计上依据小概率原理1989年新生儿平均体重3190克;1990年的新生儿随机抽取100个,平均体重3210克;问:1990年的新生儿与1989年相比,体重有无明显差异?分析:这20克产生的原因可能是随机抽样产生的,亦可能是确实1990年体重增加。那么,到底是哪个答案,则需要我们提出假设。假设办法:假设1990与1989没有明显差异。用m0表示1989年新生儿体重,u表示1990新生儿体重,则可以表示为u=m0,或u-m0=0。那么,现在的任务就是利用1990样本信息检验这个等式是否成立,看1990新生儿平均体重是否等于我们感兴趣的数值。假设的表达式原假设(nullhypothesis)1.H0:u=3190(克)由于H0表示原假设,下标用0修饰,又称“零假设”解释:3190克是我们感兴趣的1989年的新生儿体重均值,即,我们在假设1990年的新生儿与1989年的新生儿的体重没有什么差异。零假设的内涵之所以用零来修饰原假设,其原因是原假设的内容总是表示没有差异或没有改变,或变量间没有关系等等零假设总是一个与总体参数有关的问题,而关于样本统计量之间的零假设是没有意义的,如样本均值或样本均值之差,因为样本统计量是已知的,当然能说出它们等于几或是否相等1、H0:u=3190毕竟是假设,如果不成立,就要拒绝原假设。这时需要选择另一个假设,这个假设就是备择假设。即:H1:u≠3190(克)(有符号,或)2、H1为备择假设,表示1990年新生儿与1989年新生儿体重有明显差异。也可表达为:H1:u≠m0或H1:u-m0≠0备择假设(alternativehypothesis)1.原假设和备择假设是一个完备事件组,而且相互对立在一项假设检验中,原假设和备择假设必有一个成立,而且只有一个成立2.先确定备择假设,再确定原假设3.等号“=”总是放在原假设上4.因研究目的不同,对同一问题可能提出不同的假设(也可能得出不同的结论)提出假设(结论与建议)【例】一种零件的生产标准是直径应为10cm,为对生产过程进行控制,质量监测人员定期对一台加工机床检查,确定这台机床生产的零件是否符合标准要求。如果零件的平均直径大于或小于10cm,则表明生产过程不正常,必须进行调整。试陈述用来检验生产过程是否正常的原假设和备择假设提出假设(例题分析)解:研究者想收集证据予以证明的假设应该是“生产过程不正常”。建立的原假设和备择假设为H0:m10cmH1:m10cm【例】某品牌洗涤剂在它的产品说明书中声称:平均净含量不少于500g。从消费者的利益出发,有关研究人员要通过抽检其中的一批产品来验证该产品制造商的说明是否属实。试陈述用于检验的原假设与备择假设提出假设(例题分析)解:研究者抽检的意图是倾向于证实这种洗涤剂的平均净含量并不符合说明书中的陈述。建立的原假设和备择假设为H0:m500H1:m500500g立白洗涤剂【例】一家研究机构估计,某城市中家庭拥有汽车的比例超过30%。为验证这一估计是否正确,该研究机构随机抽取了一个样本进行检验。试陈述用于检验的原假设与备择假设提出假设(例题分析)解:研究者想收集证据予以支持的假设是“该城市中家庭拥有汽车的比例超过30%”。建立的原假设和备择假设为H0:m30%H1:m30%1、某厂生产的化纤度服从正态分布,纤维度的均值为1.4。某天测得25根纤维的均值为1.39,检验与原来设计的标准均值相比是否有所变化,则假设形式是?2、某一贫困地区估计营养不良人数高达20%,然而有人认为这个比例实际上还要高,要经验该说法是否正确,则假设形式为?3、一项新的减肥计划声称:在计划实施的第一周内,参加者的体重平均可以减轻8磅。随机抽取40位样本,发现样本的体重平均减少7磅,标准差为3.2磅,则假设形式为?两类错误假设检验中的两类错误1.第Ⅰ类错误(弃真错误)原假设为正确时拒绝原假设第Ⅰ类错误的概率记为2.第Ⅱ类错误(取伪错误)原假设为错误时未拒绝原假设第Ⅱ类错误的概率记为(Beta)显著性水平(significantlevel)1.是一个概率值2.原假设为真时,拒绝原假设的概率抽样分布的拒绝域3.表示为(alpha)4.由研究者事先确定影响错误的因素1.总体参数的真值随着假设的总体参数的减少而增大2.显著性水平当减少时增大3.样本容量n当n减少时增大错误和错误的关系你要同时减少两类错误的惟一办法是增加样本容量!和的关系就像翘翘板,小就大,大就小两类错误的控制1.一般来说,对于一个给定的样本,如果犯第Ι类错误的代价比犯第Ⅱ类错误的代价相对较高,则将犯第Ⅰ类错误的概率定得低些较为合理;反之,如果犯第Ι类错误的代价比犯第Ⅱ类错误的代价相对较低,则将犯第Ⅰ类错误的概率定得高些2.一般来说,发生哪一类错误的后果更为严重,就应该首要控制哪类错误发生的概率。但由于大家一般首先控制错误,另外,第Ι类错误常常比较明确,而第Ⅱ类比较模糊,因此在假设检验中,人们往往先控制第Ι类错误的发生概率假设检验中的小概率原理什么是小概率?1.在一次试验中,一个几乎不可能发生的事件发生的概率2.在一次试验中小概率事件一旦发生,我们就有理由拒绝原假设3.小概率由研究者事先确定在假设检验中,不拒绝原假设意味着()A原假设肯定是正确的B原假设肯定是错误的C没有证据证明原假设是正确的D没有证据证明原假设是错误的在假设检验中,原假设和备择假设()A都有可能成立B都有可能不成立C只有一个成立而且必有一个成立D原假设一定成立,备择假设不一定成立在假设检验中,第一类错误是指()A当原假设正确时拒绝原假设B当原假设错误时拒绝原假设C当备择假设正确时拒绝备择假设D当备择假设错误时未拒绝备择假设假设检验步骤1.陈述原假设和备择假设2.从所研究的总体中抽出一个随机样本3.确定一个适当的检验统计量,并利用样本数据算出其具体数值4.确定一个适当的显著性水平,并计算出其临界值,指定拒绝域5.将统计量的值与临界值进行比较,作出决策统计量的值落在拒绝域,拒绝H0,否则不拒绝H0根据样本观测结果计算得到的,并据以对原假设和备择假设作出决策的某个样本统计量检验统计量(teststatistic)1.备择假设没有特定的方向性,并含有符号“”的假设检验,称为双侧检验或双尾检验(two-tailedtest)2.备择假设具有特定的方向性,并含有符号“”或“”的假设检验,称为单侧检验或单尾检验(one-tailedtest)备择假设的方向为“”,称为左侧检验备择假设的方向为“”,称为右侧检验双侧检验与单侧检验双侧检验与单侧检验(假设的形式)假设双侧检验单侧检验左侧检验右侧检验原假设H0:m=m0H0:mm0H0:mm0备择假设H1:m≠m0H1:mm0H1:mm0以总体均值的检验为例显著性水平和拒绝域(双侧检验)抽样分布H0临界值临界值/2/2拒绝H0拒绝H01-置信水平拒绝域非拒绝域拒绝域显著性水平和拒绝域(双侧检验)H0临界值临界值/2/2样本统计量拒绝H0拒绝H0抽样分布1-置信水平显著性水平和拒绝域(双侧检验)H0临界值临界值/2/2样本统计量拒绝H0拒绝H0抽样分布1-置信水平显著性水平和拒绝域(双侧检验)H0临界值临界值/2/2样本统计量拒绝H0拒绝H0抽样分布1-置信水平显著性水平和拒绝域(单侧检验)H0临界值拒绝H0抽样分布1-置信水平显著性水平和拒绝域(左侧检验)H0临界值拒绝H0抽样分布1-置信水平样本统计量显著性水平和拒绝域(左侧检验)H0临界值样本统计量拒绝H0抽样分布1-置信水平显著性水平和拒绝域(右侧检验)H0临界值样本统计量拒绝H0抽样分布1-置信水平显著性水平和拒绝域(右侧检验)H0临界值样本统计量抽样分布1-置信水平拒绝H0利用P值进行决策什么是P值?(P-value)1.如果原假设为真,所得到的样本结果会像实际观测结果那么极端或更极端的概率•P值告诉我们:如果原假设是正确的话,我们得到目前这个样本数据的可能性有多大,如果这个可能性很小,就应该拒绝原假设2.被称为观察到的(或实测的)显著性水平3.决策规则:若p值,拒绝H0双侧检验的P值/2/2Z拒绝H0拒绝H00临界值计算出的样本统计量计算出的样本统计量临界值1/2P值1/2P值左侧检验的P值0临界值样本统计量拒绝H0抽样分布1-置信水平计算出的样本统计量P值右侧检验的P值0临界值拒绝H0抽样分布1-置信水平计算出的样本统计量P值假设检验结论的表述假设检验结论的表述(“显著”与“不显著”)1.当拒绝原假设时,我们称样本结果是统计上显著的拒绝原假设时结论是清楚的2.当不拒绝原假设时,我们称样本结果是统计上不显著的不拒绝原假设时,并未给出明确的结论,不能说原假设是正确的,也不能说它不是正确(宣判无罪,不代表真正的无罪,只是无证据说有罪而已)假设检验结论的表述(“接受”与“不拒绝”)1.假设检验的目的在于试图找到证据拒绝原假设,而不在于证明什么是正确的2.当没有足够证据拒绝原假设时,不采用“接受原假设”的表述,而采用“不拒绝原假设”的表述。“不拒绝”的表述实际上意味着并未给出明确的结论,我们没有说原假设正确,也没有说它不正确3.“接受”的说法有时会产生误导,因为这种说法似乎暗示着原假设已经被证明是正确的了。但事实上,H0的真实值我们永远也无法知道,H0只是对总体真实值的一个假定值,由样本提供的信息也就自然无法证明它是否正确假设检验结论的表述(为什么不说“接受”)【例】比如原假设为H0:m=10,从该总体中抽出一个随机样本,得到x=9.8,在=0.05的水平上,样本提供的证据没有推翻这一假设,我们说“接受”原假设,这意味着样本提供的证据已经证明m=10是正确的。如果我们将原假设改为H0:m=10.5,同样,在=0.05的水平上,样本提供的证据也没有推翻这一假设,我们又说“接受”原假设。但这两个原假设究竟哪一个是“真实的”呢?我们不知道,因而改用不拒绝的说法。8-53统计学STATISTICS(第二版)随机抽取一个n=40的样本,得到=16.5,s=7.在=0.02的显著性水平下,检验假设H0:u15,H115,统计量的临界值为()8.2一个总体参数的检验8.2.1检验统计量的确定8.2.2总体均值的检验8.2.3总体比例的检验8.2.4总体方差的检验检验统计量的确定一个总体参数的检验,检验统计量主要有Z统计量、t统计量和卡方统计量。1、大样本情况下,把样本统计量视为正态分布,如总体方差未知,则用样本方差s代替。2、小样本情况下,看总体方差是否已知。若已知,用Z统计量;若未知,采用t分布。一个总体参数的检验z检验(单尾和双尾)t检验(单尾和双尾)z检验(单尾和双尾)2检验(单尾和双尾)均值总体参数比例方差总体均值的检验总体均值的检验(作出判断)是否已知小样本容量n大是否已知否t检验nsxt0m否z检验nsxz0m是z检验nxzm0是z检验nxzm0总体均值的检验(大样本)总体均值的检验(大样本)1.假定条件正态总体或非正态总体大样本(n30)2.使用z检验统计量2已知:2未知:)1,0(~0Nnxz