贾俊平-统计学-第6章-假设检验

整理文档很辛苦,赏杯茶钱您下走!

免费阅读已结束,点击下载阅读编辑剩下 ...

阅读已结束,您可以下载文档离线阅读编辑

资源描述

数据分析(方法与案例)作者贾俊平统计学6-2统计学STATISTICS(第四版)2020-2-26……正如一个法庭宣告某一判决为“无罪(notguilty)”而不为“清白(innocent)”,统计检验的结论也应为“不拒绝”而不为“接受”。——JanKmenta统计名言第6章假设检验6.1假设检验的基本原理6.2一个总体参数的检验6.3两个总体参数的检验6-4统计学STATISTICS(第四版)2020-2-26学习目标假设检验的基本思想和原理假设检验的步骤一个总体参数的检验两个总体参数的检验P值的计算与应用用Excel进行检验6-5统计学STATISTICS(第四版)2020-2-26正常人的平均体温是37oC吗?当问起健康的成年人体温是多少时,多数人的回答是37oC,这似乎已经成了一种共识。下面是一个研究人员测量的50个健康成年人的体温数据37.136.936.937.136.436.936.636.236.736.937.636.737.336.936.436.137.136.636.536.737.136.236.337.536.937.036.736.937.037.136.637.236.436.637.336.137.137.036.636.936.737.236.337.136.736.837.037.036.137.06-6统计学STATISTICS(第四版)2020-2-26正常人的平均体温是37oC吗?根据样本数据计算的平均值是36.8oC,标准差为0.36oC根据参数估计方法得到的健康成年人平均体温的95%的置信区间为(36.7,36.9)。研究人员发现这个区间内并没有包括37oC因此提出“不应该再把37oC作为正常人体温的一个有任何特定意义的概念”我们应该放弃“正常人的平均体温是37oC”这个共识吗?本章的内容就将提供一套标准统计程序来检验这样的观点6.1假设检验的基本原理6.1.1怎样提出假设?6.1.2怎样做出决策?6.1.3怎样表述决策结果?第6章假设检验6.1.1怎样提出假设?6.1假设检验的基本原理6-9统计学STATISTICS(第四版)2020-2-26什么是假设?(hypothesis)在参数检验中,对总体参数的具体数值所作的陈述就一个总体而言,总体参数包括总体均值、比例、方差等分析之前必需陈述我认为这种新药的疗效比原有的药物更有效!6-10统计学STATISTICS(第四版)2020-2-26什么是假设检验?(hypothesistest)1.先对总体的参数(或分布形式)提出某种假设,然后利用样本信息判断假设是否成立的统计方法2.有参数检验和非参数检验3.逻辑上运用反证法,统计上依据小概率原理小概率是在一次试验中,一个几乎不可能发生的事件发生的概率在一次试验中小概率事件一旦发生,我们就有理由拒绝原假设6-11统计学STATISTICS(第四版)2020-2-26原假设(nullhypothesis)1.又称“0假设”,研究者想收集证据予以反对的假设,用H0表示2.所表达的含义总是指参数没有变化或变量之间没有关系3.最初被假设是成立的,之后根据样本数据确定是否有足够的证据拒绝它4.总是有符号,或H0:=某一数值H0:某一数值H0:某一数值例如,H0:10cm6-12统计学STATISTICS(第四版)2020-2-261.也称“研究假设”,研究者想收集证据予以支持的假设,用H1或Ha表示2.所表达的含义是总体参数发生了变化或变量之间有某种关系3.备择假设通常用于表达研究者自己倾向于支持的看法,然后就是想办法收集证据拒绝原假设,以支持备择假设4.总是有符号,或H1:某一数值H1:某一数值H1:某一数值备择假设(alternativehypothesis)6-13统计学STATISTICS(第四版)2020-2-261.备择假设没有特定的方向性,并含有符号“”的假设检验,称为双侧检验或双尾检验(two-tailedtest)2.备择假设具有特定的方向性,并含有符号“”或“”的假设检验,称为单侧检验或单尾检验(one-tailedtest)备择假设的方向为“”,称为左侧检验备择假设的方向为“”,称为右侧检验双侧检验与单侧检验6-14统计学STATISTICS(第四版)2020-2-26双侧检验与单侧检验(假设的形式)假设双侧检验单侧检验左侧检验右侧检验原假设H0:=0H0:0H0:0备择假设H1:≠0H1:0H1:0以总体均值的检验为例6-15统计学STATISTICS(第四版)2020-2-26【例6-1】一种零件的生产标准是直径应为10cm,为对生产过程进行控制,质量监测人员定期对一台加工机床检查,确定这台机床生产的零件是否符合标准要求。如果零件的平均直径大于或小于10cm,则表明生产过程不正常,必须进行调整。试陈述用来检验生产过程是否正常的原假设和被择假设提出假设(例题分析)解:研究者想收集证据予以证明的假设应该是“生产过程不正常”。建立的原假设和备择假设为H0:10cmH1:10cm6-16统计学STATISTICS(第四版)2020-2-26【例6-2】某品牌洗涤剂在它的产品说明书中声称:平均净含量不少于500克。从消费者的利益出发,有关研究人员要通过抽检其中的一批产品来验证该产品制造商的说明是否属实。试陈述用于检验的原假设与备择假设提出假设(例题分析)解:研究者抽检的意图是倾向于证实这种洗涤剂的平均净含量并不符合说明书中的陈述。建立的原假设和备择假设为H0:500H1:500500g绿叶洗涤剂6-17统计学STATISTICS(第四版)2020-2-26【例6-3】一家研究机构估计,某城市中家庭拥有汽车的比例超过30%。为验证这一估计是否正确,该研究机构随机抽取了一个样本进行检验。试陈述用于检验的原假设与备择假设提出假设(例题分析)解:研究者想收集证据予以支持的假设是“该城市中家庭拥有汽车的比例超过30%”。建立的原假设和备择假设为H0:30%H1:30%6-18统计学STATISTICS(第四版)2020-2-261.原假设和备择假设是一个完备事件组,而且相互对立在一项假设检验中,原假设和备择假设必有一个成立,而且只有一个成立2.先确定备择假设,再确定原假设3.等号“=”总是放在原假设上4.因研究目的不同,对同一问题可能提出不同的假设(也可能得出不同的结论)提出假设(结论与建议)6.1.2怎样做出决策?6.1假设检验的基本原理6-20统计学STATISTICS(第四版)2020-2-26两类错误与显著性水平1.研究者总是希望能做出正确的决策,但由于决策是建立在样本信息的基础之上,而样本又是随机的,因而就有可能犯错误2.原假设和备择假设不能同时成立,决策的结果要么拒绝H0,要么不拒绝H0。决策时总是希望当原假设正确时没有拒绝它,当原假设不正确时拒绝它,但实际上很难保证不犯错误3.第Ⅰ类错误(错误)原假设为正确时拒绝原假设第Ⅰ类错误的概率记为,被称为显著性水平2.第Ⅱ类错误(错误)原假设为错误时未拒绝原假设第Ⅱ类错误的概率记为(Beta)6-21统计学STATISTICS(第四版)2020-2-26两类错误的控制1.一般来说,对于一个给定的样本,如果犯第Ι类错误的代价比犯第Ⅱ类错误的代价相对较高,则将犯第Ⅰ类错误的概率定得低些较为合理;反之,如果犯第Ι类错误的代价比犯第Ⅱ类错误的代价相对较低,则将犯第Ⅰ类错误的概率定得高些2.一般来说,发生哪一类错误的后果更为严重,就应该首要控制哪类错误发生的概率。但由于犯第Ι类错误的概率是可以由研究者控制的,因此在假设检验中,人们往往先控制第Ι类错误的发生概率6-22统计学STATISTICS(第四版)2020-2-26显著性水平(significantlevel)1.事先确定的用于拒绝原假设H0时所必须的证据2.能够容忍的犯第Ⅰ类错误的最大概率(上限值)2.原假设为真时,拒绝原假设的概率抽样分布的拒绝域3.表示为(alpha)常用的值有0.01,0.05,0.104.由研究者事先确定6-23统计学STATISTICS(第四版)2020-2-26依据什么做出决策?1.若假设为H0:=500,H1:500。样本均值为495,拒绝H0吗?样本均值为502,拒绝H0吗?2.做出拒绝或不拒绝原假设的依据是什么?3.传统上,做出决策所依据的是样本统计量,现代检验中人们直接使用由统计量算出的犯第Ⅰ类错误的概率,即所谓的P值6-24统计学STATISTICS(第四版)2020-2-261.根据样本观测结果计算出对原假设和备择假设做出决策某个样本统计量2.对样本估计量的标准化结果原假设H0为真点估计量的抽样分布检验统计量(teststatistic)点估计量的抽样标准差假设值—点估计量标准化检验统计量3.标准化的检验统计量6-25统计学STATISTICS(第四版)2020-2-26用统计量决策(双侧检验)抽样分布H0临界值临界值/2/2拒绝H0拒绝H01-非拒绝域RegionofRejectionRegionofNonrejectionRegionofRejection6-26统计学STATISTICS(第四版)2020-2-26用统计量决策(左侧检验)抽样分布H0临界值拒绝H01-非拒绝域RegionofRejectionRegionofNonrejection6-27统计学STATISTICS(第四版)2020-2-26用统计量决策(右侧检验)抽样分布H0临界值拒绝H01-非拒绝域RegionofNonrejectionRegionofRejection6-28统计学STATISTICS(第四版)2020-2-26统计量决策规则1.给定显著性水平,查表得出相应的临界值z或z/2,t或t/22.将检验统计量的值与水平的临界值进行比较3.作出决策双侧检验:I统计量I临界值,拒绝H0左侧检验:统计量-临界值,拒绝H0右侧检验:统计量临界值,拒绝H06-29统计学STATISTICS(第四版)2020-2-26用P值决策(P-value)1.如果原假设为真,所得到的样本结果会像实际观测结果那么极端或更极端的概率•P值告诉我们:如果原假设是正确的话,我们得到得到目前这个样本数据的可能性有多大,如果这个可能性很小,就应该拒绝原假设2.被称为观察到的(或实测的)显著性水平3.决策规则:若p值,拒绝H06-30统计学STATISTICS(第四版)2020-2-26双侧检验的P值/2/2Z拒绝H0拒绝H00临界值计算出的样本统计量计算出的样本统计量临界值1/2P值1/2P值6-31统计学STATISTICS(第四版)2020-2-26左侧检验的P值Z拒绝H00临界值计算出的样本统计量P值6-32统计学STATISTICS(第四版)2020-2-26右侧检验的P值Z拒绝H00计算出的样本统计量临界值P值6-33统计学STATISTICS(第四版)2020-2-26P值是关于数据的概率1.P值原假设的对或错的概率无关2.它反映的是在某个总体的许多样本中某一类数据出现的经常程度,它是当原假设正确时,得到目前这个样本数据的概率比如,要检验全校学生的平均生活费支出是否等于500元,检验的假设为H0:=500;H0:500。假定抽出一个样本算出的样本均值600元,得到的值为P=0.02,这个0.02是指如果平均生活费支出真的是500元的话,那么,从该总体中抽出一个均值为600的样本的概率仅为0.02。如果你认为这个概率太小了,就可以拒绝原假设,因为如果原假设正确的话,几乎不可能抓到这样的一个样本,既然抓到了,就表明这样的样本不在少数,所以原假设是不对的3.值越小,你拒绝原假设的理由就越充分6-34统计学STATISTI

1 / 119
下载文档,编辑使用

©2015-2020 m.777doc.com 三七文档.

备案号:鲁ICP备2024069028号-1 客服联系 QQ:2149211541

×
保存成功