统计学第六章假设检验PPT

整理文档很辛苦,赏杯茶钱您下走!

免费阅读已结束,点击下载阅读编辑剩下 ...

阅读已结束,您可以下载文档离线阅读编辑

资源描述

6-1统计学(核心课程)第6章假设检验作者:中国人民大学统计学院贾俊平6-2统计学(核心课程)第6章假设检验6.1基本概念和步骤6.2总体均值检验6.3总体比例的检验6-3统计学(核心课程)假设检验在统计方法中的地位统计方法描述统计推断统计参数估计假设检验6-4统计学(核心课程)假设检验问题某商场声称其顾客满意度在95%以上;某种饮料包装量的质量标准为500ml;制药公司声称其新开发的某种药物总有效率比现有药物更高;某公司轮胎生产线经过工艺技术改造是否提高产品质量?6-5统计学(核心课程)6.1基本概念和步骤一.什么是假设检验?二.原假设与备择假设三.拒绝域和检验统计量四.两类错误和显著性水平五.单侧检验与双侧检验六.基本步骤总结七.P值方法6-6统计学(核心课程)什么是假设检验6-7统计学(核心课程)什么是假设?(hypothesis)对总体参数的具体数值所作的陈述总体参数包括总体均值、比例、方差等分析之前必需陈述我认为这种新药的疗效比原有的药物更有效!6-8统计学(核心课程)什么是假设检验?(hypothesistest)1.先对总体的参数提出某种假设,然后利用样本信息判断假设是否成立的过程2.有参数检验和非参数检验3.逻辑上运用反证法,统计上依据小概率原理6-9统计学(核心课程)什么是假设检验?某厂商宣称其次品率只有1%,如果随机抽取10件产品,其中有2件是次品,那么如何进行假设检验?要检验的假设:全部产品的次品率为1%。来自总体的次品数服从二项分布b(10,0.01),容易计算得到“抽取10件产品中有2件次品”的概率只有0.42%。就是说,小概率事件发生了。在一次试验中小概率事件是不应该发生的,这就让人不得不怀疑原有的“假设”。6-10统计学(核心课程)假设检验的基本思想...因此我们拒绝假设=500...如果这是总体的真实均值样本均值=500抽样分布H0这个值不像我们应该得到的样本均值...4506-11统计学(核心课程)总体假设检验的过程抽取随机样本均值x=450规定的平均容量为500ml提出假设拒绝假设别无选择!作出决策6-12统计学(核心课程)原假设与备择假设6-13统计学(核心课程)原假设(nullhypothesis)1.研究者想收集证据予以拒绝的假设2.又称“0假设”3.总是有符号,或4.表示为H0H0:=某一数值指定为符号=,或例如,H0:10cm6-14统计学(核心课程)1.研究者想收集证据予以支持的假设2.也称“研究假设”3.总是有符号,或4.表示为H1H1:某一数值,或某一数值,或某一数值例如,H1:10cm备择假设(alternativehypothesis)6-15统计学(核心课程)【例】一种零件的生产标准是直径应为10cm,为对生产过程进行控制,质量监测人员定期对一台加工机床检查,确定这台机床生产的零件是否符合标准要求。如果零件的平均直径大于或小于10cm,则表明生产过程不正常,必须进行调整。试陈述用来检验生产过程是否正常的原假设和被择假设提出假设(例题分析)解:研究者想收集证据予以证明的假设应该是“生产过程不正常”。建立的原假设和备择假设为H0:10cmH1:10cm6-16统计学(核心课程)【例】某品牌洗涤剂在它的产品说明书中声称:平均净含量不少于500克。从消费者的利益出发,有关研究人员要通过抽检其中的一批产品来验证该产品制造商的说明是否属实。试陈述用于检验的原假设与备择假设提出假设(例题分析)解:研究者抽检的意图是倾向于证实这种洗涤剂的平均净含量并不符合说明书中的陈述。建立的原假设和备择假设为H0:500H1:500500g绿叶洗涤剂6-17统计学(核心课程)【例】一家研究机构估计,某城市中家庭拥有汽车的比例超过30%。为验证这一估计是否正确,该研究机构随机抽取了一个样本进行检验。试陈述用于检验的原假设与备择假设提出假设(例题分析)解:研究者想收集证据予以支持的假设是“该城市中家庭拥有汽车的比例超过30%”。建立的原假设和备择假设为H0:30%H1:30%6-18统计学(核心课程)1.原假设和备择假设是一个完备事件组,而且相互对立2.先确定备择假设,再确定原假设3.等号“=”总是放在原假设上4.因研究目的不同,对同一问题可能提出不同的假设(也可能得出不同的结论)提出假设(结论与建议)6-19统计学(核心课程)双侧检验与单侧检验6-20统计学(核心课程)1.备择假设没有特定的方向性,并含有符号“”的假设检验,称为双侧检验或双尾检验(two-tailedtest)2.备择假设具有特定的方向性,并含有符号“”或“”的假设检验,称为单侧检验或单尾检验(one-tailedtest)备择假设的方向为“”,称为左侧检验备择假设的方向为“”,称为右侧检验双侧检验与单侧检验6-21统计学(核心课程)双侧检验与单侧检验(假设的形式)假设双侧检验单侧检验左侧检验右侧检验原假设H0:=0H0:0H0:0备择假设H1:≠0H1:0H1:06-22统计学(核心课程)两类错误与显著性水平6-23统计学(核心课程)冤枉好人与放过坏人无罪推定原则:在证明被告有罪之前先假设他无罪。原假设:被告无罪。备选假设:被告有罪。法官可能犯两类错误:第一类错误是被告无罪却被判有罪,这就“冤枉好人”;第二类错误是被告有罪却被判无罪,这就“放过坏人”在一定的证据下,犯两类错误的概率是相互消长的。6-24统计学(核心课程)假设检验中的两类错误1.第Ⅰ类错误(弃真错误)原假设为真时拒绝原假设第Ⅰ类错误的概率为被称为显著性水平2.第Ⅱ类错误(取伪错误)原假设为假时未拒绝原假设第Ⅱ类错误的概率为6-25统计学(核心课程)H0:无罪假设检验中的两类错误(决策结果)陪审团审判裁决真实情况无罪有罪无罪正确错误有罪错误正确H0检验决策真实情况H0为真H0为假未拒绝H0正确决策(1–)第Ⅱ类错误()拒绝H0第Ⅰ类错误()正确决策(1-)假设检验就好像一场审判过程统计检验过程6-26统计学(核心课程)错误和错误的关系你不能同时减少两类错误!和的关系就像翘翘板,小就大,大就小6-27统计学(核心课程)显著性水平(significantlevel)1.是一个概率值2.原假设为真时,拒绝原假设的概率被称为抽样分布的拒绝域3.表示为(alpha)常用的值有0.01,0.05,0.104.由研究者事先确定6-28统计学(核心课程)假设检验中的小概率原理什么小概率?1.在一次试验中,一个几乎不可能发生的事件发生的概率2.在一次试验中小概率事件一旦发生,我们就有理由拒绝原假设3.小概率由研究者事先确定6-29统计学(核心课程)检验统计量与拒绝域6-30统计学(核心课程)1.根据样本观测结果计算得到的,并据以对原假设和备择假设作出决策的某个样本统计量2.对样本估计量的标准化结果原假设H0为真点估计量的抽样分布检验统计量(teststatistic)点估计量的抽样标准差假设值—点估计量标准化检验统计量3.标准化的检验统计量6-31统计学(核心课程)显著性水平和拒绝域(双侧检验)抽样分布0临界值临界值/2/2样本统计量拒绝H0拒绝H01-置信水平6-32统计学(核心课程)显著性水平和拒绝域(双侧检验)0临界值临界值/2/2样本统计量拒绝H0拒绝H0抽样分布1-置信水平6-33统计学(核心课程)显著性水平和拒绝域(双侧检验)0临界值临界值/2/2样本统计量拒绝H0拒绝H0抽样分布1-置信水平6-34统计学(核心课程)显著性水平和拒绝域(双侧检验)0临界值临界值/2/2样本统计量拒绝H0拒绝H0抽样分布1-置信水平6-35统计学(核心课程)显著性水平和拒绝域(单侧检验)0临界值样本统计量拒绝H0抽样分布1-置信水平6-36统计学(核心课程)显著性水平和拒绝域(左侧检验)0临界值样本统计量拒绝H0抽样分布1-置信水平观察到的样本统计量6-37统计学(核心课程)显著性水平和拒绝域(左侧检验)0临界值样本统计量拒绝H0抽样分布1-置信水平6-38统计学(核心课程)显著性水平和拒绝域(右侧检验)0临界值样本统计量拒绝H0抽样分布1-置信水平观察到的样本统计量6-39统计学(核心课程)显著性水平和拒绝域(右侧检验)0临界值样本统计量抽样分布1-置信水平拒绝H06-40统计学(核心课程)决策规则1.给定显著性水平,查表得出相应的临界值z或z/2,t或t/22.将检验统计量的值与水平的临界值进行比较3.作出决策双侧检验:I统计量I临界值,拒绝H0左侧检验:统计量-临界值,拒绝H0右侧检验:统计量临界值,拒绝H06-41统计学(核心课程)假设检验结论的表述6-42统计学(核心课程)假设检验结论的表述1.假设检验的目的在于找到拒绝原假设依据,而不在于证明什么是正确的2.拒绝原假设时结论是清楚的例如,H0:=10,拒绝H0时,我们可以说103.当不拒绝原假设时并未给出明确的结论不能说原假设是正确的,也不能说它不是正确的例如,当不拒绝H0:=10,我们并未说它就是10,但也未说它不是10。我们只能说样本提供的证据还不足以推翻原假设6-43统计学(核心课程)假设检验步骤的总结1.陈述原假设和备择假设2.从所研究的总体中抽出一个随机样本3.确定一个适当的检验统计量,并利用样本数据算出其具体数值4.确定一个适当的显著性水平,并计算出其临界值,指定拒绝域5.将统计量的值与临界值进行比较,作出决策统计量的值落在拒绝域,拒绝H0,否则不拒绝H0也可以直接利用P值作出决策6-44统计学(核心课程)什么是P值?(P-value)1.是一个概率值2.如果原假设为真,P-值是抽样分布中大于或小于样本统计量的概率左侧检验时,P-值为曲线上方小于等于检验统计量部分的面积右侧检验时,P-值为曲线上方大于等于检验统计量部分的面积3.被称为观察到的(或实测的)显著性水平H0能被拒绝的最小值6-45统计学(核心课程)双侧检验的P值/2/2Z拒绝拒绝H0值临界值计算出的样本统计量计算出的样本统计量临界值1/2P值1/2P值6-46统计学(核心课程)左侧检验的P值H0值临界值样本统计量拒绝域抽样分布1-置信水平计算出的样本统计量P值6-47统计学(核心课程)右侧检验的P值H0值临界值拒绝域抽样分布1-置信水平计算出的样本统计量P值6-48统计学(核心课程)利用P值进行检验(决策准则)单侧检验若p值,不拒绝H0若p值,拒绝H0双侧检验若p值,不拒绝H0若p值,拒绝H06-49统计学(核心课程)6.2总体均值的检验一.大样本情形下总体均值的检验二.小样本情形下总体均值的检验6-50统计学(核心课程)总体均值的检验(作出判断)是否已知小样本容量n大是否已知否t检验nsxt0否z检验nsxz0是z检验nxz0是z检验nxz06-51统计学(核心课程)总体均值的检验(大样本)6-52统计学(核心课程)总体均值的检验(大样本)1.假定条件正态总体或非正态总体大样本(n30)2.使用z检验统计量2已知:2未知:)1,0(~0Nnxz)1,0(~0Nnsxz6-53统计学(核心课程)总体均值的检验(2已知)(例题分析)【例】一种罐装饮料采用自动生产线生产,每罐的容量是255ml,标准差为5ml。为检验每罐容量是否符合要求,质检人员在某天生产的饮料中随机抽取了40罐进行检验,测得每罐平均容量为255.8ml。取显著性水平=0.05,检验该天生产的饮料容量是否符合标准要求?双侧检验绿色健康饮品绿色健康饮品2552556-54统计学(核心课程)总体均值的检验(2已知)(例题分析)H0:=255H1:25

1 / 71
下载文档,编辑使用

©2015-2020 m.777doc.com 三七文档.

备案号:鲁ICP备2024069028号-1 客服联系 QQ:2149211541

×
保存成功