统计学第5章假设检验.

整理文档很辛苦,赏杯茶钱您下走!

免费阅读已结束,点击下载阅读编辑剩下 ...

阅读已结束,您可以下载文档离线阅读编辑

资源描述

第6章假设检验6.1假设检验的基本问题6.2大样本情形下的总体均值检验6.3小样本情形下的总体均值检验6.3总体比例的检验学习目标1.假设检验的基本思想和原理2.假设检验的步骤3.总体均值的检验4.总体比例的检验6.1假设检验的基本问题一.原假设与备择假设二.拒绝域和检验统计量三.两类错误和显著性水平四.单侧检验与双侧检验什么是假设检验什么是假设?(hypothesis)对总体参数的具体数值所作的陈述总体参数包括总体均值、比例、方差等分析之前必需陈述我认为这种新药的疗效比原有的药物更有效!什么是假设检验?(hypothesistest)1.先对总体的参数提出某种假设,然后利用样本信息判断假设是否成立的过程2.有参数检验和非参数检验3.逻辑上运用反证法,统计上依据小概率原理区间估计是用给定的大概率推断出总体参数的范围,而假设检验是以小概率为标准,对总体的状况所做出的假设进行判断。假设检验与区间估计结合起来,构成完整的统计推断内容。假设检验与区间估计的差别主要在于:假设检验的基本思想...因此我们拒绝假设=50...如果这是总体的真实均值样本均值=50抽样分布H0这个值不像我们应该得到的样本均值...20总体假设检验的过程抽取随机样本均值x=20我认为人口的平均年龄是50岁提出假设拒绝假设别无选择!作出决策例1:消费者协会接到消费者投诉,指控品牌纸包装饮料存在容量不足,有欺骗消费者之嫌。包装上标明的容量为250毫升。消费者协会从市场上随机抽取50盒该品牌纸包装饮品,测试发现平均含量为248毫升,小于250毫升。这是生产中正常的波动,还是厂商的有意行为?消费者协会能否根据该样本数据,判定饮料厂商欺骗了消费者呢?消费者协会实际要进行的是一项统计检验工作。检验总体平均=250是否成立。这就是一个原假设(nullhypothesis),通常用表示。0H原假设与备择假设原假设(nullhypothesis)1.研究者想收集证据予以反对的假设2.又称“0假设”3.表示为H0H0:指定为符号=,或≦,≧例如,H0:10cm1.研究者想收集证据予以支持的假设2.也称“研究假设”3.表示为H1H1:某一数值,或﹥某一数值例如,H1:10cm,或﹥10cm备择假设(alternativehypothesis)提出假设(例P166)1.原假设和备择假设是一个完备事件组,而且相互对立在一项假设检验中,原假设和备择假设必有一个成立,而且只有一个成立2.先确定备择假设,再确定原假设3.等号“=”总是放在原假设上4.因研究目的不同,对同一问题可能提出不同的假设(也可能得出不同的结论)提出假设(结论与建议)1.备择假设没有特定的方向性,并含有符号“”的假设检验,称为双侧检验或双尾检验(two-tailedtest)2.备择假设具有特定的方向性,并含有符号“”或“”的假设检验,称为单侧检验或单尾检验(one-tailedtest)备择假设的方向为“”,称为左侧检验备择假设的方向为“”,称为右侧检验双侧检验与单侧检验双侧检验与单侧检验(假设的形式P169)假设双侧检验单侧检验左侧检验右侧检验原假设备择假设两类错误与显著性水平假设检验中的两类错误1.第Ⅰ类错误(弃真错误)原假设为真时拒绝原假设第Ⅰ类错误的概率记为被称为显著性水平2.第Ⅱ类错误(取伪错误)原假设为假时未拒绝原假设第Ⅱ类错误的概率记为(Beta)H0:无罪假设检验中的两类错误(决策结果)陪审团审判裁决实际情况无罪有罪无罪正确错误有罪错误正确H0检验决策实际情况H0为真H0为假未拒绝H0正确决策(1–a)第Ⅱ类错误(b)拒绝H0第Ⅰ类错误(a)正确决策(1-b)假设检验就好像一场审判过程统计检验过程错误和错误的关系你不能同时减少两类错误!和的关系就像翘翘板,小就大,大就小影响错误的因素1.总体参数的真值随着假设的总体参数的减少而增大2.显著性水平当减少时增大3.总体标准差当增大时增大4.样本容量n当n减少时增大显著性水平(significantlevel)1.是一个概率值2.原假设为真时,拒绝原假设的概率被称为抽样分布的拒绝域3.表示为(alpha)常用的值有0.01,0.05,0.104.由研究者事先确定假设检验中的小概率原理什么小概率?1.在一次试验中,一个几乎不可能发生的事件发生的概率2.在一次试验中小概率事件一旦发生,我们就有理由拒绝原假设3.小概率由研究者事先确定什么是小概率?8-1相关相关文献文献什么是小概率什么是小概率??概率是从0到1之间的一个数,因此小概率就应该是接近0的一个数著名的英国统计家RonaldFisher把20分之1作为标准,这也就是0.05,从此0.05或比0.05小的概率都被认为是小概率Fisher没有任何深奥的理由解释他为什么选择0.05,只是说他忽然想起来的统计量与拒绝域构造一个统计量来决定是否拒绝原假设。对不同的问题,要选择不同的检验统计量。1.根据样本观测结果计算得到的,并据以对原假设和备择假设作出决策的某个样本统计量2.对样本估计量的标准化结果原假设H0为真点估计量的抽样分布检验统计量(teststatistic)点估计量的抽样标准差假设值—点估计量标准化检验统计量3.标准化的检验统计量检验统计量确定后,就要利用该统计量的分布以及由实际问题中所确定的显著性水平,来进一步确定检验统计量拒绝原假设的取值范围,即拒绝域。在给定的显著性水平α下,检验统计量的可能取值范围被分成两部分:小概率区域与大概率区域。小概率区域就是概率不超过显著性水平α的区域,是原假设的拒绝区域;大概率区域是概率为1-α的区域,是原假设的接受区域。单侧检验与双侧检验α/21–αα/2-Zα/2Zα/2α–Zα0α0Zα双侧检验左侧检验右侧检验显著性水平和拒绝域(双侧检验)抽样分布0临界值临界值/2/2样本统计量拒绝H0拒绝H01-置信水平显著性水平和拒绝域(双侧检验)0临界值临界值/2/2样本统计量拒绝H0拒绝H0抽样分布1-置信水平显著性水平和拒绝域(双侧检验)0临界值临界值/2/2样本统计量拒绝H0拒绝H0抽样分布1-置信水平显著性水平和拒绝域(双侧检验)0临界值临界值/2/2样本统计量拒绝H0拒绝H0抽样分布1-置信水平显著性水平和拒绝域(单侧检验)0临界值样本统计量拒绝H0抽样分布1-置信水平显著性水平和拒绝域(左侧检验)0临界值样本统计量拒绝H0抽样分布1-置信水平观察到的样本统计量显著性水平和拒绝域(左侧检验)0临界值样本统计量拒绝H0抽样分布1-置信水平显著性水平和拒绝域(右侧检验)0临界值样本统计量拒绝H0抽样分布1-置信水平观察到的样本统计量显著性水平和拒绝域(右侧检验)0临界值样本统计量抽样分布1-置信水平拒绝H0决策规则双侧检验:I统计量I临界值,拒绝H0左侧检验:统计量-临界值,拒绝H0右侧检验:统计量临界值,拒绝H0假设检验结论的表述假设检验结论的表述1.假设检验的目的就在于试图找到拒绝原假设,而不在于证明什么是正确的2.拒绝原假设时结论是清楚的例如,H0:=10,拒绝H0时,我们可以说103.当不拒绝原假设时并未给出明确的结论不能说原假设是正确的,也不能说它不是正确的例如,当不拒绝H0:=10,我们并未说它就是10,但也未说它不是10。我们只能说样本提供的证据还不足以推翻原假设假设检验步骤的总结1.陈述原假设和备择假设2.从所研究的总体中抽出一个随机样本3.确定一个适当的检验统计量,并利用样本数据算出其具体数值4.确定一个适当的显著性水平,并计算出其临界值,指定拒绝域5.将统计量的值与临界值进行比较,作出决策统计量的值落在拒绝域,拒绝H0,否则不拒绝H0也可以直接利用P值作出决策6.2总体均值的检验一.大样本情形下总体均值的检验二.小样本情形下总体均值的检验总体均值的检验(大样本)例1:消费者协会接到消费者投诉,指控品牌纸包装饮料存在容量不足,有欺骗消费者之嫌。包装上标明的容量为250毫升。消费者协会从市场上随机抽取50盒该品牌纸包装饮品,测试发现平均含量为248毫升,小于250毫升。这是生产中正常的波动,还是厂商的有意行为?消费者协会能否根据该样本数据,判定饮料厂商欺骗了消费者呢?在例1中,按历史资料,总体的标准差是4毫升。我们通过检验总体均值是否等于250毫升,来判断饮料厂商是否欺骗了消费者。程序如下:第一步:确定原假设与备选假设。:=250;:250以上的备选假设是总体均值小于250毫升,因为消费者协会希望通过样本数据推断出厂商的欺骗行为(大于250毫升一般不会发生)。因此使用左侧检验。0H1H第二步:构造出检验统计量如果总体的标准差已知,则正态总体(正常情况下,生产饮料的容量服从正态分布)的抽样平均数,也服从正态分布,对它进行标准化变换,可得到:可用z作为检验统计量。1,0~0NnXz第三步:确定显著性水平、拒绝域。通常显著水平由实际问题确定,我们这里取α=0.05,左侧检验,拒绝域安排在左边,查标准正态分布表得临界值:-=-1.645,拒绝域是z-1.645。z第四步:计算检验统计量的数值。样本平均数,n=50,代入检验统计量得:248X645.154.35042502480nXz第五步:判断。检验统计量的样本取值落入拒绝域。拒绝原假设,接受备选假设,认为有足够的证据说明该种纸包饮料的平均容量小于包装盒上注明的250毫升,厂商有欺诈之嫌。总体标准差未知时对总体均值检验经常用t统计量:但是,在大样本场合(样本容量n大于30时),t-统计量与标准正态分布统计量近似,通常用z检验代替t检验。)1(~0ntnsXt总体均值的检验(大样本)1.假定条件正态总体或非正态总体大样本(n30)2.使用z检验统计量2已知:2未知:)1,0(~0Nnxz)1,0(~0Nnsxz总体均值的检验(大样本检验方法的总结)假设双侧检验左侧检验右侧检验假设形式H0:=0H1:0H0:0H1:0H0:0H1:0统计量已知:未知:拒绝域P值决策拒绝H0nxz0nsxz02/zzzzzzP总体均值的检验(小样本)总体均值的检验(小样本)1.假定条件总体服从正态分布小样本(n30)2.检验统计量2已知:2未知:)1,0(~0Nnxz)1(~0ntnsxt总体均值的检验(小样本检验方法的总结)假设双侧检验左侧检验右侧检验假设形式H0:=0H1:0H0:0H1:0H0:0H1:0统计量已知:未知:拒绝域P值决策拒绝H0nxz0nsxt0)1(2/ntt)1(ntt)1(nttP注:已知的拒绝域同大样本6.2总体比例的检验总体比例检验1.假定条件总体服从二项分布可用正态分布来近似(大样本)2.检验的z统计量0为假设的总体比例)1,0(~)1(000Nnpz总体比例的检验(检验方法的总结)假设双侧检验左侧检验右侧检验假设形式H0:=0H1:0H0:0H1:0H0:0H1:0统计量拒绝域P值决策拒绝H0P2/zznpz)1(000zzzz总体比例的检验(例题分析)【例】一种以休闲和娱乐为主题的杂志,声称其读者群中有80%为女性。为验证这一说法是否属实,某研究部门抽取了由200人组成的一个随机样本,发现有146个女性经常阅读该杂志。分别取显著性水平=0.05和=0.01,检验该杂志读者群中女性的比例是否为80%?它们的值各是多少?双侧检验总体比例的检验(例题分析)H0:=80%H1:80%=0.0

1 / 76
下载文档,编辑使用

©2015-2020 m.777doc.com 三七文档.

备案号:鲁ICP备2024069028号-1 客服联系 QQ:2149211541

×
保存成功