第九章---假设检验

整理文档很辛苦,赏杯茶钱您下走!

免费阅读已结束,点击下载阅读编辑剩下 ...

阅读已结束,您可以下载文档离线阅读编辑

资源描述

第九章假设检验假设检验的基本问题一个总体参数的检验两个总体参数的检验假设检验在统计方法中的地位统计方法描述统计推断统计参数估计假设检验学习目标1.假设检验的基本思想和原理2.假设检验的步骤3.一个总体参数的检验4.两个总体参数的检验5.P值的计算与应用假设检验的基本问题假设的陈述两类错误与显著性水平统计量与拒绝域利用P值进行决策什么是假设?(hypothesis)对总体参数的具体数值所作的陈述总体参数包括总体均值、比例、方差等分析之前必需陈述我认为这种新药的疗效比原有的药物更有效!什么是假设检验?(hypothesistest)1.先对总体的参数(或分布形式)提出某种假设,然后利用样本信息判断假设是否成立的过程2.有参数检验和非参数检验3.逻辑上运用反证法,统计上依据小概率原理假设检验的基本思想...因此我们拒绝假设=50...如果这是总体的真实均值样本均值=50抽样分布H0这个值不像我们应该得到的样本均值...20总体假设检验的过程抽取随机样本均值x=20我认为人口的平均年龄是50岁提出假设拒绝假设别无选择!作出决策原假设与备择假设原假设(nullhypothesis)1.研究者想收集证据予以反对的假设2.又称“0假设”3.总是有符号,或4.表示为H0H0:=某一数值指定为符号=,或例如,H0:10cm1.研究者想收集证据予以支持的假设2.也称“研究假设”3.总是有符号,或4.表示为H1H1:某一数值,或某一数值例如,H1:10cm,或10cm备择假设(alternativehypothesis)【例】一种零件的生产标准是直径应为10cm,为对生产过程进行控制,质量监测人员定期对一台加工机床检查,确定这台机床生产的零件是否符合标准要求。如果零件的平均直径大于或小于10cm,则表明生产过程不正常,必须进行调整。试陈述用来检验生产过程是否正常的原假设和被择假设提出假设解:研究者想收集证据予以证明的假设应该是“生产过程不正常”。建立的原假设和备择假设为H0:10cmH1:10cm【例】某品牌洗涤剂在它的产品说明书中声称:平均净含量不少于500克。从消费者的利益出发,有关研究人员要通过抽检其中的一批产品来验证该产品制造商的说明是否属实。试陈述用于检验的原假设与备择假设提出假设解:研究者抽检的意图是倾向于证实这种洗涤剂的平均净含量并不符合说明书中的陈述。建立的原假设和备择假设为H0:500H1:500500g【例】一家研究机构估计,某城市中家庭拥有汽车的比例超过30%。为验证这一估计是否正确,该研究机构随机抽取了一个样本进行检验。试陈述用于检验的原假设与备择假设解:研究者想收集证据予以支持的假设是“该城市中家庭拥有汽车的比例超过30%”。建立的原假设和备择假设为H0:30%H1:30%提出假设1.原假设和备择假设是一个完备事件组,而且相互对立在一项假设检验中,原假设和备择假设必有一个成立,而且只有一个成立2.先确定备择假设,再确定原假设3.等号“=”总是放在原假设上4.因研究目的不同,对同一问题可能提出不同的假设(也可能得出不同的结论)提出假设(结论与建议)假设检验中的小概率原理什么小概率?1.小概率事件在一次试验中,不可能发生的事件发生;2.在一次试验中小概率事件一旦发生,我们就有理由拒绝原假设3.小概率由研究者事先确定,为显著性水平什么是小概率?假设检验的原因和思想方法原因:(1)要研究总体却无总体数据(2)用样本去研究总体存在误差,该抽样误差与真正的误差(系统)混在一起,难以分辨,因此只有引进假设检验才能去推断。思想方法:是一种有概率值保证的反证法。从原假设出发,采用统计量,放入抽样统计量分布去考察,如发生小概率事件,则推翻原假设。统计假设与数学反证法的区别:——假设检验的结果只是小概率事件说假设有问题,数学结果百分百一定是荒谬的;——统计假设有两种可能结果,推翻或支持原假设;数学结果一定是荒谬的,推翻原假设;双侧检验与单侧检验1.备择假设没有特定的方向性,并含有符号“”的假设检验,称为双侧检验或双尾检验(two-tailedtest)2.备择假设具有特定的方向性,并含有符号“”或“”的假设检验,称为单侧检验或单尾检验(one-tailedtest)备择假设的方向为“”,称为左侧检验备择假设的方向为“”,称为右侧检验双侧检验与单侧检验双侧检验与单侧检验(假设的形式)假设双侧检验单侧检验左侧检验右侧检验原假设H0:=0H0:0H0:0备择假设H1:≠0H1:0H1:0两类错误与显著性水平假设检验中的两类错误1.第Ⅰ类错误(弃真错误)原假设为真时拒绝原假设第Ⅰ类错误的概率记为被称为显著性水平2.第Ⅱ类错误(取伪错误)原假设为假时未拒绝原假设第Ⅱ类错误的概率记为(Beta)H0:无罪假设检验中的两类错误(决策结果)陪审团审判裁决实际情况无罪有罪无罪正确错误有罪错误正确H0检验决策实际情况H0为真H0为假未拒绝H0正确决策(1–)第Ⅱ类错误()拒绝H0第Ⅰ类错误()正确决策(1-)假设检验就好像一场审判过程统计检验过程错误和错误的关系你不能同时减少两类错误!和的关系就像翘翘板,小就大,大就小影响错误的因素1.总体参数的真值随着假设的总体参数的减少而增大2.显著性水平当减少时增大+13.总体标准差当增大时增大4.样本容量n当n增大、减少5、真伪值的距离。距离越短越大,犯Ⅱ类错误越大显著性水平(significantlevel)1.是一个概率值2.原假设为真时,拒绝原假设的概率被称为抽样分布的拒绝域3.表示为(alpha)常用的值有0.01,0.05,0.104.由研究者事先确定统计量与拒绝域1.根据样本观测结果计算得到的,并据以对原假设和备择假设作出决策的某个样本统计量2.对样本估计量的标准化结果原假设H0为真点估计量的抽样分布检验统计量(teststatistic)点估计量的抽样标准差假设值—点估计量标准化检验统计量3.标准化的检验统计量显著性水平和拒绝域(双侧检验)抽样分布0临界值临界值/2/2样本统计量拒绝H0拒绝H01-置信水平显著性水平和拒绝域(双侧检验)0临界值临界值/2/2样本统计量拒绝H0拒绝H0抽样分布1-置信水平显著性水平和拒绝域(双侧检验)0临界值临界值/2/2样本统计量拒绝H0拒绝H0抽样分布1-置信水平显著性水平和拒绝域(双侧检验)0临界值临界值/2/2样本统计量拒绝H0拒绝H0抽样分布1-置信水平显著性水平和拒绝域(单侧检验)0临界值样本统计量拒绝H0抽样分布1-置信水平显著性水平和拒绝域(左侧检验)0临界值样本统计量拒绝H0抽样分布1-置信水平观察到的样本统计量显著性水平和拒绝域(右侧检验)0临界值样本统计量拒绝H0抽样分布1-置信水平观察到的样本统计量决策规则1.给定显著性水平,查表得出相应的临界值z或z/2,t或t/22.将检验统计量的值与水平的临界值进行比较3.作出决策双侧检验:统计量临界值,拒绝H0左侧检验:统计量临界值,拒绝H0右侧检验:统计量临界值,拒绝H0利用P值进行决策什么是P值?(P-value)1.在原假设为真的条件下,检验统计量的观察值大于或等于其计算值的概率双侧检验为分布中两侧面积的总和2.反映实际观测到的数据与原假设H0之间不一致的程度3.被称为观察到的(或实测的)显著性水平4.决策规则:若p值,拒绝H0双侧检验的P值/2/2Z拒绝H0拒绝H00临界值计算出的样本统计量计算出的样本统计量临界值1/2P值1/2P值左侧检验的P值0临界值样本统计量拒绝H0抽样分布1-置信水平计算出的样本统计量P值右侧检验的P值0临界值拒绝H0抽样分布1-置信水平计算出的样本统计量P值假设检验步骤1.建立原假设和备择假设2.从所研究的总体中抽出一个随机样本3.确定一个适当的检验统计量,并利用样本数据算出其具体数值4.确定一个适当的显著性水平,并计算出其临界值,指定拒绝域5.将统计量的值与临界值进行比较,作出决策统计量的值落在拒绝域,拒绝H0,否则不拒绝H0也可以直接利用P值作出决策(单双)总体均值的检验(单双)总体比例的检验(单双)总体方差的检验(单双)总体相关系数的检验一个总体参数的检验z检验(单尾和双尾)t检验(单尾和双尾)z检验(单尾和双尾)2检验(单尾和双尾)均值一个总体比例方差两个总体参数的检验两个总体参数的检验z检验(大样本)t检验(小样本)t检验(小样本)z检验F检验独立样本配对样本均值比例方差总体均值的检验总体均值的检验(作出判断)是否已知小样本容量n大是否已知否t检验nsxt0否z检验nsxz0是z检验nxz0是z检验nxz0总体均值的检验(大样本)总体均值的检验(大样本)1.假定条件正态总体或非正态总体大样本(n30)2.使用z检验统计量2已知:2未知:)1,0(~0Nnxz)1,0(~0Nnsxz【例】P2348-2,8-3总体均值的检验(2已知)【例】一种罐装饮料采用自动生产线生产,每罐的容量是255ml,标准差为5ml。为检验每罐容量是否符合要求,质检人员在某天生产的饮料中随机抽取了40罐进行检验,测得每罐平均容量为255.8ml。取显著性水平=0.05,检验该天生产的饮料容量是否符合标准要求?双侧检验绿色健康饮品绿色健康饮品255255总体均值的检验(2已知)H0:0=1=255H1:01=0.05n=40临界值:Z/21.96检验统计量:z01.96-1.960.025拒绝H0拒绝H00.025决策:结论:|Z|=1.011.96,即接受原假设H0样本提供的证据表明:该天生产的饮料符合标准要求01.14052558.2550nxz总体均值的检验(2未知)【例】一种机床加工的零件尺寸绝对平均误差允许值为1.35mm。生产厂家现采用一种新的机床进行加工以期进一步降低误差。为检验新机床加工的零件平均误差与旧机床相比是否有显著降低,从某天生产的零件中随机抽取50个进行检验。利用这些样本数据,检验新机床加工的零件尺寸的平均误差与旧机床相比是否有显著降低?(=0.01)左侧检验50个零件尺寸的误差数据(mm)1.261.191.310.971.811.130.961.061.000.940.981.101.121.031.161.121.120.951.021.131.230.741.500.500.590.991.451.241.012.031.981.970.911.221.061.111.541.081.101.641.702.371.381.601.261.171.121.230.820.86总体均值的检验(2未知)H0:10=1.35H1:10=0.01n=50临界值:Z2.33检验统计量:|Z|=2.60612.33,即拒绝原假设H0新机床加工的零件尺寸的平均误差与旧机床相比有显著降低决策:结论:6061.250365749.035.13152.1z-2.33z0拒绝H00.01总体均值的检验(z检验)(P值的图示)0-2.33=0.01z拒绝H0抽样分布1-计算出的样本统计量=——2.6061P值P=0.004579总体均值的检验(2未知)【例】某一小麦品种的平均产量为5200kg/hm2。一家研究机构对小麦品种进行了改良以期提高产量。为检验改良后的新品种产量是否有显著提高,随机抽取了36个地块进行试种,得到的样本平均产量为5275kg/hm2,标准差为120/hm2。试检验改良后的新品种产量是否有显著提高?(=

1 / 97
下载文档,编辑使用

©2015-2020 m.777doc.com 三七文档.

备案号:鲁ICP备2024069028号-1 客服联系 QQ:2149211541

×
保存成功