假设检验(完整版)

整理文档很辛苦,赏杯茶钱您下走!

免费阅读已结束,点击下载阅读编辑剩下 ...

阅读已结束,您可以下载文档离线阅读编辑

资源描述

统计假设检验假设检验第一节、假设检验概述第二节、总体平均数的假设检验(Z、T)第三节、总体比率的假设检验(P)第四节、总体方差的假设检验(卡方、F)第一节假设检验概述1、假设检验的基本思想2、假设检验的步骤3、两类错误和假设检验的规则RonaldAylmerFisher,英国著名的统计学家,遗传学家,现代数理统计的奠基人之一。他在抽样分布理论、相关回归分析、多元统计分析、最大似然估计理论,方差分析和假设检验有很多的建树。女士品茶•20世纪20年代后期在英国剑桥一个夏日的下午,一群大学的绅士和他们的夫人以及来访者,正围坐在户外的桌旁享用下午的奶茶。•奶茶一般是由牛奶和茶混合而成的,调制时候可以先倒茶后倒牛奶,也可以先倒牛奶后倒茶。这时候,一名女士说她能区分这两种不同做法的调制出来的奶茶。•那么如何检验这位女士的说法?为此Fisher进行了研究,从而提出了假设检验的思想。1、推广素质教育以后,教学效果是不是有所提高?(教育统计)2、某种新胃药是否比以前更有效?(卫生统计)3、醉酒驾车认定为刑事犯罪后是否交通事故会减少?(司法统计)4、如何检测某批种子的发芽率?(农业统计)5、海关工作人员如何判定某批产品能够通关?(海关统计)6、《红楼梦》后40回作者的鉴定(文学统计)。7、民间借贷的利率为多少?(金融统计)8、兴奋剂检测(体育统计)假设检验的应用1、假设检验的基本思想为研究某山区的成年男子的脉搏均数是否高于一般成年男子脉搏均数,某医生在一山区随机抽查了25名健康成年男子,得其脉搏均数x为74.2次/分,标准差为6.0次/分。根据大量调查已知一般健康成年男子脉搏均数为72次/分,能否据此认为该山区成年的脉搏均数μ高于一般成年男子的脉搏均数μ0?问题1:造成这25名男子脉搏均数高于一般男子的原因是什么?问题2、怎样判断以上哪个原因是成立的?若x与µ0接近,其差别可用抽样误差解释,x来自于µ0;若x与µ0相差甚远,其差别不宜用抽样误差解释,则怀疑x不属于µ0。由资料已知样本均数与总体均数不等,原因有二:(1)两者非同一总体,即两者差异由地理气候等因素造成,也就是可以说高山成年人的脉搏比一般人的要高;(2)两者为同一总体,即两者差异由抽样误差造成。检验如下假设:原假设:高山成年人脉搏与一般人的脉搏没有差异:μ=µ0备择假设:高山成年人脉搏与一般人的脉搏有差异:µ≠µ0假设检验的基本概念1.概念–事先对总体参数或分布形式作出某种假设–然后利用样本信息来以一定的概率判断原假设是否成立–参数检验和非参数检验(第8章的内容)2.作用–一般是对有差异的数据进行检验,判断差异是否显著(概率)–如果通过了检验,不能拒绝原假设,说明没有显著差异,那么这种差异是由抽样造成的–如果不能通过检验,则拒绝原假设,说明有显著差异,这种差异是由系统误差造成的.–证伪不能存真.第一节假设检验概述1、假设检验的基本思想2、假设检验的步骤3、两类错误和假设检验的规则二、假设检验的步骤•1、根据具体的问题,建立原假设和备择假设•2、构造一个合适的统计量,计算其抽样分布•(均值检验)•3、给定显著水平和确定临界值。•显著水平通常取0.1、0.05或0.01。在确定了显著水平后,根据统计量的分布就可以确定找出接受区域和拒绝区域的临界值。•4、根据样本的值计算统计量的数值并作出决策。•如果统计量的值落在拒绝域中,那么就没有通过检验,说明有显著差异,拒绝原假设。•如果统计量的值落在接受域中,通过了假设检验,说明这种差异是由于抽样造成,这个样本不能拒绝原假设。/xZn1()/nxtsn1、原假设与备择假设•原假设(nullhypothesis):一般研究者想收集证据予以反对的假设。表示为H0•备择假设(alternativehypothesis):一般研究者想收集证据予以支持的假设。表示为H1•由于假设检验中只有在小概率事件发生的情况下才拒绝原假设,因此在假设检验过程中是保护原假设的。有三种形式:(1)双侧检验H0:µ=µ0,H1:µ≠µ0(不等,有差异);(2)左侧检验H0:µ≥µ0,H1:µµ0(降低,减少);(3)右侧检验H0:µ≤µ0,H1:µµ0(提高,增加)采用哪种形式要根据实际问题。•某种饮料的易拉罐瓶的标准容量为335毫升,为对生产过程进行控制,质量监测人员定期对某个分厂进行检查,确定这个分厂生产的易拉罐是否符合标准要求。如果易拉罐的平均容量大于或小于335毫升,则表明生产过程不正常。试陈述用来检验生产过程是否正常的原假设和备择假设解:研究者想收集证据予以证明的假设应该是“生产过程不正常”。建立的原假设和备择假设为H0:335mlH1:335ml消费者协会接到消费者投诉,指控品牌纸包装饮料存在容量不足,有欺骗消费者之嫌。包装上标明的容量为250毫升。消费者协会从市场上随机抽取50盒该品牌纸包装饮品进行假设检验。试陈述此假设检验中的原假设和备择假设。解:消费者协会的意图是倾向于证实饮料厂包装饮料小于250ml。建立的原假设和备择假设为H0:≥250mlH1:250ml•【例】一家研究机构估计,某城市中家庭购买有价证券的比率超过30%。为验证这一估计是否正确,该研究机构随机抽取了一个50户组成的样本进行检验,试陈述此问题中的原假设和备择假设。解:研究者想收集证据予以支持的假设是“城市中家庭购买有价证券的比率超过30%”。建立的原假设和备择假设为H0:≤30%H1:30%1.根据样本观测结果计算得到的,并据以对原假设和备择假设作出决策的某个样本统计量2、设计检验统计量2、标准化的检验统计量/xZn1()/nxtsn总体分布样本容量σ已知σ未知正态分布大样本小样本*非正态分布大样本01xNn~(,)/非正态小样本情形不讨论。01xNn~(,)/01xNn~(,)/01xNsn~(,)/01xNsn~(,)/1xtnsn~()/3、拒绝域和接受域的确定(双侧检验)抽样分布0临界值临界值/2/2样本统计量拒绝H0拒绝H01-置信水平拒绝域接受域拒绝域4、判断规则•从概率的角度来讲,如果统计量取值的概率小于或者等于显著水平,表明小概率事件发生了,因此拒绝原假设,反之,不能拒绝原假设。(p值*)•如果统计量的值正好落在拒绝域之内,那么拒绝原假设,如果落在接受域之内,则不能拒绝原假设,如果正好等于临界值,也要拒绝原假设。•【例1】一种罐装饮料采用自动生产线生产,每罐的容量是255ml,标准差为5ml,服从正态分布。为检验每罐容量是否符合要求,质检人员在某天生产的饮料中随机抽取了16罐进行检验,测得每罐平均容量为257.2ml。取显著性水平=0.05,检验该天生产的饮料容量是否符合标准要求?双侧检验绿色健康饮品绿色健康饮品255255•H0:=255•H1:255=0.05•n=16•临界值(Zc):检验统计量:z01.96-1.960.025拒绝H0拒绝H00.025决策:不能拒绝H0结论:样本提供的证据表明:该天生产的饮料与标准没有显著差异,样本均值与标准的差异是因为随机因素所引起的。02572255176516xzn..总体(某种假设)抽样样本(观察结果)检验(不能拒绝原假设)(拒绝原假设)小概率事件未发生小概率事件发生3.做法采用逻辑上的反证法依据统计上的小概率原理(核心是构造小概率事件)假设检验中的反证法与数学中的反证法的比较反证法假设检验方法用途证明H1成立判断H1成立还是H0成立推理过程设H0成立设H0成立寻找矛盾构造小概率事件发现矛盾—H1成立小概率事件发生—拒绝H0成立没有发现矛盾—证明失败小概率事件没有发生—不能拒绝H0成立小概率事件在一次实验中不可能发生的事件,如果发生了,那么就可以拒绝原来的假设。泰力布:等待黑天鹅的人显著性水平和拒绝域(单侧检验)0临界值样本统计量拒绝H0抽样分布1-置信水平拒绝域接受域显著性水平和拒绝域(左侧检验)0临界值样本统计量拒绝H0抽样分布1-置信水平观察到的样本统计量显著性水平和拒绝域(左侧检验)0临界值样本统计量拒绝H0抽样分布1-置信水平观察到的样本统计量•【例2】一种罐装饮料采用自动生产线生产,每罐的容量是255ml,标准差为5ml,服从正态分布。换了一批工人后,质检人员在某天生产的饮料中随机抽取了16罐进行检验,测得每罐平均容量为257.2ml。取显著性水平=0.05,检验该天生产的饮料容量是否增加了?右侧检验•H0:≤255H1:255z0拒绝H00.051.64502572255176516xzn..决策:拒绝H0结论:样本提供的证据表明:该天生产的饮料与标准有显著差异,可以认为换工人后容量增加了。显著性水平和拒绝域(右侧检验)0临界值样本统计量拒绝H0抽样分布1-置信水平观察到的样本统计量显著性水平和拒绝域(右侧检验)0临界值样本统计量抽样分布1-置信水平拒绝H0第一节假设检验概述1、假设检验的基本思想2、假设检验的步骤3、两类错误和假设检验的规则三、两类错误和假设检验的规则•1.第Ⅰ类错误(弃真错误)–原假设为真时拒绝原假设–第Ⅰ类错误的概率记为•被称为显著性水平•2.第Ⅱ类错误(取伪错误)–原假设为假时未拒绝原假设–第Ⅱ类错误的概率记为(Beta)H0:无罪假设检验中的两类错误陪审团审判裁决实际情况无罪有罪有罪错误正确无罪正确错误H0检验决策实际情况H0为真H0为假拒绝H0第Ⅰ类错误()正确决策(1-)未拒绝H0正确决策(1–)第Ⅱ类错误()假设检验就好像一场审判过程统计检验过程H0:药品为真药假设检验中的两类错误之间的关系真药假药拒绝拒绝域大大弃真正确不拒绝正确接受域小小取伪宁可错杀三千,不可放过一个。H0:某次面试为好机会好机会不好的机会拒绝(不去)拒绝域小小正确不拒绝(去)正确接受域大大错误和错误的关系你不能同时减少两类错误!只能增加样本容量。和的关系就像翘翘板,小就大,大就小四、置信区间与假设检验之间的关系1、根据置信度1-α构造置信区间,如果统计量落在置信区间中,那么接受原假设,如果不在置信区间中,那么拒绝原假设。2、根据显著水平α,可以构建置信度为1-α的置信区间。一个总体的检验Z检验(单侧和双侧)t检验(单侧和双侧)Z检验(单侧和双侧)2检验(单侧和双侧)均值一个总体比例方差•第二节总体均值的检验•一、单个总体均值的检验•(ZT)•二、两个总体均值检验•(等方差、异方差)•三、两个非正态总体均值之差的检验(成对检验)一、单个正态总体均值的检验确定检验统计量的因素:1、样本容量的大小2、总体分布形状3、总体方差是否已知主要情形(6种)1.正态总体(方差未知,且为小样本,1种)2.正态总体(方差已知,小样本,1种)3.大样本(不论总体是否正态,不论方差是否已知,4种)三种假设检验的形式(双侧,左侧和右侧)(一)总体平均数的检验(小样本,正态,方差已知)1.假定条件–总体服从正态分布–小样本(n30),但是总体方差已知2.检验统计量)1,0(~0Nnxz•某机床厂加工一种零件,根据经验知道,该厂加工零件的椭圆度近似服从正态分布,其总体均值为0=0.081mm,总体标准差为=0.025。今换一种新机床进行加工,抽取n=200个零件进行检验,得到的椭圆度为0.076mm。试问新机床加工零件的椭圆度的均值与以前有无显著差异?(=0.05)•H0:=0.081,H1:0.081,=0.05,n=200•临界值(s)(双侧检验)Z01.96-1.96.025拒绝H0拒绝H0.025检验统计量:决策:拒绝H0结论:有证据表明新机床加工的零件的椭圆度与以前有显著差异。83.2200025.0081.0076.00nxz均值的单侧Z检验左侧:H0:0H1:0必须是显著地低于0,大的值满足H0,不能拒绝Z0拒绝H0右侧:H0:0H1:

1 / 105
下载文档,编辑使用

©2015-2020 m.777doc.com 三七文档.

备案号:鲁ICP备2024069028号-1 客服联系 QQ:2149211541

×
保存成功