第六章假设检验第一节假设检验的一般问题第二节方差已知条件下总体均值检验第三节方差未知条件下总体均值检验学习目标了解假设检验的基本思想掌握假设检验的步骤对实际问题作假设检验利用置信区间进行假设检验第一节假设检验的一般问题一、假设检验的步骤及有关概念二、假设检验的两类错误三、假设检验的类型一、假设检验的步骤及有关概念1.统计假设2.基本思想3.检验的方法4.检验水平的含义5.和区间估计的关系6.假设检验的基本步骤1.统计假设就是对总体的分布类型或分布中某些未知参数作某种假设,然后由抽取的子样所提供的信息对假设的正确性进行判断的过程。总体参数包括总体均值、比例、方差等分析之前必需陈述什么是假设检验?Hypothesistesting概念事先对总体参数的数值提出某种假设,然后利用样本所提供的信息检验假设是否成立的过程。特点采用逻辑上的反证法依据统计上的小概率原理2.假设检验的基本思想这个值不像我们应该得到的样本均值...20抽样分布...因此我们拒绝假设=50...如果这是总体的真实均值样本均值=50H0基本思想小概率事件在一次试验中可以认为是几乎不可能发生的。为了检验一个假设H0是否成立,我们先假设H0是成立的,如果根据这个假定,导致一个小概率事件的发生,从而说明原来的假设H0是不正确的,因此我们拒绝假设H0,如果没有由此而导出不合理的结果,我们则不能拒绝H0,即接受假设H0,与H0相对的假设称为被择假设。用H1表示。3.检验的方法反证法和一般的反证法不同之处有两点第一此反证法依赖于概率的大小,改变概率(检验水平)的大小,可能会改变结论第二此反证法无论证明的不等式成立不成立都会有一种判断。4.检验水平的含义α为弃真概率β为存伪概率α、β不能同时缩小或扩大只能根据问题的实际意义调整它们作为药品的合格率,宁可放大α使弃真的部分多一些,也不能让假药混进来。高考录取宁可放大β值,使不合格的学生混进来也不能把合格的学生抛弃了5.和区间估计的关系在假设检验中接受H0,相当于区间估计中落在估计区间内6.假设检验的基本步骤1.提出原假设和备择假设2.确定适当的检验统计量3.规定显著性水平4.计算检验统计量的值5.作出统计决策1.提出原假设和备择假设什么是原假设?(NullHypothesis)1.通常是研究者想收集证据予以反对的假设,又称“零假设”2.如果错误地作出决策会导致一系列后果3.总是有等号,或4.表示为H0H0:某一数值指定为=号,即或例如,H0:3190(克)提出原假设和备择假设什么是备择假设?(AlternativeHypothesis)1.通常是研究者想收集证据予以支持的假设2.总是有不等号:,或3.表示为H1H1:某一数值,某一数值或某一数值例如,H1:3910(克),3910(克)或3910(克)2.确定适当的检验统计量什么检验统计量?1.用于假设检验问题的统计量2.选择统计量的方法与参数估计相同,需考虑总体是正态总体还是非正态总体,是大样本还是小样本总体方差已知还是未知3.检验统计量的基本形式为0Xzn0XtSn3.规定显著性水平什么显著性水平?(significantlevel)1.是一个概率值2.原假设为真时,拒绝原假设的概率,也就是决策中所面临的风险。3.表示为(alpha)常用的值有0.01,0.05,0.104.由研究者事先确定4.计算检验的统计量作出统计决策计算检验的统计量根据给定的显著性水平,查表得出相应的临界值Z或Z/2将检验统计量的值与水平的临界值进行比较得出接受或拒绝原假设的结论二、假设检验的两类错误1.第一类错误(弃真错误)原假设为真时拒绝原假设会产生一系列后果第一类错误的概率为被称为显著性水平2.第二类错误(取伪错误)原假设为假时接受原假设第二类错误的概率为(Beta)错误和错误的关系你不能同时减少两类错误!和的关系就像翘翘板,小就大,大就小三、假设检验的类型假设研究的问题双侧检验左侧检验右侧检验H0=000H1≠000双侧检验(原假设与备择假设的确定)不论是拒绝H0还是接受H0,我们都必需采取相应的行动措施例如,某种零件的尺寸,要求其平均长度为10厘米,大于或小于10厘米均属于不合格建立的原假设与备择假设应为H0:=10H1:10双侧检验(例子)该企业生产的零件平均长度是4厘米吗?(属于决策中的假设)提出原假设:H0:=4提出备择假设:H1:4双侧检验(显著性水平与拒绝域)抽样分布H0值临界值临界值/2/2样本统计量拒绝域拒绝域接受域1-置信水平双侧检验(显著性水平与拒绝域)H0值临界值临界值/2/2样本统计量拒绝域拒绝域接受域抽样分布1-置信水平双侧检验(显著性水平与拒绝域)H0值临界值临界值/2/2样本统计量拒绝域拒绝域接受域抽样分布1-置信水平双侧检验(显著性水平与拒绝域)H0值临界值临界值/2/2样本统计量拒绝域拒绝域接受域抽样分布1-置信水平单侧检验(原假设与备择假设的确定)人们进行一项研究,通常是为了得到更有利于人类或个人的成果,在研究结束之后,研究人员自然需要寻找充分的证据来证明研究是否成功通常将认为研究结果是无效的说法或理论作为原假设H0,把希望(想要)证明的假设作为备择假设,或者说,将所研究的假设作为备择假设H1单侧检验(原假设与备择假设的确定)例如,采用新技术生产后,将会使产品的使用寿命明显延长到1500小时以上属于研究中的假设建立的原假设与备择假设应为H0:1500H1:1500例如,改进生产工艺后,会使产品的废品率降低到2%以下属于研究中的假设建立的原假设与备择假设应为H0:2%H1:2%单侧检验(原假设与备择假设的确定)几乎所有商品都附有关于数量或质量的说明,精明的消费者或许会对其说明的真实性提出质疑。我们往往把声明中的保证内容设为原假设,而质疑的内容(相反内容)设为备择假设将所作出的说明(声明)作为原假设H0对该说明的质疑作为备择假设H1先确立原假设,除非我们有证据表明“说明”无效,否则就应认为该“说明”是有效的单侧检验(原假设与备择假设的确定)例如,某灯泡制造商声称,该企业所生产的灯泡的平均使用寿命在1000小时以上除非样本能提供证据表明使用寿命在1000小时以下,否则就应认为厂商的声称是正确的建立的原假设与备择假设应为H0:1000H1:1000单侧检验(例子)该批产品的平均使用寿命超过1000小时吗?(属于检验声明的有效性,先提出原假设)提出原假设:H0:1000选择备择假设:H1:1000单侧检验(显著性水平与拒绝域)H0值临界值样本统计量拒绝域接受域抽样分布1-置信水平左侧检验(显著性水平与拒绝域)H0值临界值样本统计量拒绝域接受域抽样分布1-置信水平观察到的样本统计量左侧检验(显著性水平与拒绝域)H0值临界值样本统计量拒绝域接受域抽样分布1-置信水平右侧检验(显著性水平与拒绝域)H0值临界值样本统计量拒绝域接受域抽样分布1-置信水平观察到的样本统计量右侧检验(显著性水平与拒绝域)H0值临界值样本统计量接受域抽样分布1-置信水平拒绝域第二节方差已知条件下总体均值检验一、σ2已知条件下总体均值检验二、方差已知条件下例题讲解一、σ2已知条件下总体均值检验(1)双侧检验:拒绝域为(2)右侧检验:拒绝域为(3)左侧检验:拒绝域为.2/0znxzznxz0znxz0二、方差已知条件下例题讲解【例6.4】(双侧检验)某运动设备制造厂生产一种新的人造钓鱼线,其平均切断力为8kg,标准差如果有50条随机样本进行检验,测得其平均切断力为试检验假设(取=0.01)H0:=8H1:8=0.01n=50临界值(s):z0.005=2.575由于,2.83大于2.575,样本落入否定域决策:在0.01水平上拒绝原假设结论:有证据表明平均切断力不等于8kg83.2505.088.70nxz【例6.5】(左侧检验)某批发商欲从生产厂家购进一批灯泡,根据合同规定,灯泡的使用寿命平均不能低于1000小时。已知灯泡使用寿命服从正态分布,标准差为20小时。在总体中随机抽取100只灯泡,测得样本均值为960小时。批发商是否应该购买这批灯泡?(=0.05)均值的单尾Z检验(计算结果)H0:1000H1:1000=0.05n=100临界值(s):-1.645Z0拒绝域检验统计量:201002010009600nxz决策:在=0.05的水平上拒绝H0结论:有证据表明这批灯泡的使用寿命低于1000小时均值的单尾Z检验(实例)【例6.6】根据过去大量资料,某厂生产的电子元件的使用寿命服从正态分布N~(1020,1002)。现从最近生产的一批产品中随机抽取16只,测得样本平均寿命为1080小时。试在0.05的显著性水平下判断这批产品的使用寿命是否有显著提高?(=0.05)均值的单尾Z检验(计算结果)H0:1020H1:1020=0.05n=16临界值(s):Z0拒绝域0.051.645检验统计量:4.216100102010800nxz决策:在=0.05的水平上拒绝H0结论:有证据表明这批电子元件的使用寿命有显著提高第三节方差未知条件下总体均值检验一、σ2未知条件下总体均值检验二、方差未知条件下例题讲解一、σ2未知条件下总体均值检验(1)双侧检验:拒绝域为(2)右侧检验:拒绝域为(3)左侧检验:拒绝域为.2/0tnxttnxt0tnxt0二、方差未知条件下例题讲解【例6.7】某厂采用自动包装机分装产品,假定每包产品的重量服从正态分布,每包标准重量为1000克。某日随机抽查9包,测得样本平均重量为986克,样本标准差为24克。试问在0.05的显著性水平上,能否认为这天自动包装机工作正常?均值的双尾t检验(计算结果)H0:=1000H1:1000=0.05df=9-1=8临界值(s):t02.306-2.306.025拒绝H0拒绝H0.025检验统计量:75.192410009860nsxt决策:在=0.05的水平上接受H0结论:有证据表明这天自动包装机工作正常2未知大样本均值的检验(例题分析)【例6.8】某电子元件批量生产的质量标准为平均使用寿命1200小时。某厂宣称他们采用一种新工艺生产的元件质量大大超过规定标准。为了进行验证,随机抽取了100件作为样本,测得平均使用寿命1245小时,标准差300小时。能否说该厂生产的电子元件质量显著地高于规定标准?(=0.05)单侧检验2未知大样本均值的检验(例题分析)H0:1200H1:1200=0.05n=100临界值(s):检验统计量:在=0.05的水平上不拒绝H0不能认为该厂生产的元件寿命显著地高于1200小时决策:结论:5.1100300120012450nsxtZ0拒绝域0.051.645均值的单尾t检验(实例)【例6.9】一个汽车轮胎制造商声称,某一等级的轮胎的平均寿命在一定的汽车重量和正常行驶条件下大于40000公里,对一个由20个轮胎组成的随机样本作了试验,测得平均值为41000公里,标准差为5000公里。已知轮胎寿命的公里数服从正态分布,我们能否根据这些数据作出结论,该制造商的产品同他所说的标准相符?(=0.05)均值的单尾t检验(计算结果)H0:40000H1:40000=0.05df=20-1=19临界值(s):-1.7291t0拒绝域.05检