1第七章假设检验与方差分析假设检验在统计方法中的地位统计方法描述统计推断统计参数估计假设检验7.1假设检验的基本原理与步骤一.假设检验及其基本原理二.假设的表达式三.两类错误四.假设检验中的值五.假设检验的另一种方法六.单侧检验假设检验的概念及原理什么是假设?(hypothesis)Æ对总体参数的的数值所作的一种假设–总体参数包括总体均值、比例、方差等–分析之前必需陈述什么是假设检验?(hypothesistesting)1.事先对总体参数或分布形式作出某种假设,然后利用样本信息来判断原假设是否成立2.有参数假设检验和非参数假设检验3.采用逻辑上的反证法,依据统计上的小概率原理2假设检验中的小概率原理Æ什么小概率?1.在一次试验中,一个几乎不可能发生的事件发生的概率2.在一次试验中小概率事件一旦发生,我们就有理由拒绝原假设3.小概率由研究者事先确定假设检验的步骤假设检验的步骤§§提出假设提出假设§§确定适当的检验统计量确定适当的检验统计量§§规定显著性水平规定显著性水平aa§§计算检验统计量的值计算检验统计量的值§§作出统计决策作出统计决策提出原假设和备择假设Æ什么是原假设?(nullhypothesis)1.待检验的假设,又称“0假设”2.研究者想收集证据予以反对的假设,或稳定、保守、受到保护的经验看法3.总是有等号=,£或³4.表示为H0–H0:m=某一数值–指定为=号,即£或³–例如,H0:m=3910(克)Æ什么是备择假设?(alternativehypothesis)1.与原假设对立的假设,也称“研究假设”2.研究者想收集证据予以支持的假设3.总是有不等号:¹,或4.表示为H1–H1:m某一数值,或m某一数值–例如,H1:m3910(克),或m3910(克)提出原假设和备择假设提出原假设和备择假设Æ什么检验统计量?1.用于假设检验决策的统计量2.选择统计量的方法与参数估计相同,需考虑–是大样本还是小样本–总体方差已知还是未知3.检验统计量的基本形式为:确定适当的检验统计量确定适当的检验统计量nXZsm0-=nXZsm0-=规定显著性水平a(significantlevel)Æ什么显著性水平?1.是一个概率值2.原假设为真时,统计检验规定的小概率标准,被称为抽样分布的拒绝域3.表示为a(alpha)–常用的a值有0.01,0.05,0.104.由研究者事先确定3作出统计决策1.计算检验的统计量2.根据给定的显著性水平a,查表得出相应的临界值za或za/2,ta或ta/23.将检验统计量的值与a水平的临界值进行比较4.得出接受或拒绝原假设的结论假设检验中的两类错误假设检验中的两类错误((决策风险决策风险))假设检验中的两类错误1.第一类错误(弃真错误)–原假设为真时拒绝原假设–第一类错误的概率为a被称为显著性水平2.第二类错误(取伪错误)–原假设为假时接受原假设–第二类错误的概率为b(Beta)假设检验中的两类错误假设检验中的两类错误(决策结果)(决策结果)正确决策(1-b)第一类错误(a)拒绝H0第二类错误(b)正确决策(1–a)接受H0H0为假H0为真实际情况决策H0检验a错误和b错误的关系aabb你不能同时减少两类错误!aa和和bb的关系就像的关系就像翘翘板,翘翘板,aa小小bb就就大,大,aa大大bb就小就小影响b错误的因素1.总体参数的真值–随着假设的总体参数的减少而增大2.显著性水平a当a减少时增大3.总体标准差s当s增大时增大4.样本容量n–当n减少时增大4双侧检验和单侧检验双侧检验与单侧检验(假设的形式)mm0mm0m≠m0H1m£m0m³m0m=m0H0右侧检验左侧检验双侧检验研究的问题假设双侧检验(原假设与备择假设的确定)1.属于决策中的假设检验2.不论是拒绝H0还是不能拒绝H0,都必需采取相应的行动措施3.例如,某种零件的尺寸,要求其平均长度为10cm,大于或小于10cm均属于不合格–我们想要证明(检验)大于或小于这两种可能性中的任何一种是否成立4.建立的原假设与备择假设应为H0:m=10H1:m¹10双侧检验(显著性水平与拒绝域)抽样分布抽样分布抽样分布H0值HH00值值临界值临界值临界值临界值临界值临界值a/2a/2a/2aa/2/2样本统计量样本统计量样本统计量拒绝域拒绝域拒绝域拒绝域拒绝域拒绝域1-a11--aa置信水平置信水平置信水平双侧检验(显著性水平与拒绝域)HH00值值临界值临界值临界值临界值a/2aa/2/2样本统计量样本统计量拒绝域拒绝域拒绝域拒绝域抽样分布抽样分布11--aa置信水平置信水平双侧检验(显著性水平与拒绝域)HH00值值临界值临界值临界值临界值a/2aa/2/2样本统计量样本统计量拒绝域拒绝域拒绝域拒绝域抽样分布抽样分布11--aa置信水平置信水平5双侧检验(显著性水平与拒绝域)HH00值值临界值临界值临界值临界值a/2aa/2/2样本统计量样本统计量拒绝域拒绝域拒绝域拒绝域抽样分布抽样分布11--aa置信水平置信水平单侧检验(原假设与备择假设的确定)1.将研究者想收集证据予以支持的假设作为备择假设H1§例如,一个研究者总是想证明自己的研究结论是正确的§一个销售商总是想正确供货商的说法是不正确的§备择假设的方向与想要证明其正确性的方向一致2.将研究者想收集证据证明其不正确的假设作为原假设H03.先确立备择假设H1单侧检验(原假设与备择假设的确定)一项研究表明,采用新技术生产后,将会使产品的使用寿命明显延长到1500小时以上。检验这一结论是否成立–研究者总是想证明自己的研究结论(寿命延长)是正确的–备择假设的方向为“”(寿命延长)–建立的原假设与备择假设应为H0:m£1500H1:m1500单侧检验(原假设与备择假设的确定)q一项研究表明,改进生产工艺后,会使产品的废品率降低到2%以下。检验这一结论是否成立–研究者总是想证明自己的研究结论(废品率降低)是正确的–备择假设的方向为“”(废品率降低)–建立的原假设与备择假设应为H0:m³2%H1:m2%单侧检验(原假设与备择假设的确定)q某灯泡制造商声称,该企业所生产的灯泡的平均使用寿命在1000小时以上。如果你准备进一批货,怎样进行检验§检验权在销售商一方§作为销售商,你总是想收集证据证明生产商的说法(寿命在1000小时以上)是不是正确的–备择假设的方向为“”(寿命不足1000小时)§建立的原假设与备择假设应为H0:m³1000H1:m1000单侧检验(显著性水平与拒绝域)HH00值值临界值临界值aa样本统计量样本统计量拒绝域拒绝域抽样分布抽样分布11--aa置信水平置信水平6左侧检验(显著性水平与拒绝域)H0值HH00值值临界值临界值临界值aaa样本统计量样本统计量样本统计量拒绝域拒绝域拒绝域抽样分布抽样分布抽样分布1-a11--aa置信水平置信水平置信水平观察到的样本统计量观察到的样本统计量观察到的样本统计量左侧检验(显著性水平与拒绝域)H0值HH00值值临界值临界值临界值aaa样本统计量样本统计量样本统计量拒绝域拒绝域拒绝域抽样分布抽样分布1-a11--aa置信水平置信水平右侧检验(显著性水平与拒绝域)H0值HH00值值临界值临界值临界值aaa样本统计量样本统计量样本统计量拒绝域拒绝域拒绝域抽样分布抽样分布抽样分布1-a11--aa置信水平置信水平置信水平观察到的样本统计量观察到的样本统计量观察到的样本统计量右侧检验(显著性水平与拒绝域)H0值HH00值值临界值临界值临界值aaa样本统计量样本统计量样本统计量抽样分布抽样分布1-a11--aa置信水平置信水平拒绝域拒绝域拒绝域一个总体参数的检验Z检验(单尾和双尾)Z检验(单尾和双尾)t检验(单尾和双尾)t检验(单尾和双尾)Z检验(单尾和双尾)Z检验(单尾和双尾)c2检验(单尾和双尾)c2检验(单尾和双尾)均值均值一个总体一个总体比例比例方差方差7.2总体均值的假设检验7总体均值的检验(检验统计量)总体s是否已知?总体s是否已知?用样本标准差S代替用样本标准差S代替t检验t检验nSXt0m-=nSXt0m-=小小小样本容量n样本容量n否否否是是是z检验z检验nXZsm0-=nXZsm0-=z检验z检验nSXZ0m-=nSXZ0m-=大大大总体均值的检验(s2已知或s2未知大样本)1.假定条件–总体服从正态分布–若不服从正态分布,可用正态分布来近似(n³30)2.使用Z-统计量s2已知:s2未知:)1,0(~0NnXZsm-=)1,0(~0NnXZsm-=)1,0(~0NnSXZm-=)1,0(~0NnSXZm-=s2已知均值的检验(例题分析)【例】某机床厂加工一种零件,根据经验知道,该厂加工零件的椭圆度近似服从正态分布,其总体均值为m0=0.081mm,总体标准差为s=0.025。今换一种新机床进行加工,抽取n=200个零件进行检验,得到的椭圆度为0.076mm。试问新机床加工零件的椭圆度的均值与以前有无显著差异?(a=0.05)s2已知均值的检验(例题分析)H0:m=0.081H1:m¹0.081a=0.05n=200临界值(s):检验统计量检验统计量::ZZ001.961.96--1.961.96..025025拒绝拒绝HH00拒绝拒绝HH00..025025决策决策::结论结论::在在aa=0.05=0.05的水平上拒绝的水平上拒绝HH00有证据表明新机床加工的有证据表明新机床加工的零件的椭圆度与以前有显零件的椭圆度与以前有显著差异著差异83.2200025.0081.0076.00-=-=-=nxzsm83.2200025.0081.0076.00-=-=-=nxzsms2已知均值的检验(小样本例题分析)【例】根据过去大量资料,某厂生产的灯泡的使用寿命服从正态分布N~(1020,1002)。现从最近生产的一批产品中随机抽取16只,测得样本平均寿命为1080小时。试在0.05的显著性水平下判断这批产品的使用寿命是否有显著提高?(a=0.05)s2已知均值的检验(小样本例题分析)H0:m£1020H1:m1020a=0.05n=16临界值(s):检验统计量检验统计量::在在aa=0.05=0.05的水平上拒绝的水平上拒绝HH00有证据表明这批灯泡的使用寿有证据表明这批灯泡的使用寿命有显著提高命有显著提高决策决策::结论结论::4.216100102010800=-=-=nxzsm4.216100102010800=-=-=nxzsmZZ00拒绝域拒绝域0.050.051.6451.6458s2未知大样本均值的检验(例题分析)【例】某电子元件批量生产的质量标准为平均使用寿命1200小时。某厂宣称他们采用一种新工艺生产的元件质量大大超过规定标准。为了进行验证,随机抽取了100件作为样本,测得平均使用寿命1245小时,标准差300小时。能否说该厂生产的电子元件质量显著地高于规定标准?(a=0.05)s2未知大样本均值的检验(例题分析)H0:m£1200H1:m1200a=0.05n=100临界值(s):检验统计量检验统计量::在在aa=0.05=0.05的水平上不能拒绝的水平上不能拒绝HH00不能认为该厂生产的元件寿命不能认为该厂生产的元件寿命显著地高于显著地高于12001200小时小时决策决策::结论结论::5.1100300120012450=-=-=nxzsm5.1100300120012450=-=-=nxzsmZZ00拒绝域拒绝域0.050.051.6451.645总体均值的检验(s2未知小样本)1.假定条件–总体为正态分布s2未知,且小样本2.使用t统计量)1(~0--=ntnSXtm)1(~0--=ntnSXtms2未知小样本均值的检验(例题分析)【例】某机器制造出的肥皂厚度为5cm,今欲了解机器性能是否良好,随机抽取10块肥皂为样本,测得平均厚度为5.3cm,标准差为0.3cm,试以0.05的显著性水平检验机器性能良好的假设。s2未知小