第8章假设检验第8章假设检验8.1假设检验的基本问题8.2一个总体参数的检验8.3两个总体参数的检验8.4假设检验中的其他问题学习目标1.了解假设检验的基本思想2.掌握假设检验的步骤3.对实际问题作假设检验4.利用置信区间进行假设检验5.利用P-值进行假设检验8.1假设检验的基本问题8.1.1假设问题的提出8.1.2假设的表达式8.1.3两类错误8.1.4假设检验的流程8.1.5利用P值进行决策8.1.6单侧检验假设问题的提出什么是假设?(hypothesis)•对总体参数的的数值所作的一种陈述–总体参数包括总体均值、比例、方差等–分析之前必需陈述我认为该地区新生婴儿的平均体重为3190克!什么是假设检验?(hypothesistesting)1.事先对总体参数或分布形式作出某种假设,然后利用样本信息来判断原假设是否成立2.有参数假设检验和非参数假设检验3.采用逻辑上的反证法,依据统计上的小概率原理提出原假设和备择假设•什么是原假设?(nullhypothesis)1.待检验的假设,又称“0假设”2.研究者想收集证据予以反对的假设3.总是有等号,或4.表示为H0–H0:某一数值–指定为=号,即或–例如,H0:3190(克)什么是备择假设?(alternativehypothesis)1.与原假设对立的假设,也称“研究假设”2.研究者想收集证据予以支持的假设总是有不等号:,或3.表示为H1–H1:某一数值,或某一数值–例如,H1:3910(克),或3910(克)提出原假设和备择假设假设检验中的两类错误(决策风险)假设检验中的两类错误•1.第一类错误(弃真错误)–原假设为真时拒绝原假设–会产生一系列后果–第一类错误的概率为•被称为显著性水平•2.第二类错误(取伪错误)–原假设为假时接受原假设–第二类错误的概率为(Beta)错误和错误的关系你不能同时减少两类错误!和的关系就像翘翘板,小就大,大就小假设检验的流程提出假设确定适当的检验统计量规定显著性水平计算检验统计量的值作出统计决策•什么是检验统计量?1.用于假设检验决策的统计量2.选择统计量的方法与参数估计相同,需考虑–是大样本还是小样本–总体方差已知还是未知3.检验统计量的基本形式为确定适当的检验统计量nXZ0规定显著性水平(significantlevel)•什么是显著性水平?•1.是一个概率值•2.原假设为真时,拒绝原假设的概率–被称为抽样分布的拒绝域•3.表示为(alpha)–常用的值有0.01,0.05,0.10•4.由研究者事先确定作出统计决策1.计算检验的统计量2.根据给定的显著性水平,查表得出相应的临界值z或z/2,t或t/23.将检验统计量的值与水平的临界值进行比较4.得出拒绝或不拒绝原假设的结论利用P值进行决策什么是P值?(P-value)1.是一个概率值2.如果原假设为真,P-值是抽样分布中大于或小于样本统计量的概率–左侧检验时,P-值为曲线上方小于等于检验统计量部分的面积–右侧检验时,P-值为曲线上方大于等于检验统计量部分的面积3.被称为观察到的(或实测的)显著性水平–H0能被拒绝的最小值双侧检验的P值/2/2Z拒绝拒绝H0值临界值计算出的样本统计量计算出的样本统计量临界值1/2P值1/2P值左侧检验的P值H0值临界值样本统计量拒绝域抽样分布1-置信水平计算出的样本统计量P值右侧检验的P值H0值临界值拒绝域抽样分布1-置信水平计算出的样本统计量P值利用P值进行检验(决策准则)1.单侧检验–若p-值,不拒绝H0–若p-值,拒绝H02.双侧检验–若p-值/2,不拒绝H0–若p-值/2,拒绝H0双侧检验和单侧检验双侧检验与单侧检验(假设的形式)假设研究的问题双侧检验左侧检验右侧检验H0=000H1≠000双侧检验(原假设与备择假设的确定)1.属于决策中的假设检验2.不论是拒绝H0还是不拒绝H0,都必需采取相应的行动措施3.例如,某种零件的尺寸,要求其平均长度为10cm,大于或小于10cm均属于不合格–我们想要证明(检验)大于或小于这两种可能性中的任何一种是否成立4.建立的原假设与备择假设应为•H0:10H1:10双侧检验(显著性水平与拒绝域)抽样分布H0值临界值临界值/2/2样本统计量拒绝域拒绝域1-置信水平单侧检验(显著性水平与拒绝域)H0值临界值样本统计量拒绝域抽样分布1-置信水平8.2一个总体参数的检验8.2.1检验统计量的确定8.2.2总体均值的检验8.2.3总体比例的检验8.2.4总体方差的检验一个总体参数的检验Z检验(单尾和双尾)t检验(单尾和双尾)Z检验(单尾和双尾)2检验(单尾和双尾)均值一个总体比例方差总体均值检验总体均值的检验(检验统计量)总体是否已知?用样本标准差S代替t检验nSXt0小样本量n否是z检验nXZ0z检验nSXZ0大总体均值的检验(2已知或2未知大样本)•1.假定条件–总体服从正态分布–若不服从正态分布,可用正态分布来近似(n30)2.使用Z-统计量2已知:2未知:)1,0(~0NnXZ)1,0(~0NnSXZ2已知均值的检验(例题分析)•【例】某机床厂加工一种零件,根据经验知道,该厂加工零件的椭圆度近似服从正态分布,其总体均值为0=0.081mm,总体标准差为=0.025。今换一种新机床进行加工,抽取n=200个零件进行检验,得到的椭圆度为0.076mm。试问新机床加工零件的椭圆度的均值与以前有无显著差异?(=0.05)双侧检验2已知均值的检验(例题分析)•H0:=0.081•H1:0.081=0.05•n=200•临界值(s):检验统计量:Z01.96-1.96.025拒绝H0拒绝H0.025决策:结论:在=0.05的水平上拒绝H0有证据表明新机床加工的零件的椭圆度与以前有显著差异83.2200025.0081.0076.00nxz2已知均值的检验(P值的计算与应用)•第1步:进入Excel表格界面,选择“插入”下拉菜单•第2步:选择“函数”点击•第3步:在函数分类中点击“统计”,在函数名的菜•单下选择字符“NORMSDIST”然后确定•第4步:将Z的绝对值2.83录入,得到的函数值为•0.997672537•P值=2(1-0.997672537)=0.004654•P值远远小于/2,故拒绝H02已知均值的检验(小样本例题分析)•【例】根据过去大量资料,某厂生产的灯泡的使用寿命服从正态分布N~(1020,1002)。现从最近生产的一批产品中随机抽取16只,测得样本平均寿命为1080小时。试在0.05的显著性水平下判断这批产品的使用寿命是否有显著提高?(=0.05)单侧检验2已知均值的检验(小样本例题分析)•H0:1020•H1:1020=0.05•n=16•临界值(s):检验统计量:在=0.05的水平上拒绝H0有证据表明这批灯泡的使用寿命有显著提高决策:结论:4.216100102010800nxzZ0拒绝域0.051.6452未知大样本均值的检验(例题分析)•【例】某电子元件批量生产的质量标准为平均使用寿命1200小时。某厂宣称他们采用一种新工艺生产的元件质量大大超过规定标准。为了进行验证,随机抽取了100件作为样本,测得平均使用寿命1245小时,标准差300小时。能否说该厂生产的电子元件质量显著地高于规定标准?(=0.05)单侧检验2未知大样本均值的检验(例题分析)•H0:1200•H1:1200=0.05•n=100•临界值(s):检验统计量:在=0.05的水平上不拒绝H0不能认为该厂生产的元件寿命显著地高于1200小时决策:结论:5.1100300120012450nxzZ0拒绝域0.051.645总体均值的检验(2未知小样本)•1.假定条件–总体为正态分布2未知,且小样本•2.使用t统计量)1(~0ntnSXt2未知小样本均值的检验(例题分析)•【例】某机器制造出的肥皂厚度为5cm,今欲了解机器性能是否良好,随机抽取10块肥皂为样本,测得平均厚度为5.3cm,标准差为0.3cm,试以0.05的显著性水平检验机器性能良好的假设。双侧检验2未知小样本均值的检验(例题分析)•H0:=5•H1:5=0.05•df=10-1=9•临界值(s):检验统计量:在=0.05的水平上拒绝H0说明该机器的性能不好决策:结论:16.3103.053.50nsxtt02.262-2.262.025拒绝H0拒绝H0.0252未知小样本均值的检验(P值的计算与应用)•第1步:进入Excel表格界面,选择“插入”下拉菜单•第2步:选择“函数”点击,并在函数分类中点击“统•计”,然后,在函数名的菜单中选择字符•“TDIST”,确定•第3步:在弹出的X栏中录入计算出的t值3.16•在自由度(Deg-freedom)栏中录入9•在Tails栏中录入2,表明是双侧检验(单测•检验则在该栏内录入1)•P值的结果为0.011550.025,拒绝H02未知小样本均值的检验(例题分析)•【例】一个汽车轮胎制造商声称,某一等级的轮胎的平均寿命在一定的汽车重量和正常行驶条件下大于40000公里,对一个由20个轮胎组成的随机样本作了试验,测得平均值为41000公里,标准差为5000公里。已知轮胎寿命的公里数服从正态分布,我们能否根据这些数据作出结论,该制造商的产品同他所说的标准相符?(=0.05)单侧检验!均值的单尾t检验(计算结果)•H0:40000•H1:40000=0.05•df=20-1=19•临界值(s):检验统计量:在=0.05的水平上不拒绝H0不能认为制造商的产品同他所说的标准不相符决策:结论:894.020500040000410000nsxt-1.7291t0拒绝域.05总体比例的检验(Z检验)一个总体比例检验1.假定条件–有两类结果–总体服从二项分布–可用正态分布来近似2.比例检验的Z统计量0为假设的总体比例)1,0(~)1(000NnPZ一个总体比例的检验(例题分析)•【例】一项统计结果声称,某市老年人口(年龄在65岁以上)的比重为14.7%,该市老年人口研究会为了检验该项统计是否可靠,随机抽选了400名居民,发现其中有57人年龄在65岁以上。调查结果是否支持该市老年人口比重为14.7%的看法?(=0.05)双侧检验一个总体比例的检验(例题分析)•H0:=14.7%•H1:14.7%=0.05•n=400•临界值(s):检验统计量:在=0.05的水平上不拒绝H0该市老年人口比重为14.7%决策:结论:254.0400)147.01(147.0147.01425.0zZ01.96-1.96.025拒绝H0拒绝H0.025总体方差的检验(2检验)方差的卡方(2)检验1.检验一个总体的方差或标准差2.假设总体近似服从正态分布3.检验统计量样本方差假设的总体方差)1(~)1(22022nSn方差的卡方(2)检验(例题分析)•【例】某厂商生产出一种新型的饮料装瓶机器,按设计要求,该机器装一瓶一升(1000cm3)的饮料误差上下不超过1cm3。如果达到设计要求,表明机器的稳定性非常好。现从该机器装完的产品中随机抽取25瓶,分别进行测定(用样本减1000cm3),得到如下结果。检验该机器的性能是否达到设计要求(=0.05)0.3--1.4---0.6-1.3-0.71-0-0.7----1--1.1绿色健康饮品绿色健康饮品双侧检验方差的卡方(2)检验(例题分析)•H0:2=1•H1:21=0.05•df=25-1=24•临界值(s):统计量:在=0