第八期-假设检验(总体均值检验)2假设检验在统计方法中的地位统计方法描述统计推断统计参数估计假设检验参数估计和假设检验是统计推断的两个组成部分,都是利用样本对总体进行某种推断,但推断的角度不同。参数估计讨论的是用样本统计量估计总体参数的方法。假设检验讨论的是用样本信息去检验对总体参数的某种假设是否成立的程序和方法。3假设检验一般问题1、假设问题的提出和基本思想2、几个重要的分布介绍3、双侧检验和单侧检验4、假设检验的步骤5,总体均值的检验6,举例4假设问题的提出根据1989年的统计资料,某地女性新生儿的平均体重为3190克,现从1990年的女性新生儿中随机抽取30人,测得其平均体重为3210克,问1990年的女性新生儿和1989年的新生儿相比,体重有无显著性差异?从样本数据看,1990年女新生儿体重比1989年略高,但这种差异可能是由于抽样的随机性带来的,也许这两年新生儿的体重并没有显著差异。究竟是否存在显著差异?可以先假设这两年新生儿的体重没有显著差异,然后利用样本信息检验这个假设能否成立。这是一个关于总体均值的假设检验问题。5假设检验的基本思想统计的语言是用一个等式或不等式表示问题的原假设,在新生儿体重这个例子上,原假设采用等式的方式。(2)对于总体均值X是否大于某一确定值X0的原假设可以表示为:H0:X≥X0(如H0:X≥2000克)其对应的备择假设则表示为:H1:X<X0(如H1:X<2000克)(3)对于总体均值X是否小于某一确定值X0的原假设可以表示为:H0:X≤X0(如H0:X≤5%)其对应的备择假设则表示为:H1:X>X0(如H1:X>5%)注意:原假设总是有等号:或或。(1)对于总体均值是否等于某一确定值的原假设可以表示为:H0:(如H0:3190克)0XX其对应的备择假设则表示为:H1:(如H1:≠3190克)0XX双侧检验均为单侧检验。6几个重要的分布介绍标准正态分布总体均值为0,方差为1的正态分布,记为𝑁~(0,1)𝑋2分布定义:设X1,X2,......Xn相互独立,都服从标准正态分布N(0,1),则称随机变量χ2=X12+X22+......+Xn2所服从的分布为自由度为n的χ2分布.7几个重要的分布介绍t分布从图可以看出,t分布的密度函数曲线与标准正态分布的曲线非常相似,随着自由度n的增加,t分布原来越接近标准正态分布。实际应用中,当n≥30时,t分布和标准正态分布就非常接近了。8几个重要的分布介绍F分布9双侧检验与单侧检验的假设形式假设双侧检验单侧检验左侧检验右侧检验原假设H0:m=m0H0:mm0H0:mm0备择假设H1:m≠m0H1:mm0H1:mm010双侧检验和单侧检验在规定了检验的显著性水平α后,根据容量为n的样本,按照统计量的理论概率分布规律,可以确定据以判断拒绝和接受原假设的检验统计量的临界值。临界值将统计量的所有可能取值区间分为两个互不相交的部分,即原假设的拒绝域和接受域。0临界值临界值a/2a/2样本统计量拒绝H0拒绝H0抽样分布1-a置信水平双侧检验11双侧检验和单侧检验左侧检验0临界值a样本统计量拒绝H0抽样分布1-a置信水平观察到的样本统计量12双侧检验和单侧检验右侧检验0临界值a样本统计量拒绝H0抽样分布1-a置信水平观察到的样本统计量13总体构造假设选择统计量并计算作出决策抽取随机样本均值x=20提出假设!作出决策确定a1,根据研究需要提出原假设H0和备择假设H12,确定适当的检验统计量3,确定显著性水平α和临界值及拒绝域4,根据样本数据计算检验统计量的值(或P值)5,将检验统计量值与临界值比较,作出拒绝或接受原假设的决策假设检验步骤14假设检验:确定检验统计量假设检验根据检验内容和条件不同需要采用不同的检验统计量。在一个正态总体的参数检验中,Z统计量和t统计量常用于均值和比例的检验,2统计量用于方差的检验。选择统计量需考虑的因素有被检验的参数类型、总体方差是否已知、用于检验的样本量大小等。Z检验(单尾和双尾)t检验(单尾和双尾)Z检验(单尾和双尾)2检验(单尾和双尾)均值一个总体比例方差15总体均值的检验已知:(1)设是来自正态总体X的一个简单随机样本,样本均值为,根据单个总体的抽样分布结论,选用统计量12,,,nxxx11niixxn0~(0,1)xzNnm假定条件总体服从正态分布若总体不服从正态分布,可用正态分布来近似(要求n30)使用Z统计量16总体均值的检验未知:(2)选用统计量:0~(1)/xttnsnm假定条件:总体为正态分布,2未知时检验所依赖信息有所减少,样本统计量服从t分布,与正态分布相比在概率相同条件下t分布界点距中心的距离更远,意味着推断精度有所下降。使用t统计量,其自由度为n-1,s为样本标准差17总体均值的检验假设双侧检验左侧检验右侧检验假设形式H0:m=m0H1:mm0H0:mm0H1:mm0H0:mm0H1:mm0统计量已知:未知:拒绝域P值决策拒绝H00xznm0xtsnm1/2zza1tta1zzaaP1/2tta1zza1tta18例1(总体方差已知)1.总体方差2已知时均值的双侧检验某机床厂加工一种零件,根据经验知道,以前加工零件的椭圆度近似服从正态分布,其总体均值为X0=0.081mm,总体标准差为=0.025。今换一种新机床进行加工,抽取n=200个零件进行检验,得到的椭圆度均值为0.076mm。试问新机床加工零件的椭圆度均值与以前有无显著差异?(a=0.05)属于决策中的假设!解:已知:X0=0.081mm,=0.025,n=200,提出假设:假定椭圆度与以前无显著差异H0:X=0.081H1:X0.081a=0.05双侧检验a/2=0.025查表得临界值:Z0.025=±1.96Z01.96-1.960.025拒绝H0拒绝H00.025得两个拒绝域:(-∞,-1.96)和(1.96,∞)计算检验统计量值:nXxZ/83.2200025.0081.0076.0Z值落入拒绝域,∴在a=0.05的水平上拒绝H0有证据表明新机床加工的零件的椭圆度与以前有显著差异19例二(总体方差已知)2,总体方差2已知时均值的单侧检验(左侧检验举例)某批发商欲从生产厂家购进一批灯泡,根据合同规定,灯泡的使用寿命平均不能低于1000小时。已知灯泡使用寿命服从正态分布,标准差为20小时。在总体中随机抽取100只灯泡,测得样本均值为960小时。批发商是否应该购买这批灯泡?(a=0.05)解:已知:X0=1000小时,=20,n=100,提出假设:假定使用寿命平均不低于1000小时H0:X1000H1:X1000a=0.05左检验临界值为负得临界值:-Z0.05=-1.645-1.645Z0拒绝域a计算检验统计量值:2100201000960z∵Z值落入拒绝域,∴在a=0.05的显著性水平上拒绝H0,接受H120例三(总体方差未知)3,总体方差2未知时均值的双侧检验某厂采用自动包装机分装产品,假定每包产品的重量服从正态分布,每包标准重量为1000克。某日随机抽查9包,测得样本平均重量为986克,样本标准差为24克。试问在0.05的显著性水平上,能否认为这天自动包装机工作正常?(a=0.05)解:已知:X0=1000克,s=24,n=9,提出假设:假定每包产品的重量与标准重量无显著差异H0:X=1000H1:X1000a=0.05双侧检验a/2=0.025df=9-1=8得临界值:t0.025(8)=±2.306t02.306-2.3060.025拒绝H0拒绝H00.025计算检验统计量值:75.19241000986t∵t值落入接受域,∴在a=0.05的显著性水平上接受H021例四(和spss结合)正常人的脉搏平均数为72次/分。现测得15名患者的脉搏:71,55,76,68,72,69,56,70,79,67,58,77,63,66,78试问这15名患者的脉搏与正常人的脉搏是否有差异?(a=0.05)题目中,已知总体均值为72,样本数量为15,样本均值和方差均可算,故用t检验。:已知:X0=72克,s=59.8,n=15,提出假设:假定每包产品的重量与标准重量无显著差异H0:X=72H1:X72a=0.05双侧检验a/2=0.025df=15-1=14得临界值:t0.025(14)=±2.14583.11573.772333.68tt02.145-2.1450.025拒绝H0拒绝H00.025t值落入接受域,∴在a=0.05的显著性水平上接受H022例四(和spss结合)正常人的脉搏平均数为72次/分。现测得15名患者的脉搏:71,55,76,68,72,69,56,70,79,67,58,77,63,66,78试问这15名患者的脉搏与正常人的脉搏是否有差异?(a=0.05)显著性为0.0880.05,接受原假设,无明显差异。