假设检验任课老师:禤宇明本章基本内容•假设检验的基本原理和步骤–虚无假设和备择假设–错误和错误–单侧检验和双侧检验•差异的显著性检验–均值–方差–比例、相关系数1.假设检验的原理和步骤1.1从一条听到的新闻谈起•“昨天晚上A足球队以26:13大败了B队”–这是一场足球赛吗?–你的推理过程是怎样的?•可能的推理过程–如果是足球赛,那么比分(基本上)不可能是26:13–因此(很可能)不是足球赛•对以上过程的分析–反证法–有犯错误的可能1.2假设检验和参数估计Hypothesistesting•参数估计–用样本统计量估计总体参数•假设检验–先对总体参数提出一个假设,然后利用样本信息检验这个假设是否成立•根据以往的比分(总体信息)推断该比分是否足球赛比分–从样本的差异推论总体差异的过程1.3假设检验的主要内容:差异检验样本统计量与总体参数的差异两个样本统计量之间的差异该样本基本不属于已知总体两个总体的参数之间存在差异差异显著差异显著1.4假设检验的基本原理•小概率原理–小概率事件在一次试验中几乎不可能发生–小概率一般指p0.051.5假设检验的步骤P135•建立虚无假设和备择假设•确定适当的检验统计量•指定检验中的显著性水平,计算检验统计量的值,建立拒绝虚无假设的规则•作出统计决策–将检验统计量的值与拒绝规则所指定的临界值相比较,确定是否拒绝虚无假设–(计算p值,利用p值确定是否拒绝虚无假设)昨天晚上A足球队以26:13大败了B队1.5.1假设检验的一个例子•某校一个班进行比奈智力测验,X=110,班级人数n=50,该测验常模0=100,0=16。该班智力水平1(不是这一次测验结果)是否与常模水平有差异?研究假设和虚无假设•研究假设H1researchhypothesis–又叫备择假设alternativehypothesis,指待验证的假设,一般假设差异显著•虚无假设H0nullhypothesis–又叫零假设zerohypothesis,原假设,与研究假设对立的假设,一般假设差异不显著•H1:10H0:1=0•Z检验•取=0.05•96.1,96.1,96.196.1,96.196.1,96.10000000000ZZnXnXHZnnXH或或或:拒绝,或:接受1.5.2错误和错误•错误(I型错误)typeIerror–H0为真时却被拒绝,弃真错误•错误(II型错误)typeIIerror–H0为假时却被接受,取伪错误假设检验中各种可能结果的概率接受H0拒绝H0,接受H1H0为真1-(正确决策)(弃真错误)H0为伪(取伪错误)1-(正确决策)错误和错误的关系•+≠1•对于固定的样本容量n,与不能同时减小•减少与的一个方法是增大样本容量n1.5.3单侧检验和双侧检验•问题的提法–双侧检验:和已知常数0是否有显著性差异?–单侧检验:是否显著高(低)于已知常数0?•建立的假设–双侧检验:H0:=0H1:0–单侧检验:H0:≤0H1:0H0:≥0H1:0•拒绝域rejectionregion(相关概念:临界值)–双侧检验:Z/2–单侧检验:ZP133例5-3•某高校参加同专业的统一考试,随机抽查64份试卷,由此求得平均成绩为69分,标准差为9.5分。已知该科全体考生成绩服从正态分布,且总平均分为65分,问该高校考生的平均成绩是否显著高于全体考生的平均水平?用单侧检验还是双侧检验?•做题–根据题意•做研究–事先确定–一般倾向于用双侧检验思考题•某人怀疑他得了某种疾病,到医院检查–待验证的假设是“有病”还是“没病”?–医生什么时候犯错误?什么时候犯错误?•认定实际没病的他“有病”•认定实际有病的他“没病”•取多大?•能不能直接验证一个假设?–所有天鹅都是白的•如果检验结果接受了H0,我们可以说H0得到了证明吗有一只天鹅是黑的2.总体均值的显著性检验2.1总体正态且总体方差己知020220010002021,,432::1,,~,,HZZHZZZnXZHHZNXxxxn接受,拒绝若查临界值计算统计量建立假设检验是否有显著差异?与总体均值其均值来自正态总体已知样本P137例5-4•全市统一考试的数学平均分0=62分,标准差0=10.2,一个学校的90名学生该次考试的平均成绩为68分,问该校成绩与全市平均差异是否显著。(取=0.05)P137例5-4解答显著差异。绩有试成绩与全市的平均成可以认为该校的学生考即拒绝原假设显然查表得到由已给出的显著性水平建立检验假设02000010,96.158.5)4(96.1,05.0)3(58.590/2.106268,90,68,2.10,62)2(62:62:)1(HZZnXZnXHH•例:有人调查早期教育对儿童智力发展的影响,从受过良好教育的儿童中随机抽取70人进行韦氏儿童智力测验(0=100,0=15)结果X=103.3,能否认为受过良好早期教育的儿童智力高于一般水平。童智力高于一般水平。受过良好早期教育的儿,即可以认为,接受备择假设拒绝原假设而验解:本题应该用单侧检10000100645.184.1,645.1,84.170151003.103::HHZZZnXZHH2.2总体正态但总体方差未知02022001002021,,4132::1,,~,,HttHttntnSXtHHtNXxxxn接受,拒绝若查临界值计算统计量建立假设检验之间是否有显著差异?问样本均值与总体均值来自正态总体已知样本P139例5-6•学生的学习成绩与教师的教学方法有关。某校一教师采用了一种他认为新式有效的教学方法。经过一学年的教学后,从该教师所教班级中随机抽取了6名学生的考试成绩,分别为48.5,49.0,53.5,49.5,56.0,52.5,而在该学年考试中,全年级的总平均分数为52.0,试分析采用这种教学方法与未采用新教学方法的学生成绩有无显著的差异(已知考试成绩服从正态分布,取=0.05)差异,两种教学方法无显著接受假设临界值建立假设,解:02200100)5(571.241.041.0)4(571.2)5()3(41.0698.20.525.51)2(::)1(,98.25.51HtttnSXtHHSX•例:一个汽车制造商声称,某一等级的轮胎的平均寿命在一定的汽车重量和正常行驶条件下大于40000公里,对一个120个轮胎的随机样本作了试验,测得平均值和标准差为X=41000,S=5000。已知轮胎寿命的公里数近似服从正态分布。该制造商的产品同他所说的标准相符吗?(=0.05)公里。大于轮胎的平均寿命显著地,可以认为,因此接受由于,查t分布表知检验解:这是一个单侧40000658.1)119(19.21205000400004100040000:40000:1010HtttnSXtHHt2.3总体非正态nSXtnSSEXnXZnSEXnnXXXX00000000,,2,,1)50(30的分布未知时样本均值、总体方差的分布已知时样本均值、总体方差:或总体非正态,P140例5-7•某省进行数学竞赛,结果分数的分布不是正态,总平均分43.5。其中某县参加竞赛的学生168人,X=45.1,S=18.7,该县平均分与全省平均分有否显著差异?(=0.05)无显著差异解:96.197.116711.11687.185.431.45168205.02/05.00ZtnSXtnZ检验和t检验•两种检验的前提之一–总体正态分布•当n≥50时,两种检验的临界值差不多相等,即Z/2t/2(n)(Z0.05/21.960,Z0.01/22.576n305010015020050010005000t0.05/2(n)2.0422.0091.9841.9761.9721.9651.9621.960t0.01/2(n)2.7502.6782.6262.6092.6012.5862.5812.577小结P141假设总体正态,方差2已知,Z检验总体正态,方差2未知,t检验H0H1临界值拒绝H0临界值拒绝H0双侧检验=0≠0Z/2|Z|Z/2t/2(n-1)|t|t/2(n-1)≤00ZZZt(n-1)tt(n-1)单侧检验≥00-ZZ-Z-t(n-1)t-t(n-1)注:当总体不是正态分布时,如果样本容量n≥50,可以考虑用nSXZ0'来做检验•思考题1、某市场研究有限公司假定电话调查可在15分钟以内结束。如果调查所需时间超过该值,则需要加收额外费用。假定由35个电话调查所组成的一个样本表明,其样本均值为17分钟,样本标准差为4分钟。取显著性水平=0.01,问是否需要额外收费?•思考题2、据美国商业部的经济分析局报道,北加利福尼亚居民年收入的均值为18688美元。一名研究者想对南加利福尼亚州检验H0:=18688,H1:18688,其中为南加利福尼亚州居民年收入的均值。假定由400名南加利福尼亚州居民所组成的样本表明,其年收入的样本均值16868美元,样本标准差为14624美元,则假设检验的结论是什么?取显著性水平为0.05。3.两总体均值差异的显著性检验3.1两总体方差已知的计算方法不同在不同条件下标准误,~那么~~:如果两个总体方差已知的差异。的差异验证由两个样本均值为均值为两个正态总体21212212122222222212111211121212121),(~),(),(~),(,,,,,XXXXSESENXXnNXNXnNXNXXXXX3.1.1总体方差已知,独立样本2221212121210212122121222121222121222221222)(21212121212121:,,,,nnXXSEXXZHSEXXZSENXXnnSEnnSEXXYXXXXXXXXXXXXXYXYXXX假设成立时,当则,~而独立时与独立,则,附:YXYXYXYXYXnYYXXnYYnXXnYYXXYYXXYYXXnYYXXnYYnXXYYXXYYXXnYYXXnYXYXnYXYXn21221111222222222222222因此而•例:某地区的六岁儿童中随机抽取男生30人,其平均身高为114cm,抽取女生27人,平均身高112.5cm。根据以往资料,该区六岁男女儿童身高的标准差男童为5cm,女童为6.5cm,问该区六岁男女儿童身高有无显著差异?(=0.05)差异不显著。所以,男女儿童的身高解:,96.197.0275.63055.112114Z,:,:,27n,30,5.6,5,5.112,114205.02222212121211210212121ZnnXXHHnXX3.1.2总体方差已知,相关样本nXXZnnnnnSESESESESESEXXXXXXXXYYXXYX212221212122212211222121222222)(2:,22,2,221212121