假设检验本章基本内容•假设检验的基本原理和步骤–虚无假设和备择假设–错误和错误–单侧检验和双侧检验•差异的显著性检验–均值–方差–比例、相关系数1.1假设检验和参数估计•参数估计–用样本统计量估计总体参数•假设检验–先对总体参数提出一个假设,然后利用样本信息检验这个假设是否成立•根据以往的比分(总体信息)推断该比分是否足球赛比分–从样本的差异推论总体差异的过程1.2假设检验的主要内容:差异检验样本统计量与总体参数的差异两个样本统计量之间的差异该样本基本不属于已知总体两个总体的参数之间存在差异差异显著差异显著1.3假设检验的基本原理•小概率原理–小概率事件在一次试验中几乎不可能发生–小概率一般指p0.051.4假设检验的步骤•建立虚无假设和备择假设•确定适当的检验统计量•指定检验中的显著性水平,计算检验统计量的值,建立拒绝虚无假设的规则•作出统计决策–将检验统计量的值与拒绝规则所指定的临界值相比较,确定是否拒绝虚无假设–(计算p值,利用p值确定是否拒绝虚无假设)1.5.1假设检验的一个例子•某校一个班进行比奈智力测验,X=110,班级人数n=50,该测验常模0=100,0=16。该班智力水平1(不是这一次测验结果)是否与常模水平有差异?研究假设和虚无假设•研究假设H1researchhypothesis–又叫备择假设alternativehypothesis,指待验证的假设,一般假设差异显著•虚无假设H0nullhypothesis–又叫零假设zerohypothesis,原假设,与研究假设对立的假设,一般假设差异不显著•H1:10H0:1=0•Z检验•取=0.05•96.1,96.1,96.196.1,96.196.1,96.10000000000ZZnXnXHZnnXH或或或:拒绝,或:接受1.5.2错误和错误•错误(I型错误)typeIerror–H0为真时却被拒绝,弃真错误•错误(II型错误)typeIIerror–H0为假时却被接受,取伪错误假设检验中各种可能结果的概率接受H0拒绝H0,接受H1H0为真1-(正确决策)(弃真错误)H0为伪(取伪错误)1-(正确决策)2.总体均值的显著性检验2.1总体正态且总体方差己知020220010002021,,432::1,,~,,HZZHZZZnXZHHZNXxxxn接受,拒绝若查临界值计算统计量建立假设检验是否有显著差异?与总体均值其均值来自正态总体已知样本例题:•全市统一考试的数学平均分0=62分,标准差0=10.2,一个学校的90名学生该次考试的平均成绩为68分,问该校成绩与全市平均差异是否显著。(取=0.05)解答显著差异。绩有试成绩与全市的平均成可以认为该校的学生考即拒绝原假设显然查表得到由已给出的显著性水平建立检验假设02000010,96.158.5)4(96.1,05.0)3(58.590/2.106268,90,68,2.10,62)2(62:62:)1(HZZnXZnXHH2.2总体正态但总体方差未知02022001002021,,4132::1,,~,,HttHttntnSXtHHtNXxxxn接受,拒绝若查临界值计算统计量建立假设检验之间是否有显著差异?问样本均值与总体均值来自正态总体已知样本T统计量的分布设X1,X2,…,Xn是来自正态总体N(,2)的一个样本,SXnTXXnSXnXniniii)(,)(11,11122称为T统计量,它服从自由度为n-1的t分布,即T~t(n-1)意义:当正态总体方差2已知时,样本平均数的分布为正态分布X~N(,2/n);当总体方差2未知时,用S2作为2的估计值,当样本容量小于30时,分布不接近正态分布,而是自由度为n-1的t分布,n30时接近正态分布,n趋向于无穷时,它是正态分布。XSXt分布的特点:(1)对称。左侧为负,右侧为正,均值为0;(2)-t+;(3)n时,t分布为正态分布,方差为1;n-130时,t分布为接近正态分布,方差1,n-130时,t分布与正态分布相差较大,随n-1减小方差越大n45时,t分布与正态分布没有多大差异在小样本n30时,t分布具有重要作用。例子:•学生的学习成绩与教师的教学方法有关。某校一教师采用了一种他认为新式有效的教学方法。经过一学年的教学后,从该教师所教班级中随机抽取了6名学生的考试成绩,分别为48.5,49.0,53.5,49.5,56.0,52.5,而在该学年考试中,全年级的总平均分数为52.0,试分析采用这种教学方法与未采用新教学方法的学生成绩有无显著的差异(已知考试成绩服从正态分布,取=0.05)差异,两种教学方法无显著接受假设临界值建立假设,解:02200100)5(571.241.041.0)4(571.2)5()3(41.0698.20.525.51)2(::)1(,98.25.51HtttnSXtHHSXZ检验和t检验•两种检验的前提之一–总体正态分布•当n≥50时,两种检验的临界值差不多相等,即Z/2t/2(n)(Z0.05/21.960,Z0.01/22.576n305010015020050010005000t0.05(n)2.0422.0091.9841.9761.9721.9651.9621.960t0.01(n)2.7502.6782.6262.6092.6012.5862.5812.577小结假设总体正态,方差2已知,Z检验总体正态,方差2未知,t检验H0H1临界值拒绝H0临界值拒绝H0双侧检验=0≠0Z/2|Z|Z/2t/2(n-1)|t|t/2(n-1)≤00ZZZt(n-1)tt(n-1)单侧检验≥00-ZZ-Z-t(n-1)t-t(n-1)注:当总体不是正态分布时,如果样本容量n≥50,可以考虑用nSXZ0'来做检验3.两总体均值差异的显著性检验3.1两总体方差已知式不同,不同条件下标准误公=仍为正态分布,的分布~~:如果两个总体方差已知的差异。的差异验证由两个样本均值为均值为两个正态总体212122222222212111211121212121),(~),(),(~),(,,,,,XDXXXDnNXNXnNXNXXXXX3.1.1总体方差已知,独立样本22212121212102121222121222121222221222)(:)()(,,,,21nnXXSEXXZHSEXXZnnSEnnSESESEXXYXXXXXXXXDDDDDYXYX假设成立时,当则独立时与独立,则,•例:某地区的六岁儿童中随机抽取男生30人,其平均身高为114cm,抽取女生27人,平均身高112.5cm。根据以往资料,该区六岁男女儿童身高的标准差男童为5cm,女童为6.5cm,问该区六岁男女儿童身高有无显著差异?(=0.05)差异不显著。所以,男女儿童的身高解:,96.197.0275.63055.112114Z,:,:,27n,30,5.6,5,5.112,114205.02222212121211210212121ZnnXXHHnXX3.1.2总体方差已知,相关样本nXXZnnnnnSESESESESESEXXDrXXDXXXXDXYYXXYX21222121212221221122212122221222)(2:,22,2,,22121检验统计量为数为两变量之间的相关系设•例:某幼儿园在儿童入园时对49名儿童进行了比奈智力测验(=16),结果平均智商X1=106,一年后再对同组被试施测,结果X2=110,已知两次测验结果的相关系数r=0.74,问能否说随着年龄增长与一年的教育,儿童智商有了显著提高。(=0.01)智商有了显著的提高。,可以认为一年后儿童即解:单侧检验01.0,33.243.265.1106110,65.1491674.021616,:,:01.0222211210pZSEDZSEHHXXDXD3.2两总体方差未知3.2.1两总体方差相等独立样本2~,11,2)1()1(,,,11,2121212212222112222120212022212120222122212121nntSEXXtnnSSEnnSnSnSSSnnnnSEnnSEXXDXXXXDpDpDDX的加权平均代替和用未知====两总体方差相等=的标准误为-=•例:某校进行一项智力速度测验,共有19名学生参加,其中男生12人,女生7人。测验共200道题目,在规定时间里,答对一题记1分,测验结束后,得到以下的测验成绩–男生12人:83、146、119、104、120、161、134、115、129、99、123–女生7人:70、118、101、85、107、132、94试确定男、女生的平均成绩有无显著的差异(取=0.05)显著性差异。男女生的测验成绩没有,因此由相等差不多,可以认为方差和由于解1711.291.1t11.2170.05,91.171121271233.4251782.445112101120,,33.425171,82.445X1121,101,120X:22222171222121221tttSSYYSXSYiiii3.2.2两总体方差不等,独立样本水平下对应的临界值,为水平下对应的临界值,为临界值为的临界值,它的的临界值作为分布的分布,不能将只是近似若两总体方差不等1,1,2,22/212/1222/222/122/212122212122212121ndftndftSESEtSEtSEttnndfttSEXXtnSnSSEXXXXDDXX3.2.3两总体方差未知,相关样本,相关系数未知1~,,,11,,Y,,...,2,1,21122ntnSYXtnSSEddnSYXnYXnddXdniYXddddniidiiiiiiii来自两相关正态总体样本3.2.4两总体方差未知,相关样本,相关系数已知nSrSSSYXtnSrSSSSESrSSSSXDd21222121222121222122,2,2