第六章 假设检验

整理文档很辛苦,赏杯茶钱您下走!

免费阅读已结束,点击下载阅读编辑剩下 ...

阅读已结束,您可以下载文档离线阅读编辑

资源描述

第六章假设检验假设检验是推断统计中的一项重要内容,它是先对研究总体的参数作出某种假设,然后通过样本的观察来决定假设是否成立的一种统计推断方法。第一节假设检验的基本原理•实例•从1990年的新生儿中随机抽取30个,测得其平均体重为3210g,而根据1989年的统计资料,新生儿的平均体重为3190g,问1990年的新生儿与1989年相比,体重有无显著差异。分析•从直观上看,1990年新生儿体重略高,但这种差异可能是由于抽样的随机性带来的,而事实上这两年新生儿的体重也许并没有显著差异。究竟是否存在显著差异,可以先设立一个假设,不妨为“假设这两年新生儿的体重没有显著差异”,然后检验这个假设能否成立。这便是一个假设检验问题。库珀教授的数学题•“我用5美元打赌,你们中至少有两个人同月同日生。有人敢跟我赌吗?”一、假设检验的思想•基本思想是根据小概率原理、运用反证法,判断统计量之间的差异是否显著。•首先对总体参数建立一个理论假设(Ho);然后,根据具体条件选择一个抽样分布理论构造适当的统计检验量计算公式,并依据样本信息进行计算;第三、观察检验量是落入到抽样分布的大概率区,还是小概率区,在一定的概率置信度下判断假设(Ho)的合理性,并作出接受或拒绝Ho的决策。二、虚无假设与备择假设•统计假设检验中使用的假设有两种,一种称为零假设,一种称为备择假设。零假设又称为原假设、虚无假设,以符号H0表示,在假设检验中将视作已知条件而应用。•备择假设又称研究假设等,以符号H1表示。备择假设作为虚无假设的对立假设而存在。三、小概率原理与显著性水平•小概率原理:小概率事件在一次观察中几乎不可能发生。•在统计假设检验中,小概率事件的概率值被称为统计假设检验的显著性水平,记为α。α值常取0.05和0.01两个水平。•显著性水平α是指愿冒多大的犯错风险,去判断差异值的显著性。据此便在统计量抽样分布的模型上划分出了接受区和拒绝区。例如•有一个厂商声称其产品的合格品率很高,可以达到99%,那么从一批产品(如100件)中随机抽取1件,这一件恰好是次品的概率就非常小,只有1%。如果厂商的宣称是真的,随机抽取1件是次品的情况就几乎是不可能发生的,但如果这种情况确实发生了,我们就有理由怀疑原来的假设,即产品中只有1%次品的假设是否成立,这时就可以推翻原来的假设,可以作出厂商的宣称是假的这样一个推断,我们进行推断的依据就是小概率原理。当然,推断也可能会犯错误,即这100件产品中确实只有1件是次品,而恰好在一次抽取中被抽到了。所以这个例子中犯这种错误的概率是1%,也就是说我们在冒1%的风险作出厂商宣称是假的这样一个推断。由此也可以看出,这里的1%正是前面所说的显著性水平。正态曲线的临界值与拒绝区四、单侧检验和双侧检验五、判断法则检验值出现的概率统计决断P0.05差异不显著在α=0.05的显著性水平上接受H0,拒绝H10.01P0.05差异显著在α=0.05的显著性水平上拒绝H0,接受H1P0.01差异极显著在α=0.01的显著性水平上拒绝H0,接受H1六、统计检验的两类错误判断结果实际情况拒绝H0接受H0H0真第一类错误正确H0假正确第二类错误示例•对于法官的判案,法官也必须面对Ho(被告无罪)与H1(被告有罪)的决择,如果被告确实是无辜,却判为有罪,就是法官犯了α错误,如果被告确实有犯罪事实却宣判无罪,则法官犯了β错误。但一般来说,法官们的信条应该是“宁可误判无罪,也不应累及无辜。(多犯弃真错误)七、假设检验的步骤•一个完整的假设检验过程,通常包括以下步骤:第三,比较判断,作出统计决策。利用统计软件进行假设检验•根据统计的任务和数据特点正确选择检验方法•无差假设是默认的,约定俗成的,无需声明•根据检验值出现的概率大小,判断假设的真伪第二节总体平均数检验任务——检验样本平均数与总体平均数的差异是否显著检验两个样本的平均数差异是否显著一、Z检验和t检验•在平均数的差异显著性检验中,根据样本信息,可以使用正态分布模型作Z检验,或者使用t分布模型作t检验。•正态总体,σ已知,不论大小样本,使用Z检验;•正态总体,σ未知,不论大小样本,使用t检验;•非正态总体,大样本,使用t检验(近似处理);•Spss中只有t检验,适用范围更广泛。二、单总体检验和双总体检验•单总体检验——检验一个样本的平均数与某个已知总体的平均数或某个特定值的差异是否显著。•双总体检验——检验两个样本平均数的差异是否显著。(分为两种情形:相关样本的检验和独立样本的检验。)单总体平均数检验公式•正态总体,σ已知σ未知nXz1nsXt如果总体非正态,是大样本,则用S代替σ独立样本平均数的检验公式σ已知,或σ未知,大样本222121nnXXzσ未知,小样本2121212221212nnnnnnSnSnXXt相关样本平均数的检验公式nrXXz2122212121221222121nSrSSSXXtσ已知,或大样本σ未知,小样本平均数检验的方差齐性问题•双总体检验时,要求两个总体的方差没有显著差异,呈现齐性,如果不呈齐性,计算公式又不一样。•Spss中对此作了很好的处理,见实例。T检验小结•统计任务:平均数差异的显著性检验•数据要求:连续数据,正态分布,或大样本•注意区分单样本、两个独立样本或两个相关样本的情形。例题1•某次知识测验,一个学校200名学生的平均分是67分,标准差是7分,而已知总体平均分是70分。问这个学校是否比总体平均水平差?解答一、提出假设:H0:μ=μ0H1:μ≠μ0二、计算统计量这是一个大样本单总体的平均数检验问题。三、显著性水平α确定为0.01,Z0.01=2.58四、比较判断:Z=6.06Z0.01=2.58,拒绝无差假设H0。06.620077067nXz例题2•欲研究高一学生在英语学习方面有无性别差异,抽选了180名男生和160名女生,进行了统一测验,得到如下结果:•试问高一阶段的英语学习有无性别差异?性别人数平均分标准差男18076.511.5女16078.210.5解答•这是关于男生和女生英语成绩的双总体检验,总体方差未知,但由于是大样本,故可用S近似代替σ,作Z检验。•1.建立无差假设•H0:μ1=μ2;H1:μ1≠μ2•2.计算统计量424.11605.101805.112.785.762222212121nSnSXXz解答(续)3.确定α=0.05,Zα=1.964.比较判断│Z│1.96,即P0.05,差异不显著,保留H0,拒绝H1。答:高一男女生在英语学习方面没有显著性差异。例题3•从高二年级随机抽取两个小组,在化学教学中实验组采用启发探究法,对照组采用传统讲授法,后期统一结果如表所示,问两种教学法是否有显著性差异?(根据已有的经验,确知启发探究法优于传统讲授法)•实验组:64,58,65,56,58,45,55,63,66,69•对照组:60,59,57,41,38,52,46,51,49检验的步骤1.提出假设:H0:μ1≤μ2H1:μ1μ22.计算检验统计量,使用t检验3.确定t的临界值(查t值表),df=n1+n2-2=17,查附表2单侧临界值P(1)得知,t(17)0.01=2.5674.比较判断:|t|=2.835t(17)0.01=2.567,p0.01,故可以在0.01的显著性水平上拒绝H0,接受H1。835.2221212122221121nnnnnnSnSnXXt第三节方差的齐性检验•方差的齐性检验•要检验方差的差异显著性,关键在于用两个方差之比构成一个F统计量,即F=S21/S22。•一般情况下都是将方差大者作分子,方差小者作分母,因而F值在此约定下都是大于1的正数,否定区只在分布模型的右尾端,当FFα时,便可拒绝假设H0。方差齐性检验具体步骤如下:•设两个样本的方差分别为S21、S22,两样本的容量分别为n1、n2•1.建立无差假设•H0:σ21=σ22;H1:σ21≠σ22•2.计算统计量•S21•F=───(将方差大者作分子S21)•S22•3.确定显著性水平α•在F值表中每一对df1和df2的条件下,都有两个数值,上面一个表示α=0.05的F临界值,下面一个表示α=0.01的F临界值。如果没有完全相符的自由度,则找寻最接近的•4.比较判断•若FFα(df1,df2)则Pα,接受无差假设H0;•若FFα(df1,df2)则Pα,拒绝无差假设H0例题•已知S1=18,n1=60,S2=15,n2=52,试对方差作齐性检验。•解:1.建立无差假设H0:σ21=σ22;H1:σ21≠σ22•2.计算F统计量F=1.44•3.确定α=0.05•df1=n1-1=60-1=59•df2=n2-1=52-1=51•4.比较判断•因为F=1.44F0.05=1.58,所以P0.05,接受假设H0,表明两个总体的方差无显著差异。自学内容•相关系数的检验•比率的显著性检验思考与练习•假设检验的基本思想;•什么是统计检验能力?•对平均数进行差异显著性检验时,需要考虑的因素有哪些?•方差齐性检验的意义是什么?作业题1•某市高二学生外语中统考平均成绩为78分,某校有50名学生参加考试,平均成绩为81分,标准差8分,问该校50名学生的外语成绩是否与全市平均水平一致?作业题2•甲、乙两校联合举行高一数学考试,参加人数分别为85人和96人,数学平均成绩分别为78分和81分,方差分别为94分和72分,试问两校数学考试成绩是否有显著差异?作业题3•P261第8题(要求用t检验)实验题•根据医学报告,盐可能会引起某些疾病。人体对盐的需求量每天为220mg。在你所在的地区,随机从某居民区抽取n个样本,调查他们平均每天的食盐量,根据样本数据,在给定的显著性下判定该地区人们的平均每天食盐量是否超过220mg。

1 / 40
下载文档,编辑使用

©2015-2020 m.777doc.com 三七文档.

备案号:鲁ICP备2024069028号-1 客服联系 QQ:2149211541

×
保存成功