第八章假设检验第一节假设检验的原理•假设:统计学中的假设专指用统计学术语对总体参数的具体数值所做的假定性说明(陈述)。独生子女要比非独生子女孤独感更高!什么是假设检验?1.先对总体的参数(或分布形式)提出某种假设,然后利用样本信息判断假设是否成立的过程。2.分为参数检验和非参数检验3.逻辑上运用反证法,统计上依据小概率原理假设检验的基本思想...因此我们拒绝假设=1000...假如这是总体的真实均值样本均值=1000抽样分布H0求得值不像我们应该得到的样本均值...800总体假设检验的过程(提出假设→抽取样本→作出决策)抽取随机样本均值x=800我认为学生的平均生活费是1000元提出假设拒绝假拒绝假设!别无选择.作出决策备择假设与原假设H1:研究假设,又称对立假设,或称备择假设,即根据已知理论和经验事先对研究结果作出一种预想的、希望证实的假设。H1与H0相互排斥且只有一个正确。H0:μ1=μ0H1:μ1≠μ0不能对H1的真实性直接检验。需建立与之对立的假设H0:虚无假设,或称零假设、原假设,即直接被检验的假设,是统计推论的出发点。•【例8-1】某班级进行比奈智力测验,结果=110,已知比奈测验的常模μ0=100,σ0=16,问该班智力水平(不是这一次测验结果)是否确实与常模水平有差异。•研究假设H1:μ1≠μ0•虚无假设H0:μ1=μ0假设检验的问题是判断H0是否正确,决定接收还是拒绝H0,若拒绝H0,则H1为真,若接收H0,则H1为假。X提出假设•【心理研究实例1】已知研究者对吉林省长春市、吉林市、四平市和通化市四地的初三年级初中生进行了主观幸福感的测量,结果男生主观幸福感总得分的为115,女生主观幸福感总得分的为105,请问我国初三男女生主观幸福感是否存在差异?•请提出假设:指出备择假设和虚无假设•H1:•H0:1X2X21XX2XX1.原假设和备择假设是一个完备事件组,而且相互对立,在一项假设检验中,原假设和备择假设必有一个成立,而且只有一个成立2.先确定备择假设,再确定原假设3.等号“=”总是放在原假设上4.因研究目的不同,对同一问题可能提出不同的假设(也可能得出不同的结论)提出假设(结论与建议)假设检验中的小概率原理•什么是小概率?•1.小概率事件指在一次试验中,不可能发生的事件发生;•2.在一次试验中小概率事件一旦发生,我们就有理由拒绝原假设•3.小概率由研究者事先确定,为显著性水平假设检验的原因和思想方法•原因:(1)要研究总体却无总体数据(2)用样本去研究总体存在误差,该抽样误差与真正的误差(系统)混在一起,难以分辨,因此只有引进假设检验才能去推断。•思想方法:是一种有概率值保证的反证法。从原假设出发,采用统计量,放入抽样统计量分布去考察,如发生小概率事件,则推翻原假设。H0值临界值临界值样本统计量拒绝域拒绝域接受域抽样分布1-置信水平/2/2结合上面的思路,利用小概率事件原理,可相应确定接受域和拒绝域,作为决策的依据。假设检验中的两类错误•1.第Ⅰ类错误(弃真错误)–原假设(H0)为真时拒绝原假设–第Ⅰ类错误的概率记为ɑ被称为显著性水平•2.第Ⅱ类错误(取伪错误)–原假设(H0)为假时接收原假设–第Ⅱ类错误的概率记为bμb/2/2样本平均数落入阴影,拒绝H0,可能犯Ⅰ类错误(H0实际为真)样本平均数未落入阴影,接受H0,可能犯Ⅱ类错误(H0实际为假)H0检验决策实际情况H0为真H0为假接受H0正确的决定(1–)第二类错误(b)拒绝H0第一类错误()正确的决定(1-b)四、假设检验的两类错误分析•无论拒绝还是接受H0,都有犯错误的可能。•经过检验,如果差异超过误差限度,则表明这个差异已不属于抽样误差,而是总体上确有差异,这种情况叫差异显著•如果所得差异未达到规定限度,则说明差异源于抽样误差,这种情况称为差异不显著。差异显著:不属于抽样误差,是系统误差差异不显著:抽样误差错误和错误的关系•1、ɑ+β不一定等于1。•2、在其他条件不变的情况下,ɑ与β不可能同时减小或增大•(使样本容量增大,是唯一可同时减小两类错误的办法。)和b的关系就像翘翘板,小b就大,大b就小你不能同时减少两类错误!影响β错误的因素•1.显著性水平ɑ–当ɑ减少时β增大•2.总体标准差–当增大时增大•3.样本容量n–当n增大,ɑ、β减少4、真伪值的距离。–距离越短,β越大,犯Ⅱ类错误越大1.备择假设没有特定的方向性,只强调差异性(含有符号“”)的假设检验,称为双侧检验或双尾检验2.备择假设具有特定的方向性,并含有符号“”或“”的假设检验,称为单侧检验或单尾检验3.备择假设的方向为“”,称为左侧检验4.备择假设的方向为“”,称为右侧检验单侧检验与双侧检验双侧检验与单侧检验(假设的形式)假设双侧检验单侧检验左侧检验右侧检验原假设H0:1=0H0:10H0:10备择假设H1:1≠0H1:10H1:10显著性水平和拒绝域(双侧检验)抽样分布0临界值临界值/2/2样本统计量拒绝H0拒绝H01-置信水平显著性水平和拒绝域(双侧检验)0临界值临界值/2/2样本统计量拒绝H0拒绝H0抽样分布1-置信水平显著性水平和拒绝域(双侧检验)0临界值临界值/2/2样本统计量拒绝H0拒绝H0抽样分布1-置信水平显著性水平和拒绝域(双侧检验)0临界值临界值/2/2样本统计量拒绝H0拒绝H0抽样分布1-置信水平显著性水平和拒绝域(单侧检验)0临界值样本统计量拒绝H0抽样分布1-置信水平显著性水平和拒绝域(左侧检验)0临界值样本统计量拒绝H0抽样分布1-置信水平观察到的样本统计量显著性水平和拒绝域(右侧检验)0临界值样本统计量拒绝H0抽样分布1-置信水平观察到的样本统计量假设检验步骤1.建立原假设和备择假设2.从所研究的总体中抽出一个随机样本3.确定一个适当的检验统计量,并利用样本数据算出其具体数值4.确定一个适当的显著性水平,并计算出其临界值,指定拒绝域5.将统计量的值与临界值进行比较,作出决策–统计量的值落在拒绝域,拒绝H0,否则不拒绝H0–也可以直接利用P值作出决策决策规则1.给定显著性水平,查表得出相应的临界值z或z/2,t或t/22.将检验统计量的值与水平的临界值进行比较3.作出决策–双侧检验:统计量临界值,拒绝H0–左侧检验:统计量临界值,拒绝H0–右侧检验:统计量临界值,拒绝H0第二节平均数的显著性检验•平均数的显著性检验是指对样本平均数与总体平均数之间差异进行的显著性检验。•若差异显著,表明样本平均数的总平均1与总体平均数0有差异,即样本平均数与总体平均数0的差异不是抽样误差了,可以认为是来自另一总体X•一、总体正态分布、总体方差已知(Z检验)••1、提出假设•双侧:H0:1=0•H1:1≠0•单侧:H0:10H0:10•H1:10H1:10•2、计算样本平均数的标准误•3、计算临界比率•4、根据正态分布表由α查Z值•5、做出决策,拒绝还是接受H0XSEXCRZ0nSEXX0•一、总体正态分布、总体方差未知(t检验)总体方差未知,要用其无偏估计量来代替σ0。1ns•1、提出假设•双侧:H0:1=0•H1:1≠0•单侧:H0:10H0:10•H1:10H1:10•2、计算样本平均数的标准误•3、计算临界比率•4、根据t值表由α查t值•5、做出决策,拒绝还是接受H0XSEXCRt011nsnsSEnXXZ检验又叫大样本检验,t检验又叫小样本检验。•三、总体非正态分布应该进行非参数检验或对原始数据进行对数转换或其它转换,使非正态数据转化为正态形式,然后再作Z检验或t检验。但如果样本容量较大,也可以近似的应用Z检验。•n≥30时•n30时,非参数检验或数据转换nXZ00,0'XZsn第三节平均数差异的显著性检验(重中之重)•平均数差异的显著性检验,就是对两个样本平均数之间差异的检验。•这种检验的目的在于由样本平均数之间的差异(-)来检验各自代表的两个总体之间的差异(-)。1X122X两总体正态,两总体方差已知(Z检验)两总体正态,两总体方差未知(t检验)独立样本平均数差异检验相关样本平均数差异检验独立样本两总体方差一致或相等两总体方差不齐性相关样本相关系数未知相关系数已知一、两个总体都是正态分布、两个总体方差都已知(Z检验)•独立样本•相关样本1212()()XDXXZSEXDXDXSED221212XDSEnn2212122XDSErnnnnXXZS独立样本假设检验的步骤•1、提出假设•双侧:H0:1=0•H1:1≠0•单侧:H0:10H0:10•H1:10H1:10•2、计算样本平均数的标准误•3、计算临界比率•4、根据正态分布表由α查Z值•5、做出决策,拒绝还是接受H0221212XDSEnn1212()()XDXXZSEXDXDXSED相关样本假设检验的步骤•1、提出假设•双侧:H0:1=0•H1:1≠0•单侧:H0:10H0:10•H1:10H1:10•2、计算样本平均数的标准误•3、计算临界比率•4、根据正态分布表由α查Z值•5、做出决策,拒绝还是接受H01212()()XDXXZSEXDXDXSED2212122XDSErnnnn二、两个总体都是正态分布、两个总体方差都未知(t检验)XDXDXDXSEXXSEDt)(212112XDXXtSE独立样本两个总体方差一致或相等两个总体方差不齐性22211211nSnSSEnnXD(一)独立样本的平均数差异检验202221•1、两个总体方差一致或相等•12XDXXtSE)2(21nndf加权平均)与(对的良好估计值为联合方差,是112n21n2202SSSP(一)独立样本的平均数差异检验22211211nSnSSEnnXD2221122111nsnsXXtnn•2、两个总体方差不齐性:•t’的分布只是近似的t分布,因而不能将t分布表中df=n1+n2-2的临界值tα作为t’的临界值。t’的临界值要用公式8-13计算。且未知2221方差齐性检验的步骤1)找到要比较的几个组内方差中的最大值与最小值2)代入公式F=3)查F值表(双侧)4)判定:当F小于表中相应的临界值,就认为要比较的样本方差之间无显著差异22ss大小二、两个总体都是正态分布、两个总体方差都未知(t检验)12XDXXtSE相关样本相关系数未知相关系数已知12212212nsrsssSEXD12nsSEdXDXDXDXDXSEXXSEDt)(2121(二)相关样本的平均数差异检验•1、相关系数未知1221dXXtsn12nsSEdXD(二)相关样本的平均数差异检验•2、相关系数已知1222121221XXtssrssn12212212nsrsssSEXD•相关样本的t检验一般不需要事先进行方差齐性检验•三、两个总体非正态分布•当总体分布非正态时,可以取大样本(n30或n50)进行Z’检验。这种方法同样适用于两个总体非正态分布的平均数差异检验。•(一)独立样本的平均数差异检验•(二)相关样本的平均数差异检验第四节方差的差异检验•一、样本方差与总体方差的差异检验•)1(0222ndfns差异不显著与时,差异显著与时,或)(0222/222/-12022)2/1(222/22ss•二、两个样本方差之间的差异显著性检验•(一)独立样本•当F(1-α/2)FFα/2时,说明两方差差异不显著;当F