剖析假设检验的两类错误并举例说明组长:胡立文PPT制作:吴思远演讲人:胡立文组员:胡立文、吴思远、林君豪、白鲁宁、殷妃、陈芷琳在假设检验时,根据检验结果做出的判断,即拒绝H0或不拒绝H0并不是100%的正确,可能发生两种错误第一类错误—弃真错误•即H0本来正确,却拒绝了它,犯这类错误的概率不超过α,即P{拒绝H0/H0为真}≤α•可能产生的原因:1.样本中极端数值•2.采用决策标准较宽松第二类错误—取伪错误•即H0本不真,却接受了他,犯这类错误的概率记为β,即P{接受H0/H1为真}=β•可能产生原因:1:实验设计不灵敏•2.样本数据变异性过大•3.处理效应本身比较小两类错误的关系•1:α与β是在两个前提下的概率,所以α+β不一定等于1•2:在其他条件不变的情况下,α与β不能同时增加或减少案例说明•例子:一个公司有员工3000人(研究的总体),为了检验公司员工工资统计报表的真实性,研究者作了50人的大样本随机抽样调查,人均收入的调查结果是:X(样本均值)=871元;S(标准差)=21元问能否认为统计报表中人均收入μ0=880元的数据是真实的?(显著性水平α=0.05)研究假设•原假设H0:调查数据871元与报表数据880元之间没有显著性差异,公司员工工资均值的真实情况为880元;假设H1:调查数据和报表数据之间有显著性的差异,公司员工工资均值的真实情况不是880元。α错误出现原因•我们只抽了一个样本,而个别的样本可能是特殊的,不管你的抽样多么符合科学抽样的要求。理论上讲,在3000个员工中随机抽取50人作为调查样本,有很多种构成样本的可能性,相当于3000选50,这个数目是很大的。这样,在理论上就有存在很多个样本平均数。也就是说,由于小概率事件的出现,我们把本来真实的原假设拒绝了。这就是α错误出现的原因。β错误出现原因•第二个问题是,统计检验的逻辑犯了从结论推断前提的错误。命题B是由命题A经演绎推论出来的,或写作符号A→B,命题C是我们在检验中所依据操作法则。如果A是真的,且我们从A到B的演绎推论如果也是正确的,那么B可能是真实的。相反,如果结果B是真实的,那么就不能得出A必定是真实的结论。这就是β错误出现的原因。出现两类错误的概率计算•α错误是由实际推断原理引起的,即“小概率事件不会发生”的假定所引起的,所以有理由将所有小概率事件发生的概率之和或者即显著性水平(α=0.05)看作α错误发生的概率,换言之,α错误发生的概率为检验所选择的显著性水平。如果是单侧检验,弃真错误的概率则为α/2。β错误的概率的计算•犯β错误的概率的计算是比较复杂的,由于β错误的出现原因是属于逻辑上的,所以在总体参数不知道的情况下是无法计算它出现概率的大小的。•我们在以上例子的基础上进一步设计:这个公司职员的实际工资不是880元,而是是870元,原假设为伪,仍然假设实际工资是880元。这样我们就可以在总体均值为870元和880元两种情况下,分别作出两条正态分布曲线(A线和B线),见下图。•犯β错误的概率大小就是相对正态曲线A而言,图1中阴影部分的面积:•ZX1=1.41;ZX2=5.59•查标准正态分布表可知,β=Φ(ZX2)-Φ(ZX1)=0.0793•结果表明,如果总体的真值为870元,而虚无假设为880元的话,那么,平均而言每100次抽样中,将约有8次把真实情况当作880元被接受,即犯β错误的概率大小是0.0793。对相关命题的说明•命题1:在统计检验中,在样本容量一定的条件下,α错误和β错误不可能同时减小。这个命题可以借助前面的图形1来理解,一旦正态分布A的拒绝域减小即α错误减小,则(21Χ−Χ)这个区域将增大,而图A上阴影部分的面积(β错误)也将增大。•命题2:真实的总体参数(μ)与假设的总体参数(μ0)之间的差异(△μ)越小,犯β错误的概率越大。这个命题也可以从图形1得到说明。因为△μ越小,两个正态图就相距越近,阴影部分面积就增大。•命题3:犯α错误的概率和犯β错误的概率之和不为1。α错误的概率是在图A上被指示的显著性水平的大小,而β错误的概率是图A上阴影部分的面积。既然假设的总体均值并不与真值相等(这是错β误产生的前提),图A与图B就不可能重合,因此α和之β和不可能为1。两类错误的危害•犯第一类错误的危害较大,由于报告了本来不存在的现象,则因此现象而衍生出的后续研究、应用的危害将是不可估量的。想对而言,第二类错误的危害则相对较小,因为研究者如果对自己的假设很有信心,可能会重新设计实验,再次来过,直到得到自己满意的结果(但是如果对本就错误的观点坚持的话,可能会演变成第一类错误)。假设检验时应注意的事项•要有严密的抽样研究设计,样本必须是从同质总体中随机抽取的;要保证组间的均衡性和资料的可比性。•根据现有的资料的性质,设计类型,样本含量大小,正确选用检验方法•对差别有无统计学意义的判断不能绝对化,因检验水准只是人为规定的界限,是相对的。差别有统计意义时,是指无效假设H0被接受的可能性只有5%或不到5%,甚至不到1%,根据小概率事件一次不可能拒绝H0,但尚不能排除有5%或1%出现的可能,所以可能产生第一类错误:同样,若不拒绝H0,可能产生第二类错误