剖析假设检验的两类错误并举例说明

鬼影碟
1 ℃
2020-01-27

整理文档很辛苦，赏杯茶钱您下走！

还剩 ... 页未读，继续阅读 >>

免费阅读已结束，点击下载阅读编辑剩下 ... 页

阅读已结束，您可以下载文档离线阅读编辑

资源描述

剖析假设检验的两类错误并举例说明组长：胡立文PPT制作：吴思远演讲人：胡立文组员：胡立文、吴思远、林君豪、白鲁宁、殷妃、陈芷琳在假设检验时，根据检验结果做出的判断，即拒绝H0或不拒绝H0并不是100%的正确，可能发生两种错误第一类错误—弃真错误•即H0本来正确，却拒绝了它，犯这类错误的概率不超过α，即P{拒绝H0/H0为真}≤α•可能产生的原因：1.样本中极端数值•2.采用决策标准较宽松第二类错误—取伪错误•即H0本不真，却接受了他，犯这类错误的概率记为β，即P{接受H0/H1为真}＝β•可能产生原因：1：实验设计不灵敏•2.样本数据变异性过大•3.处理效应本身比较小两类错误的关系•1：α与β是在两个前提下的概率，所以α+β不一定等于1•2：在其他条件不变的情况下，α与β不能同时增加或减少案例说明•例子：一个公司有员工3000人（研究的总体），为了检验公司员工工资统计报表的真实性，研究者作了50人的大样本随机抽样调查，人均收入的调查结果是：X（样本均值）=871元；S（标准差）=21元问能否认为统计报表中人均收入μ0=880元的数据是真实的？（显著性水平α=0.05）研究假设•原假设H0：调查数据871元与报表数据880元之间没有显著性差异，公司员工工资均值的真实情况为880元；假设H1：调查数据和报表数据之间有显著性的差异，公司员工工资均值的真实情况不是880元。α错误出现原因•我们只抽了一个样本，而个别的样本可能是特殊的，不管你的抽样多么符合科学抽样的要求。理论上讲，在3000个员工中随机抽取50人作为调查样本，有很多种构成样本的可能性，相当于3000选50，这个数目是很大的。这样，在理论上就有存在很多个样本平均数。也就是说，由于小概率事件的出现，我们把本来真实的原假设拒绝了。这就是α错误出现的原因。β错误出现原因•第二个问题是，统计检验的逻辑犯了从结论推断前提的错误。命题B是由命题A经演绎推论出来的，或写作符号A→B，命题C是我们在检验中所依据操作法则。如果A是真的，且我们从A到B的演绎推论如果也是正确的，那么B可能是真实的。相反，如果结果B是真实的，那么就不能得出A必定是真实的结论。这就是β错误出现的原因。出现两类错误的概率计算•α错误是由实际推断原理引起的，即“小概率事件不会发生”的假定所引起的，所以有理由将所有小概率事件发生的概率之和或者即显著性水平（α=0.05）看作α错误发生的概率，换言之，α错误发生的概率为检验所选择的显著性水平。如果是单侧检验，弃真错误的概率则为α/2。β错误的概率的计算•犯β错误的概率的计算是比较复杂的，由于β错误的出现原因是属于逻辑上的，所以在总体参数不知道的情况下是无法计算它出现概率的大小的。•我们在以上例子的基础上进一步设计：这个公司职员的实际工资不是880元，而是是870元，原假设为伪，仍然假设实际工资是880元。这样我们就可以在总体均值为870元和880元两种情况下，分别作出两条正态分布曲线（A线和B线），见下图。•犯β错误的概率大小就是相对正态曲线A而言，图1中阴影部分的面积：•ZX1=1.41；ZX2=5.59•查标准正态分布表可知，β=Φ（ZX2）-Φ（ZX1）=0.0793•结果表明，如果总体的真值为870元，而虚无假设为880元的话，那么，平均而言每100次抽样中，将约有8次把真实情况当作880元被接受，即犯β错误的概率大小是0.0793。对相关命题的说明•命题1：在统计检验中，在样本容量一定的条件下，α错误和β错误不可能同时减小。这个命题可以借助前面的图形1来理解，一旦正态分布A的拒绝域减小即α错误减小，则（21Χ−Χ）这个区域将增大，而图A上阴影部分的面积（β错误）也将增大。•命题2：真实的总体参数（μ）与假设的总体参数（μ0）之间的差异（△μ）越小，犯β错误的概率越大。这个命题也可以从图形1得到说明。因为△μ越小，两个正态图就相距越近，阴影部分面积就增大。•命题3：犯α错误的概率和犯β错误的概率之和不为1。α错误的概率是在图A上被指示的显著性水平的大小，而β错误的概率是图A上阴影部分的面积。既然假设的总体均值并不与真值相等（这是错β误产生的前提），图A与图B就不可能重合，因此α和之β和不可能为1。两类错误的危害•犯第一类错误的危害较大，由于报告了本来不存在的现象，则因此现象而衍生出的后续研究、应用的危害将是不可估量的。想对而言，第二类错误的危害则相对较小，因为研究者如果对自己的假设很有信心，可能会重新设计实验，再次来过，直到得到自己满意的结果（但是如果对本就错误的观点坚持的话，可能会演变成第一类错误）。假设检验时应注意的事项•要有严密的抽样研究设计，样本必须是从同质总体中随机抽取的；要保证组间的均衡性和资料的可比性。•根据现有的资料的性质，设计类型，样本含量大小，正确选用检验方法•对差别有无统计学意义的判断不能绝对化，因检验水准只是人为规定的界限，是相对的。差别有统计意义时，是指无效假设H0被接受的可能性只有5%或不到5%，甚至不到1%，根据小概率事件一次不可能拒绝H0，但尚不能排除有5%或1%出现的可能，所以可能产生第一类错误：同样，若不拒绝H0，可能产生第二类错误