显著性水平1.概念与意义在假设检验中,显著性水平(Significantlevel,用α表示)的确定是假设检验中至关重要的问题。显著性水平是在原假设成立时检验统计量的值落在某个极端区域的概率值。因此,如果取α=0.05,如果计算出的p值小于α,则可认为原假设是一个不可能发生的小概率事件。当然,如果真的发生了,则犯错误的可能性为5%。显然,显著性水平反映了拒绝某一原假设时所犯错误的可能性,或者说,α是指拒绝了事实上正确的原假设的概率。2.通常的取值α值一般在进行假设检验前由研究者根据实际的需要确定。常用的取值是0.05或0.01。对于前者,相当于在原假设事实上正确的情况下,研究者接受这一假设的可能性为95%;对于后者,则研究者接受事实上正确的原假设的可能性为99%。显然,降低α值可以减少拒绝原假设的可能性。因此,在报告统计分析结果时,必须给出α值。3.进行统计推断在进行假设检验时,各种统计软件均会给出检验统计量观测值以及原假设成立时该检验统计量取值的相伴概率(即检验统计量某特定取值及更极端可能值出现的概率,用p表示)。p值是否小于事先确定的α值,是接受或拒绝原假设的依据。如果p值小于事先已确定的α值,就意味着检验统计量取值的可能性很小,进而可推断原假设成立的可能性很小,因而可以拒绝原假设。相反,如果p值大于事先已确定的α值,就不能拒绝原假设。在计算机技术十分发达,以及专业统计软件功能十分强大的今天,计算检验统计量及其相伴概率是一件十分容易的事情。然而,在20世纪90年代以前,只有服从标准正态分布的检验统计量,人们可以直接查阅事先准备好的标准正态分布函数表,从中获得特定计算结果的相伴概率。而对于的服从t-分布、F-分布、卡方分布或其它特殊的理论分布的检验统计量(大多数的假设检验是这样),人们无法直接计算相伴概率。人们通常查阅各类假设检验的临界值表进行统计推断。这些表格以自由度和很少的几个相伴概率(通常为0.1、0.05和0.01)为自变量,以检验统计量的临界值为函数排列。在进行统计推断时,人们使用上述临界值表根据事先确定的显著性水平,查阅对应于某一自由度和特定相伴概率的检验统计量的临界值,然后将所计算出的检验统计量与该临界值相比较。如果检验统计量的计算值大于临界值,即实际的相伴概率小于事先规定的显著性水平,便可拒绝原假设。否则,可接受原假设。4.举例在根据显著性水平进行统计推断时,应注意原假设的性质。以二元相关分析为例,相关分析中的原假设是“相关系数为零”(即2个随机变量间不存在显著的相关关系)。如果计算出的检验统计量的相伴概率(p值)低于事先给定α值(如0.05),就可以认为“相关系数为零”的可能性很低,既2个随机变量之间存在显著的相关关系。在正态分布检验时,原假设是“样本数据来自服从正态分布的总体”。此时,如果计算出的检验统计量的相伴概率(p值)低于事先给定α值(如0.05),则表明数据不服从正态分布。只有p值高于α值时,数据才服从正态分布。这与相关分析的假设检验不同。5.作者在描述相关分析结果时常有的失误仅给出相关系数的值,而不给出显著性水平。这就无法判断2个随机变量间的相关性是否显著。有时作者不是根据显著性水平判断相关关系是否显著,而是根据相关系数的大小来推断(相关系数越近1,则相关关系越显著)。问题是,相关系数本身是一个基于样本数据计算出的观测值,其本身的可靠性尚需检验。此外,作者在论文中常常用“显著相关”和“极显著相关”来描述相关分析结果,即认为p值小于0.05就是显著相关关系(或显著相关),小于0.01就是极显著相关关系(或极显著相关)。在假设检验中,只有“显著”和“不显著”,没有“极显著”这样的断语。只要计算出的检验统计量的相伴概率(p值)低于事先确定的α值,就可以认为检验结果“显著”(相关分析的原假设是“相关系数为零”,故此处的“显著”实际意味着“相关系数不为零”,或说“2个随机变量间有显著的相关关系”);同样,只要计算出的检验统计量的相伴概率(p值)高于事先确定的α值,就可以认为检验结果“不显著”。在进行相关分析时,不能同时使用0.05和0.01这2个显著性水平来决定是否拒绝原假设,只能使用其中的1个。