8.1假设检验的基本思想一、假设检验问题的提出二、假设检验的基本思想三、假设检验中两类错误上一章介绍了对总体中未知参数的估计方法。本章将讨论统计推断的另一个重要方面——统计假设检验。出于某种需要,对未知的或不完全明确的总体给出某些假设,用以说明总体可能具备的某种性质,这种假设称为统计假设。如正态分布的假设,总体均值的假设等。这个假设是否成立,还需要考察,这一过程称为假设检验,并最终作出判断,是接受假设还是拒绝假设。本章主要介绍假设检验的基本思想和常用的检验方法,重点解决正态总体参数的假设检验。统计推断的另一个重要问题是假设检验问题。在总体的分布函数未知或只知其形式,但不知其参数的情况下,为了推断总体的某些性质,提出某些关于总体的假设。例如,提出总体服从泊松分布的假设,又如,对于正态总体提出数学期望μ0的假设等。这里,先结合例子来说明假设检验的基本思想和做法。假设检验就是根据样本对所提出的假设作出判断:是接受,还是拒绝。一、假设检验问题的提出例1已知某炼铁厂的铁水含碳量X在某种工艺条件下服从正态分布N(4.55,0.1082)。现改变了工艺条件,又测了五炉铁水,其含碳量分别为:4.28,4.40,4.42,4.35,4.37。根据以往的经验,总体的方差2=0.1082一般不会改变。试问工艺改变后,铁水含碳量的均值有无改变?显然,这里需要解决的问题是,如何根据样本判断现在冶炼的铁水的含碳量是服从≠4.55的正态分布呢?还是与过去一样仍然服从=4.55的正态分布呢?若是前者,可以认为新工艺对铁水的含碳量有显著的影响;若是后者,则认为新工艺对铁水的含碳量没有显著影响。通常,选择其中之一作为假设后,再利用样本检验假设的真伪。例2某自动车床生产了一批铁钉,现从该批铁钉中随机抽取了11根,测得长度(单位:mm)数据为:10.41,10.32,10.62,40.18,10.77,10.64,10.82,10.49,10.38,10.59,10.54。试问铁钉的长度X是否服从正态分布?而在本例中,我们关心的问题是总体X是否服从正态分布。如同例1那样,选择是或否作为假设,然后利用样本对假设的真伪作出判断。以上两例都是科技领域中常见的假设检验问题。我们把问题中涉及到的假设称为原假设或称待检假设,一般用H0表示。而把与原假设对立的断言称为备择假设,记为H1。如例1,若原假设为H0:=0=4.55,则备择假设为H1:≠4.55。若例2的原假设为H0:X服从正态分布,则备择假设为H1:X不服从正态分布。当然,在两个假设中用哪一个作为原假设,哪一个作为备择假设,视具体问题的题设和要求而定。在许多问题中,当总体分布的类型已知时,只对其中一个或几个未知参数作出假设,这类问题通常称之为参数假设检验,如例1。而在有些问题中,当总体的分布完全不知或不确切知道,就需要对总体分布作出某种假设,这种问题称为分布假设检验,如例2。接下来我们要做的事是:给出一个合理的法则,根据这一法则,利用巳知样本做出判断是接受假设H0,还是拒绝假设H0。假设检验的一般提法是:在给定备择假设H1下,利用样本对原假设H0作出判断,若拒绝原假设H0,那就意味着接受备择假设H1,否则,就接受原假设H0。换句话说,假设检验就是要在原假设H0和备择假设H1中作出拒绝哪一个和接受哪一个的判断。究竟如何作出判断呢?对一个统计假设进行检验的依据是所谓小概率原理,即概率很小的事件在一次试验中是几乎不可能发生二、假设检验的基本思想例如,在100件产品中,有一件次品,随机地从中取出一个产品是次品的事件就是小概率事件。因为此事件发生的概率=0.01很小,因此,从中任意抽一件产品恰好是次品的事件可认为几乎不可能发生的,如果确实出现了次品,我们就有理由怀疑这“100件产品中只有一件次品”的真实性。那么取值多少才算是小概率呢?这就要视实际问题的需要而定,一般取0.1,0.05,0.01等。以例1为例:首先建立假设:H0:=0=4.55,H1:≠4.55。其次,从总体中作一随机抽样得到一样本观察值(x1,x2,…,xn)。注意到是的无偏估计量。因此,若H0正确,则与0的偏差一般不应太大,即不应太大,若过分大,我们有理由怀疑H0的正确性而拒绝H0。由于,因此,考察的大小等价于考察的大小,哪么如何判断是否偏大呢?niiXnX11niixnx11||0x)1,0(~/0NnXZ||0xnx/||0nx/||0具体设想是,对给定的小正数,由于事件是概率为的小概率事件,即因此,当用样本值代入统计量具体计算得到其观察值时,若,即说明在一次抽样中,小概率事件居然发生了。因此依据小概率原理,有理由拒绝H0,接受H1;若,则没有理由拒绝H0,只能接受H0。2/0/||znX2/0/||znXPnXZ/0nxz/||||02/||zz2/||zz将上述检验思想归纳起来,可得参数的假设检验的一般步骤:(1)根据所讨论的实际问题建立原假设H0及备择假设H1;(2)选择合适的检验统计量Z,并明确其分布;(3)对预先给定的小概率>0,由确定临界值;(4)由样本值具体计算统计量Z的观察值z,并作出判断,若|z|≥z/2,则拒绝H0,接受H1;若|z|<z/2,则接受H0。统计量称为检验统计量。nXZ/0当检验统计量取某个区域C中的值时,就拒绝H0,则称C为H0的拒绝域,拒绝域的边界点称为临界值。如例1中拒绝域为,临界值为和2/zz2/||zz2/zz现在,我们来解决例1提出的问题:(1)假设H0:=0=4.55,H1:≠4.55;(2)选择检验用统计量;)1,0(~/0NnXZ(3)对于给定小正数,如=0.05,查标准正态分表得到临界值z/2=z0.025=1.96;9.35/108.055.4364.4/0nxz因为|z|=3.9>1.96,所以拒绝H0,接受H1,即认为新工艺改变了铁水的平均含碳量。(4)具体计算:这里n=5,,,故Z的观察值364.4x22108.0第Ⅰ类错误,当原假设H0为真时,却作出拒绝H0的判断,通常称之为弃真错误,由于样本的随机性,犯这类错误的可能性是不可避免的。若将犯这一类错误的概率记为,则有P{拒绝H0|H0为真}=。第Ⅱ类错误,当原假设H0不成立时,却作出接受H0的决定,这类错误称之为取伪错误,这类错误同样是不可避免的。若将犯这类错误的概率记为,则有P{接受H0|H0为假}=。三、假设检验中两类错误自然,我们希望一个假设检验所作的判断犯这两类错误的概率都很小。事实上,在样本容量n固定的情况下,这一点是办不到的。因为当减小时,就增大;反之,当减小时,就增大。那么,如何处理这一问题呢?事实上,在处理实际问题中,对原假设H0,我们都是经过充分考虑的情况下建立的,或者认为犯弃真错误会造成严重的后果。例如,原假设是前人工作的结晶,具有稳定性,从经验看,没有条件发生变化,是不会轻易被否定的,如果因犯第Ⅰ类错误而被否定,往往会造成很大的损失。因此,在H0与H1之间,我们主观上往往倾向于保护H0,即H0确实成立时,作出拒绝H0的概率应是一个很小的正数,也就是将犯弃真错误的概率限制在事先给定的范围内,这类假设检验通常称为显著性假设检验,小正数称为检验水平或称显著性水平。