第三章假设检验假设检验问题,就是通过从有关总体抽取一定容量的样本,利用样本去检验总体分布是否具有某种特征。假设检验问题大致分为两类:(1)参数检验问题:即总体的分布形式已知(如正态,指数,二项分布等),总体分布依赖于未知参数(或参数向量)θ,要检验的是有关未知参数的假设。例如总体),(~2NXμ未知,检验:01000100::::HHHH(2)非参数型假设检验:如果总体分布形式未知,此时就需要有一种与总体分布族的具体数学形式无关的统计方法,称为非参数方法。例如检验一批数据是否来自某个已知的正态总体的问题。第一节假设检验的基本概念一、假设检验问题的提出实际推断原理:小概率事件在一次试验中几乎不会发生;或者说在一次试验中观察到的事件不会是小概率事件。实际推断原理是假设检验的基本原则,类似于数学推断中的反证法,但是又与反证法有本质的不同。二、基本概念1、总体分布族假设是来自于分布族中某一分布的简单随机样本。目前我们只考nXXX,,,21}:),({xf虑参数分布族,即概率密度或概率函数的形式已知,参数的真值属于已知的参数空间但是未知。与参数估计的问题一样,总体分布族的确定建立了统计模型。2、原假设与对立假设在实际问题中,研究人员往往提出某个假设,并希望通过样本来检验该假设是否成立。在上例中,检验人员关心的问题是:这批产品的不合格率是否大于0.04,这个假设可以称为研究假设,在假设检验问题中,称为对立假设或备择假设。“不合格率小于等于0.04”就是研究假设的反面,称为原假设或零假设。原假设常用H0来表示,对立假设常用H1来表示。在参数族分布模型中,原假设和对立假设表现为参数的不同范围。为了清楚的表达所考虑的原假设和对立假设,一般的将它们成对的写出来:04.0:;04.0:04.0:04.0:1010pHpHpHpH一般的参数的假设检验问题可以表示为:10101100::且的真子集均为,其中HH3、检验规则即根据样本判断能否接受原假设的规则一般的,最简单的检验规则是:把样本可能的取值范围即样本空间划分为两个不相交的部分,并且这种划分不依cSS和赖于未知参数;当样本落入S时就拒绝原假设H0而接受对立假设H1,否则就接受原假设H0。划分称为假设检验问题的一个检验。称S为该检验的拒绝域,),(cSS10HH而为该检验的接受域。为了研究的方便,常用检验函数φ(X)来描述检验规则:cS,0,1)(CSSXXX显然,检验函数为拒绝域的示性函数。当φ(X)=1时,拒绝原假设,当φ(X)=0时,接受原假设。检验函数完全的表示了检验规则。在通常的情况下,检验的拒绝域可以通过一个统计量来表示,这个统计量称为检验统计量。此时,拒绝域和接受域之间常用一个或几个数值分开,称这些值为检验的临界值。4、两类错误第一类错误:原假设为真,而错误的拒绝了原假设,称为弃真。拒绝正确的原假设H0等价于SX检验函数犯第一类错误的概率为:这个概率一般随在0中取值的变化而变化。0XSX()),(()(第一类错误)EPP第二类错误:原假设不真,而错误的接受了原假设,又称为取伪,接受错误的原假设H0等价于一般地,检验函数犯第二类错误的概率为:cSX1C)),X((1)S(X)(EPP第二类错误5、功效函数定义1:设的一个检验函数,则:1100::)(HH是X)),(())(()(0XEHXP拒绝了用检验称为检验的功效函数(powerfunction),也称为势函数。检验函数犯第一类错误的概率为这个概率一般随θ在Θ0中的取值变化而变化。0*)),(()()(()(XXESPP第一类错误)第二类错误:一般的检验函数犯第二类错误的概率为:1*)(1))((1()(,)(第二类错误)XXESPPc一个好的检验函数,犯两类错误的概率都应较小,也就是功效函数在0中应尽可能的小,在1中尽可能的大。6、检验水平希望一个检验犯两类错误的概率都小,一般在固定样本大小时,对任何检验都办不到。例如:要犯第一类错误的概率减小,就要缩小拒绝域,使接受域增大,这必然导致犯第二类错误的概率增大,反之亦然。因此Neyman—Paerson提出了一条原则,就是限制犯第一类错误概率的原则,即在保证犯第一类错误的概率不超过指定数值α(0α1,通常取较小的数)的检验中,寻找犯第二类错误概率尽可能小的检验。若记:表示由所有犯第一类错误的概率不超过α的检验函数构成的类.只考虑中的检验,在中挑选“犯第二类错误的概率尽可能小0,)(:SSSS的检验”,这种法则称为控制犯第一类错误概率的法则。根据Neyman—Paerson原则,在原假设H0为真时,作出错误决定(即否定H0)的概率受到了控制.这表明,原假设H0受到保护,不至于轻易被否定。所以在具体问题中,往往将有把握、不轻易否定的命题作为原假设H0,而把没有把握的、不能轻易肯定的命题作为对立假设。因此原假设H0和对立假设H1的地位是不平等的,不能相互调换。与犯第一类错误概率相联系的另一个概念是检验水平。定义2:设φ是的一个检验,而0≤α≤1。如果φ犯第一类错误的概率总不超过α,则称α是检验φ的一个水平,而φ称为显著性水平α的检验。1100::HH第二节正态总体参数的假设检验一、单个正态总体均值的检验设X=(X1,X2,…,Xn)为从正态总体N(μ,σ2)中抽取的简单随机样本,给定检验水平α,求下列三类检验:其中μ0和检验水平α给定。010001000100::)3(::)2(::)1(HHHHHH1、正态总体的方差σ2已知对于检验(1),称为双边检验在估计理论中用样本均值作为总体均值的估计。在直观上,若原0100::HH假设H0成立,样本均值与μ0的差别不应太大,若差别过大,就有理由拒绝原假设。但是在考虑两者的差时,还应该考虑总体均方差的取值。因此检验统计量取值为:当原假设为真,即时,检验统计量nXU/00)1,0(~NU对于给定的检验水平α,有于是,当总体的方差已知时,双边检验(1)的检验水平为α的拒绝域为:1)|(|2uUP}|:|),...,{(21uUXXSTn其检验函数为:uUuUX22||0,||,1)(2、正态总体的方差σ2未知当正态总体的方差未知时,检验统计量就需要改变,在原来的检验统计量中,σ未知,自然想到用样本方差去替代总体方差。于是,取检验统计量为:且由T分布的定义知:nSXT)1(~ntT对于检验(1),当原假设成立,及给定的显著性水平α,有:则认为,检验(1)的水平为α的拒绝)}1(|||{|20ntnSXTP域为:该检验称为t检验,其检验函数为:)}1(|:|),,,{(221ntTXXXSTn)1(||,0)1(||,1)(22ntTntTX同理可得检验(2),(3)的拒绝域与检验函数。检验统计量仍然取nSXT对于检验(2),当原假设成立时,有于是检验的拒绝域为:)}1({0ntnSXP)}1(:),,,{(21ntTXXXSTn对于检验(3),当原假设成立时,有于是检验的拒绝域为:)}1({0ntnSXP)}1(:),,,{(21ntTXXXSTn二、单个正态总体方差的检验设X=(X1,X2,…,Xn)为从正态总体N(μ,σ2)中抽取的简单随机样本,给定检验水平α,求下列三类检验:其中及检验水平α给定。202120202021202020212020::)3(::)2(::)1(HHHHHH20三、两个正态总体均值差的检验设分别来自两个相互独立的正态总体当μ0和检验水平α给定时,讨论下列检验问题:),,,(),,,,(2121nmYYYXXXLLYX),(~),,(~222211NYNX012101200121012001210120::::::HHHHHH1、当已知时均值差的检验2221,2、当未知时均值差的检验22221四、两个正态总体方差比的检验设分别来自两个相互独立的正态总体),,,(),,,,(2121nmYYYXXXYX),(~),,(~222211NYNX当检验水平α给定时,讨论下列检验问题:1:1:)3(1:1:)2(1:1:)1(212212122021221212202122121220HHHHHH五、成对数据的t检验前面讨论的用于两个正态总体均值差、方差比的检验中,假定了来自两个正态总体的样本是相互独立的,但在实际问题中,有时候情况不是这样,可能这两个正态总体的样本是来自同一个总体上的重复观察,它们是成对出现的,而且是相关的,例如,为了观察一种安眠药的效果,记录了n个失眠病人服药前的每晚睡眠时间X1,X2,…,Xn和服用此安眠药后每晚睡眠时间Y1,Y2,…,Yn,其中(xi:yi)是第i个病人不服用安眠药和服用安眠药每晚的睡眠时间,它们是有关系的,不会相互独立。另一方面X1,X2,….Xn是n个不同失眠病人的睡眠时间,由于个人体质诸方面的条件不同,这n个观察值不能认为是来自同一个正态总体的样本。Y1,Y2,…,Yn也是一样。这样的数据称为成对数据,这样的数据用两样本t检验就不合适,因为Xi和Yi是同在第i个病人身上观察到的夜晚睡眠时间,所以Zi=Xi-Yi就消除了人的体质诸方面的差异,仅剩下安眠药的效果。若安眠药无效,Zi的差异仅由随机误差引起,随机误差可认为服从正态分布N(0,σ2),故可假定Z1,…,Zn为自N(μ,σ2)中抽取的简单随机样本,μ就是安眠药的平均效果,安眠药是否有效,就归结为检验如下假设:0:0:10HH因为Z1,…,Zn认为是来自正态总体N(μ,σ2)的简单样本,故可用关于单个正态总体均值的t检验方法,检验的否定域为:)}1(|:|),,,{(221ntTZZZSnL此处α为检验水平,为检验统计量,其中和S2分别为Z1,…,Zn的样本均值和样本方差。SZnTZ例:为检验A,B两种测定铁矿石含铁量的方法是否有明显差异,现用这两种方法测定了取自12个不同铁矿的矿石标本的含铁量(%),结果如下表,问这两种测定方法是否有显著差异?(α=0.05)六、极限分布为正态分布的检验本段讨论Behrens-Fisher问题的大样本检验,附带也给出这一问题的一个小样近似方法。同时也讨论二项分布和Poisson分布参数的大样本检验问题。Behrens一Fisher问题的两样本检验设XI,…,Xm是从正态总体N(μ1,σ12)中抽取的简单随机样本.Y1,Y2,…,Yn是从正态总体N(μ2,σ22)中抽取的简单随机样本,且样本Xl,…,Xm和Y1,Y2,…,Yn独立,考虑μ2-μ1的下列三类检验问题:其中μ0和检验水平α给定。021102100211021002110210::)3(::)2(::)1(HHHHHHσ12和σ22未知且不相等时的检验问题称为Behrens一Fisher问题,是尚未解决的问题,下面将介绍处理这类检验问题的大样本方法.记S12和S22分别为两组样本的样本方差,将分下列两种情形来讨论(1)σ12和σ22未知但m,n充分大.(2)σ12和σ22未知但m,n不都是充分大.第三节常见非正态总体参数检验一、指数分布设简单随机样本来自指数分布的总