chap71基本概念Neyman-Pearson基本引理一致最优势检验统计推断的三个方面:抽样分布,参数估计与假设检验根据样本的信息检验关于总体的某个假设是否成立的问题称为假设检验问题.比如,总体X的均值是否等于0;总体X是否服从正态分布等.chap72§7.1基本概念1.关于分布p的原假设与备择假设记为H0:pP0,H1:pP1P0与P1是分布族P的互不相交的非空子集.关于参数的原假设与备择假设记为1100:,:HH0与1是的互不相交的非空子集.给定H0和H1就等于给定检验问题,记为检验问题(H0,H1).2.定义:在检验问题(H0,H1)中,检验法则(简称检验法或检验)就是设法把样本空间X划分为互不相交的两个可测集:WWX并规定:当观测值xW时,就拒绝原假设H0,认为备择假设H1成立.当观测值xW时(即),就不拒绝H0,认为原假设H1成立,称W为检验的拒绝域.Wx选定了检验法确定了拒绝域chap73怎样选检验法,即怎样确定拒绝域?例1.电话交换台单位时间内接到的呼唤次数X~P(),0.为单位时间内接到的平均呼唤次数.为考察该台的是否不超过1,考虑检验问题.1:,1:10HH设x=(x1,…,xn)是交换台的n次记录,即来自P()的样本X=(X1,…,Xn)的一个观测值.取(检验)统计量(通常从参数的估计出发寻找检验统计量)niiXT1—的充分,完备的统计量.是的MLE.如H0成立,则的估计量不应太大,于是T也不应太大.因此,当T≥c(c是某个常数)时,就要拒绝H0.拒绝域可用检验统计量T表示为ˆ/XTnX1{|}{|}.niiWxTcxxcc称为临界值.T的观测值.WWX拒绝域用来确定拒绝域的统计量称为检验统计量chap743.两类错误当原假设H0为真时,样本观测值却落在拒绝域W中,从而使我们拒绝原假设.这种错误称为第一类错误,犯第一类错误的概率为0),()(WXP当原假设H0不真时,样本观测值却没落在拒绝域W中,而落在接受域中,从而使我们没有拒绝原假设.这种错误称为第二类错误.犯第二类错误的概率为W1),(1)()(WXPWXP例1中的检验犯两类错误的概率?已知X1,…,Xn独立,且都服从P().由卷积公式,)(~1nPXTnii即,1,0,!)()(keknkTPnkWWX1100:,:HH}.|{1cxxWniichap75犯第一类错误的概率,nckkekncTPWXP!)()()()(犯第二类错误的概率.1,!)()()(1)()(10nckkekncTPWXPWXP由以上两式可知n固定时不可能使得犯两类错的概率都减少.0),()(WXP1.1),(1)()(WXPWXP.1:,1:10HH()1-()不同,1,0,!)()(keknkTPnkchap764.势函数的定义:称样本观察值落在拒绝域的概率为检验的势函数(功效函数),记为),()(WXPg由定义知在0时,g()=()是犯第一类错的概率.在1时,g()=1-(),1-g()是犯第二类错的概率.势函数是假设检验中最重要的概念之一.因为同一个原假设可以有许多检验法,其中自然有优劣之分.这区分的依据,就取决于检验的势函数.这由上知,在0时,即H0为真时,希望势函数g()尽量小。在1时,即H1为真时,希望势函数g()尽量大。例1中检验的势函数:),0(,!)()()()(cknkekncTPWXPg是的严增函数.对取定的样本容量n,临界值c不同时,对应的检验势不同即通过c,可使势函数减小或增大.注意:取值在全空间chap77是的严增函数),0(,!)()()()(cknkekncTPWXPg10()()!1,(0,)()knkcnctnPTcektedtc右端可以看成是,形状参数为c,尺度参数为1的伽马分布的分布函数,因而是积分上限的严增函数,即的严增函数.chap78Neyman和Pearson的假设检验理论基本思想:寻找先控制犯第一类错误的概率在某一个范围内,然后寻找使犯第二类错误的概率尽可能小的检验.即对选定的一个较小的数(01)在满足的检验中,寻找在1时g()尽可能大的检验.5.检验的水平在例1检验中,由犯两类错误的概率表达式可看到:当n固定时,不可能使得犯这两类错误的概率都减少.0,)()(WXPg1!)()(,nckkekn.1,!)()(10nckkekng()=1-()在0时,g()≤的检验称为水平为的检验,记为(,0,1)检验.常取0.1,0.05,0.01等值.chap79根据检验的水平确定临界值c例1中cknkekng!)()(是的严格增函数.给定,在≤1(H0)时控制犯第一类错的概率)(gg()是的严格增函数,要在范围≤1中选取使g()最大的,即为=1,由)I(!)1(cknkekng确定拒绝域中临界值c:设n=10,=0.05.取使g(1)满足(I),且尽可能大的c=16,(g(1)=0.048740)}16|{101iixxW这是根据N-P基本思想,在满足(I)的前提下尽可能使势函数g()大一些,即相当于尽可能使()小一些水平没有被“足量”地使用.cknkekncTPg!)()()(chap7106.检验函数和随机化检验检验函数定义:设(x)为定义在样本空间X上的可测函数,满足条件0≤(x)≤1.在有了样本x后,计算(x),然后以概率(x)拒绝原假设,以概率1-(x)接受原假设,则称(x)为一检验(检验函数).若(x)能取(0,1)内之值,称(x)为随机化检验.若(x)仅取0,1两个值,则称(x)为非随机化检验,其拒绝域由满足条件(x)=1的那些x构成.势函数可写为WxWxx0,1,)(拒绝域()()()[()],XXgPXWxdFEX(x)实际用的不多,理论上有用处.非随机化检验函数:chap711例1中,n=10,=0.05时,取随机化检验函数原假设H0:1成立时,犯第一类错误的概率为1,16(),150,14TxrTT)(~1nPXTnii151010=16151010=16(10)(10)()[()]=1++0!15!(10)(10)+=0.048740+0.034718,1!15!kkkkEXerekererkgggg为使得水平=0.05被“足量”地使用,令0.048740+0.034718r=0.05r=0.036即1,16()0.036,150,14TxTTchap712§7.2Neyman-Pearson基本引理最优势检验的定义:在检验问题(0,1)中,设(x)是水平为的检验.如果对任意一个水平为的检验1(x),都有则称检验(x)是水平为的最优势检验,记为MPT.111[()][()]ExExNeyman-Pearson基本引理:0)]([)(,XEgchap713Neyman-Pearson基本引理:设和是可测空间(X,B)上的两个不同的概率测度,关于某个有限的测度,有0P1PddPxpddPxp10);(,);(10则对检验问题)(:,:101100HH(1)对给定的(01)存在一个检验函数(x)及常数k≥0,使)I()]([0xE)II();();(,0);();(,1)(0101xkpxpxkpxpx(2)由(I)和(II)确定的检验函数(x)是水平为的MPT.反之,如果(x)是水平为的MPT,则一定存在常数k≥0,使(x)满足(II)式(a.e.[]).测度为零的集合外Radon-Nikodym导数(p5)a.s.[]chap714证明:要证,存在形如(II)的检验函数,使(I)成立.对任一实数,令)};();({)(010XpXpPG此概率是在下计算,只需在集合{x;p(x;0)0}上考虑p(x;1)p(x;0).0P);();(01XpXpG()是非负r.v.的概率,因此});();({)(1010XpXpPG是的分布函数,);();(01XpXp是非降,右连续.(1)对给定的(01)存在一个检验函数(x)及常数k≥0,使)I()]([0xE)II();();(,0);();(,1)(0101xkpxpxkpxpxchap715所以G()非增,右连续,且(III));();()()0(1,0)-(00,)(010—XpXpPGGGG给定(0,1),有且只有下列两种情况:i)存在00,使G(0)=在第i)种情况下定义);();(,0);();(,1)(001001xpxpxpxpx则001000[()]{(;)(;)}()EXPpXpXG)(G0});();({)(1010XpXpPGii)存在00,使G(0)G(0-0))]([0xE要证)};();({)(010XpXpPG)(G0chap716定义);();(,0);();(,)()0()();();(,1)(001001000001xpxpxpxpGGGxpxpx则00010001000000[()]{(;)(;)}(){(;)(;)}(0)()()[()]EXPpxpxGPpxpxGGGG于是取k=0,则以上定义的(x)是水平为的检验函数,而且是水平被“足量”(等号成立)使用的检验函数.ii)存在00,使G(0)G(0-0))]([0xE要证)(G00)};();({)(010XpXpPGchap717(2)的证明:先证满足(I),(II)的检验函数(x)是MPT.设*(x)是任意一个水平为的检验函数,即)]([*0xE记)()(;,)()(;**xxxSxxxS则在S+上*(x)非负(x)≥0,因而由(II)知0);();(01xkpxp同理在S-上(x)≤1,因而0);();(01xkpxp因此在S+∪S-上总有0]);();()][(-)([01*xkpxpxx于是0)(]);();([0)(]);();()][(-)([S-X01S01*xdxkpxpxdxkpxpxxSS从而0)]}([{)]}([)]([{)]([)]([***00011xEkxExEkxExE所以(x)是MPT.)II();();(,0);();(,1)(0101xkpxpxkpxpx)()();()(11xExdxpx0[()](I