高等数理统计-假设检验

整理文档很辛苦,赏杯茶钱您下走!

免费阅读已结束,点击下载阅读编辑剩下 ...

阅读已结束,您可以下载文档离线阅读编辑

资源描述

第三章假设检验学习目的和要求学习重点学习难点教学方法授课时数基本内容学习目的和要求目的和要求:假设检验的基本概念,理解Neyman-Pearson基本思想。在此基础上,掌握一致最优势检验、一致最优势无偏检验的数学方法、掌握多参数指数型分布族的假设检验、似然比检验、U统计量检验和秩检验。学习重点1、Neyman-Pearson基本思想2、几种类型的假设检验的基本思想。学习难点秩检验教学方法讨论讲授授课时数8学时基本内容第一节基本概念第二节Neyman-Peason引理第三节一致最优势检验第四节一致最优势无偏检验第五节多参数指数型分布族的假设检验第六节似然比检验、U统计量检验、秩检验什么是假设检验?在很久以前的一次有各方人士参加的社交聚会中,一位女士为活跃气氛,声称她能区分在熬好的咖啡中,是先加奶还是先放糖。众人不信,于是有爱凑热闹的人弄来8杯加了奶,放了糖的咖啡请该女士鉴别,结果该女士判断正确7杯,错误1杯。于是很多人都承认该女士的鉴别能力,但是也有一些人却固执地认为该女士既然有鉴别能力,应该都说对,不应该猜错1杯,7对1错的结果完全是瞎蒙出来的。两派人争执不下,正好也出席联欢会的一位统计学者,他认为该问题很有意思,思索良久,写出了推理思路。假设检验相关概念定义1、设(Ω,F,P)为一统计结构,则P的非空子集称为假设,在参数分布族中时,的非空子集称为假设。{:}PP定义2、在一个假设检验问题中常涉及两个假设。所要检验的问题称为原假设。与原假设不相容的假设称为备择假设。011::oHPPHPP在参数分布族中,原假设和备择假设分别为:011::oHHP定义3、在检验问题中,所谓检验法则(或称检验法、或检验)就是设法把样本空间划分成不相交的两个可测集。PWW——W称为检验的拒绝域定义4、在参数统计结构中0()(),PXW1()()1(),PXWPXW定义5称样本值落在拒绝域的概率为检验的势函数,记为()(),gPXW在时,,是检验犯第一类错误的概率。在时,,是检验犯第二类错误的概率。0()g()()g1()1()g1()g定义6检验的水平()()gPXWNeyman-Pearson假设检验理论的基本思想,就是使得犯第一类错误的概率在某一个范围内,然后寻找使犯第二类错误的概率尽可能小的检验。定义7检验函数1()0xWxxW()()(())gPXWEX其势函数为定义8设是定义在P上的可测函数,满足条件,则称为随机化检验函数。()x0()1x()x()x()()(())gPXWEX其势函数为第二节Neyman-Pearson基本引理定义(MPT):在检验问题中,设是水平为的检验,如果对任意一个水平为的检验,都有则称检验是水平为的最优势检验,记为MPT(mostpowerfultest)()x()x01(,)111()()ExEX1()x定理(N-P基本引理)1P设和是可测空间上两个不同的概率测度,关于某个有限的测度,有0P(,)F0101(;),(;)dPdPpxpxdd设原假设和备择假设分别为:0011:,:HH(1)对给定的水平存在一个检验函数及常数k,使得则()x0()EX10101(;)(;)()0(;)(;)pxkpxxpxkpx(2)满足该条件的检验函数是水平为的MPT,反之,如果是水平为的MPT,则一定存在常数k,使得满足上式.()x()x()x注1满足该定理条件的检验函数通常称为似然比检验函数(或称为概率比检验函数)。如()x0011:,:HH定义似然检验比函数10(;)()(;)pxxpx注2在似然比函数具有连续分布函数时,MPT检验函数可以取为非随机化的形式1()()0()xkxxk其中k由确定00(){()}EXPxk若似然比函数为离散型随机变量时,可在集合实施随机化。MPT函数可取为{:()}xxk0001{()}{()}{()}PXkPXkPXk例题设样本是来自正态总体,考虑如下的假设:0111:0,:(0)HH在水平为时,构造似然比统计量1_21111(;)()exp{0.5}(;0)niiniipxxnxnpx则MPT的拒绝域具有形式_{:()}{:}Wxxkxxc令1Ucn即可此题中若呢?10例题设样本来自Poisson分布族0111:1,:(1)HH在水平为时,构造似然比统计量11111(;)()exp[(1](;1)niinixiiniipxxnpx1niiTx取统计量由N-P基本引理,检验函数为115()15015TxrTT关于简单假设对简单假设的检验问题,N-P基本引理给出了令人满意的解决方案。在实际问题中,往往出现的是复合假设的情况。定义(UMPT):在检验问题中,设是水平为的检验,如果对任意一个水平为的检验,都有则称检验是水平为的一致最优势检验,记为UMPT(uniformlymostpowerfultest)()x()x01(,)11()()ExEX1()x一致最优势检验问题(UMPT)在某些情况下,UMPT可以直接从N-P引理推出性质1设是检验,是的子集,如果是的UMPT,则是的UMPT。()x()x01(,,)011(,,)()x01(,,)010性质2设是检验,则是的UMPT的充要条件是,对每一个,是的MPT。()x01(,,)()x01(,,{})1101(,,)()x性质3设是检验,假设对某个的和对某一个,都是的MPT,则也是的UMPT。()x01(,,)()x0001(,,)()x1101(,{},{})如果简单原假设对简单备择假设的检验问题的MPT不依赖于备择假设的具体数值,则可适当扩大备择假设;而当势函数是单调函数时,也可适当扩大原假设。反之,对于复合假设检验问题,MPT的依赖于备择假设中的,则UMPT不一定存在。()x对下面几种检验问题进行讨论:001000100010010112012110()::;()::;()::;()::;();:;IHHIIHHIIIHHIVHHVHH或或类型III,IV一般无UMPT,所以不讨论。类型I,II类似,V过于复杂,且不实用,所以只讨论类型I即可。定义:设是含有实参数的概率密度族,其中是实直线上的一个区间。如果存在实值统计量T(X),使得对任意,都有(1)概率分布与是不同的;(2)似然比是T(x)的单调函数,则称概率密度族关于T(x)具有单调似然比MLR(montonelikelihoodratio)。{(;):}px{(;):}px1P2P21(;)()(;)pxxpx12如单数指数型分布族(;)()exp{()()}()pxcQTxhx若Q函数是单调函数,则222111(;)()()exp{[()()]()}(;)()pxcxQQTxpxc是T(x)的单调函数定理:设单参数概率密度族关于实值统计量T(x)具有非降MLR,则对于单边假设检验问题(I),存在水平为a的UMPT检验函数1()(())()0()TxcTxrTxcTxcr由下式确定0(())ETX同学们请参考例3.5(P189)所以在很多情况下,对于一个复合假设的检验问题,UMPT不存在.所以必须找出构造检验法(不管是简单假设还是复合假设)的一般方法.人们提出了似然比检验方法.似然比检验设X=(X1,X2,…,Xn)的分布密度函数是p(x;θ),对于简单假设:0011:,:HH检验问题的似然比为:10(;)()(;)pxxpx对于复合假设:0011:,:HH我们可定义1010sup(;)(;)()sup(;)(;)pxpxxpxpx这里,θ0和θ1分别是H0和H1成立时,θ的MLE。P(x;θ1)是备择假设成立时,观察到样本点x的可能性的一个度量;P(x;θ0)是原假设成立时,观察到样本点x的可能性的一个度量.在λ(x)比较大时,备择假设成立观察到样本点x的可能性比较大,因此可拒绝原假设.故检验的拒绝域可设为:{:()}xxc请同学们参考例题3.14(P220)一般来说,为了更好地确定c的值,要对似然比检验函数的分布形式进行研究,但似然函数一般没有确定的分布形式和分布规则.1938年,统计学家Wilks研究了似然比统计量的极限分布,并得到了一个重要的定理。定理3.18(P222)^101(;)()(;)niiniipxxpx其中,是参数的MLE。^22ln()()nXk原假设成立时例题3.16(P225)例题样本且全部样本独立.要检验假设21,,,.,(,),1iimiiXXiidNim22220111::mmHH不成立记___2121112211(),,iinniiijiiiijjjmmiiiSnXXXnXnSSnnn则221112lnlnloginnniikrmnniiSYnsnSS所以大样本似然比检验有否定域21()nmY非参数统计结构的假设检验问题前述各种检验方法基本上适用于参数统计结构,这些方法往往要求总体分布族的密度函数的数学形式已知,且只含有限个未知参数,但有些时候,人们难于由经验或某种理论得到总体的参数统计结构,而只能得到非参数统计结构。因此有必要寻求非参数统计结构的检验方法。游程检验检验随机性的一个重要方法。0::H1随机性H没有随机性(有聚类倾向)Bernoulli实验:掷一个硬币,以概率p得正面(记为1),以概率1-p得反而(记为0)。得到下面的结果:00000001111110000111100称连在一起的0或者1为游程(run),则上面这组数中有3个0游程,2个1游程,总共有5个游程(R=5)。0的总个数m=13,1的总个数为n=10。记总的实验次数为N,N=m+n。由常识得知,如果这个实验是随机的,则不大可能出出太多的1或0的游程。11111111112(2)(21)kkmnnNkkkkmnmnnNCCPRkCCCCCPRkC原假设成立时,算出或的值,也就可以做检验了()PRr()PRr在m或n不大时,可直接计算得出。12()()PRcPRc及而当样本很大时,即时,在零假设下,mnrn32/(1)(0,1)4/(1)RmrZNrmr可以借助于正态分布表得到p值和检验结果,在给定水平a后,可以用下面的近似公式来得到临界值2212221,11zzmnmnccmnmnmnmn在实际问题中,不一定都碰到只有0或1所代表的二元数据,但是可以把它转换成二元数据来分析。例:在工厂的质量管理中,生产出来的20个元件的某一尺寸按顺序为:12.27,9.92,10.81,11.79,11.87,10.90,11.2210.80,10.33,9.30,9.81,8.85,9.32,8.67,9.3

1 / 77
下载文档,编辑使用

©2015-2020 m.777doc.com 三七文档.

备案号:鲁ICP备2024069028号-1 客服联系 QQ:2149211541

×
保存成功