补充内容:P值检验

整理文档很辛苦,赏杯茶钱您下走!

免费阅读已结束,点击下载阅读编辑剩下 ...

阅读已结束,您可以下载文档离线阅读编辑

资源描述

p值检验法前面讨论的假设检验方法称为临界值法,此法得到的结论是简单的,在给定的显著性水平下,不是拒绝原假设,就是接受原假设.但应用中可能会出现这样的情况:在一个较大的显著性水平(如α=0.05)下得到拒绝原假设的结论,而在一个较小的显著性水平(如α=0.01)下却得到接受原假设的结论.这种情况在理论上很容易解释:因为显著性水平变小后会导致检验的拒绝域变小,于是原来落在拒绝域内的观测值就可能落在拒绝域之外(即落入接受域内),这种情况在实际应用中可能会带来一些不必要的麻烦.假如这时一个人主张选显著性水平α=0.05,而另一个人主张选显著性水平α=0.01,则第一个人的结论是拒绝0H,而第二个人的结论是接受0H,如何处理这一问题呢?解例1一支香烟中的尼古丁含量(,1)XN,质量标准规定不能超过1.5mg,现从某厂生产的香烟中随机地抽取20支,测得平均每支香烟尼古丁含量为1.97xmg,试问该厂生产的香烟尼古丁含量是否符合标准的规定?按题意,需要检验假设01:1.5,:1.5HH这是一个有关正态总体下方差已知时对总体均值的单边假设检验问题,采用u检验法得拒绝域为0/xuun由已知数据可算得01.971.52.1/1/20xun在以下表中列出了显著性水平α取不同值时相应的拒绝域和检验结论.表8-2例1中的拒绝域显著性水平拒绝域检验结论α=0.051.645u拒绝0Hα=0.0251.96u拒绝0Hα=0.012.33u接受0Hα=0.0052.58u接受0H由此可以看出,对同一个假设检验问题,不同的α可能有不同的检验结论.假设检验依据的是样本信息,样本信息中包含了支持或反对原假设的证据,因此需要我们来探求一种定量表述样本信息中证据支持或反对原假设的强度.现在换一个角度分析例1,在1.5时,(0,1)uN,此时可算得(2.1)0.0179Pu,当α以0.0179为基准做比较时,则上述检验问题的结论如表8-3所示.通过上述分析可知,本例中由样本信息确定的0.0179是一个重要的值,它是能用观测值2.1做出“拒绝”的最小的显著性水平,这个值就是此检验法的p值.表8-3以0.0179为基准的检验问题的结论显著性水平拒绝域检验结论0.0179,(2.1)uuu接受0H0.0179,(2.1)uuu拒绝0H0H有了这两条结论就能方便地确定的拒绝域.这种利用p值来检验假设的方法称为p值检验法.一般在一个假设检验中,利用观测值能够做出的拒绝原假设的最小显著性水平称为该检验的p值.按p值的定义,对于任意指定的显著性水平α,有以下结论(1)若p值,则在显著性水平α下接受0H.(2)若p值,则在显著性水平α下拒绝0H.0Hp值反映了样本信息中所包含的反对原假设0H的依据的强度,p值是已经观测到的一个小概率事件的概率,p值越小,0H越有可能不成立,说明样本信息中反对0H的依据的强度越强、越充分.一般,若0.01p,称拒绝0H的依据很强或称检验是高度显著的;若0.010.05p,称拒绝0H的依据是强的或称检验是显著的;若0.050.1p,称拒绝0H的依据是弱的或称检验是不显著的;若0.1p,一般来说,没有理由拒绝0H.P值的计算用X表示检验用的统计量,样本数据算出的统计量的值记为C.当H0为真时,可算出P值。左侧检验:{}pPXC右侧检验:{}pPXC双侧检验:X落在以C为端点的尾部区域概率的两倍2{},2{},{||||}PXCCpPXCCPXC在分布的右侧在分布的左侧(如果分布对称)解例2从甲地发送一个讯号到乙地,设乙地受到的讯号是一个随机变量X,且2(,0.2)XN,其中是甲地发送的真实讯号值,现从甲地发送同一讯号5次,乙地受到的讯号值为8.058.158.28.18.25给定显著性水平α=0.05,试利用p值检验法检验假设检验问题01:8,:8HH.这是一个有关正态总体下方差已知时对总体均值的双边假设检验问题,采用u检验法,检验统计量为0/XUn拒绝域的形式为||uc由已知数据可算得检验统计量的观测值008.1581.68/0.2/5xun00(||||)2[1(||)]0.093PPUuu值=由于α=0.050.093=p值故接受0H.例3用p值检验法检验本章第二节例3的检验问题012112:,:0.05HH,解用t检验法,检验统计量12(22)1/1/wXYTtSnn拒绝域的形式为||tc观测值03107528.672.6472.851/121/12tα=0.050.014725=p值由计算机软件算得0(||||)(||2.647)0.014725pPTtPT值由于故拒绝0H1、一农场10年前在一鱼塘中按比例20:15:40:25投放四种鱼:鲑鱼、鲈鱼、竹夹鱼和鲇鱼的鱼苗,现在在鱼塘里获得一样本如下:序号1234种类鲑鱼鲈鱼竹夹鱼鲇鱼数量/条132100200168600试取0.05,用p值检验法检验各类鱼数量的比例较10年前是否有显著的改变.习题8-52、考察生长在老鼠身上的肿块大小.以X表示在老鼠身上生长了15天的肿块的直径(以mm计),设2,XN,2,均未知.今随机地取9只老鼠(在他们身上的肿块都长了15天),测得4.3,1.2,xs试取0.05,用p值检验法检验假设01:4.0,:4.0,HH求出p的值.第六节假设检验的功效函数用概率反证法检验一个假设的推理依据是小概率原理.在一次抽样中,若小概率事件发生了,则拒绝原假设;若小概率事件没有发生,拒绝原假设的理由不充分,因而只好接受原假设.这样的检验结果可能出现以下两种类型的错误.一、犯两类错误的概率P(拒绝H0|H0真)=P(小概率事件)≤第Ⅰ类错误(弃真)当原假设H0真时,抽样结果表明小概率事件发生了,按检验法将拒绝H0,这样就犯了所谓“弃真”的错误.给定显著水平,由于所以弃真概率不超过显著水平弃真概率为P(拒绝H0|H0真)第Ⅱ类错误(取伪)当H0假时,抽样结果表明小概率事件没有发生,按检验法将接受H0,这样就犯了所谓“取伪”的错误.取伪概率为P(接受H0|H1真)例1设总体,未知,求关于假设的U检验法的两类错误概率.),(~2NX200:H01:HnXU/0解检验统计量20||||unxu拒绝域2u弃真概率P(拒绝H0|H0真)=P(|U|≥)=02XPunn)0(022unXuP)()(22uu2u取伪概率P(接受H0|H1真)=P(|U||H1真),0n0其中的真值二、两类错误概率的控制前面我们处理参数假设检验问题时,实际上只考虑了控制第I类(弃真)错误概率不超过显著水平.在一些实际问题中,如果错误地接受了某个假设可能造成重大损失,或由此带来灾难性的结果,因而在接受这类假设时要特别慎重,也就是要控制第Ⅱ类(取伪)错误概率.自然希望选择一个优良的检验方法,使得出现两类错误的概率都很小.定义若是参数的某检验问题的一个检验法,当H0假时,1-表示取伪的概率)(将两类错误概率用统一的函数表示出来:P)({拒绝H0})(称为检验法的功效函数)(当H0真时,表示弃真的概率一个优良的检验法,应使在H0真时尽可能小,在H0假时尽可能大.)(这两方面的要求是矛盾的,正如在区间估计问题中,“置信度高”与“估计精确”是矛盾的.那里,我们采用在保证一定的置信度下使区间长度尽可能小的原则.选择一种优良检验的策略思想与此类似,即先保证弃真的概率不超过指定值,再设法控制取伪概率.)|(|2uUP)|(|12uUP)()(122uu为便于说明,继续前面例9的讨论.检验的功效函数P)({拒绝H0})(0n其中取伪概率(记为))(h)(弃真概率)(ˆ)()()(122huu22222)(exp2)(expπ21)(uuh由于1)()(22maxuuh0()0h当时00)(h当时0)(h当时取最大值当与的偏差越大,取伪的概率越小;0此时,越小,越大,见图8-1当与非常接进时,取伪的概率几乎等于10其含义为:由此可知,当与n都给定时不可能同时控制两类错误概率都很小下面先控制弃真的概率为再来考虑如何减小取伪概率0)(limh由于)()(1h要控制取为伪概率(很小)||||0n只要使足够大||有两种方法可使增大(1)减小试验误差;(2)取样本数目n很大.在实际中,试验误差不可能无限小,因而一般采用加大样本容量n的方法来控制取伪概率,但这是以消耗大量人力、物力、财力为代价的.在实际应用中,要根据“弃真”或“取伪”所造成的有害程度来确定,的值.样本容量的选取02021()[()][()]nnuu0010例:对双边U检验:H:=,H:对给定的显著性水平,为了使第二类风险不大于,如何选取样本容量?=解:此时0,|-|nn由于依赖于真值,无论去多大,不能指望对所有的对进行控制。但可以对时,选取对进行控制22=))nnuu此时最大值(-(-22=))nnuu此时最大值(-(-22=))nnuu此时最大值(-(-22))nnuu此时要使只需(-(-2)0nnu由于当很大时,(-12212()[]ununu-u12)=)nu只需(-(u0010例:对右边U检验:H:,H:对给定的显著性水平,为了使第二类风险不大于,如何选取样本容量?000()()()xnxnPnu解:此时拒绝域:W={u},u00-()()()nnuu当时,211()[]uunuun0=0=0.05=1.1,8.57n比如,,1,希望当时,这个检验二类风险不大于00最大功效检验*0011*1**1:,:HHH定义,给定一个参数型统计问题,其总体参数,要检验假设如果存在一个显著性水平的检验,使得对于任意一个显著性水平的检验,均有()(),则称检验为这个假设检验问题在一个显著性水平下的一致最大功效检验,当为简单假设时,则称为最大功效检验。01:NeymanPearson最有检验原则在控制第一类风险满足显著性水平下使得第二类风险尽可能小:(),()尽可能大,00112001111011*1101*-,},(,,,):,:,(,){}(,)(,){}(,)nniiniiniiniiXXXHkfXPkfXfXWkfX定理(奈曼皮尔逊)设总体的分布密度或概率函数为f(x,),={为样本。要检验假设H对给定的显著性水平,如如果存在临界值使得那么,以为拒绝域的检验是该假设检验问题在显著性水平下的最大功效检验。12001101,,,):,:,nXXH例设(X是取自正态总体N(,1)的样本,其中未知,要检验H其中在显著性水平下求最大功效检验的拒绝域。120010*1,,,):,:{nXXH

1 / 36
下载文档,编辑使用

©2015-2020 m.777doc.com 三七文档.

备案号:鲁ICP备2024069028号-1 客服联系 QQ:2149211541

×
保存成功