P值检验法在实际生活中的应用

整理文档很辛苦,赏杯茶钱您下走!

免费阅读已结束,点击下载阅读编辑剩下 ...

阅读已结束,您可以下载文档离线阅读编辑

资源描述

假设检验中的P值法在实际生活中的应用摘要假设检验是统计判断的重要内容,在很多情况下大多采用临界值法,而在现代统计软件中假设检验多是采用计算P值的方法进行推断的。检验时需要由样本观测值计算出检验统计量的观测值和衡量观测结果极端的P值,然后通过比较P值和显著性水平的大小作判断,当P时,拒绝原假设0H;当P时,不能拒绝原假设0H。论文列举了P值检验法在生活中一些应用案例,并和临界值法的做了优势比较。关键词:假设检验;临界值法;P值法;SASTheapplicationofHypothesistestP-valuemethodinreallifeAbstractHypothesistestisanimportantcontentofstatisticaljudgment;thecriticalvaluemethodisusedinmanycases.However,inmodernstatisticalsoftwareinhypothesistesting,themethodofcalculatingthePvalueofextrapolationisusedhereandthere.Inspectionneedbythevalueofthesampleobservationscalculatetheteststatisticoftheobservationvalueandmeasureobservationsofextremevalue,andthencomparePvaluesandasignificantleveloftheirsize,todetermine,whenrefusethenullhypothesis;whencannotrefusethenullhypothesis.ThepaperpresentssomeapplicationcasesofthevalueofPtestinlife,andalsotodosomecomparativeadvantage.KeyWords:Hypothesistest,thecriticalvaluemethod,theP-valuemethod,SAS目录引言........................................................21.P-值的定义................................................21.1临界值法.................................................21.2P-值法...................................................32.计算公式介绍..............................................33.双边检验P值与单边检验P值的关系...........................43.1检验统计量为对称连续分布时..............................43.2检验统计量为非对称分布时................................44.应用实例.................................................65.P-值法的优势..............................................12结束语......................................................12参考文献...................................................13引言假设检验法是统计判断中的重要内容,在平时的很多情况下多习惯采用临界值法做出判断原假设0H是否成立的方法,但是由于计算机的普及以及现代统计软件的出现在很多问题的计算中多采用假设检验的P值法。用这种方法在检验时需要有相应的样本观测值,并用这个观测值计算出检验的统计量在相应的观测值和衡量观测值结果中所出现的极端P值,之后再通过比较P值大小和显著性水平的大小来作出具体的判断。当P时,则拒绝原假设0H;当P时,则不能拒绝原假设0H。本文先介绍了P值法的定义,和一些计算方法再列举了P值检验法在生活中一些应用案例,最后和传统的临界值法做了优势比较。1.P-值的定义在介绍P-值法之前,我们首先要介绍一种比较传统的用来做假设检验的方法-临界值法(也可以叫做显著性水平法)。1.1临界值法设样本总体为20XN(,),并且其中20为一个已知常数,现在想要检验出是否会大于某给定常数0。再设原假设为0H,备选假设为1H,如下所示:0010H:;H:。从总体中抽取一些简单随机样本,并记录样本的均值为11X=niiXn。易知20(,)XNn(1)从而有00,1XUNn(2)当0H成立时010X-Pun(3)其中1称为临界值,满足1PU=1-u显著性水平为一较小的正数如0.10.05或。式(3)说明当0H成立时,检验统计量00X-n大于等于临界值是个小概率事件,对于某具体样本12,,nXXX,若该小概率事件发生,则拒绝原假设0H。否则就没有比较充分的理由去拒绝原假设0H。1.2P-值法而对于上述问题,P-值法的定义如下:对于某些具体的样本,其均值可以记为11Xniixn,设00X-P=PnU(4)若p,则拒绝原假设0H,否则就没有充分的理由去拒绝原假设0H。式(4)中的P就是在原假设0H成立的前提下所计算出的样本值,也可以说成是更极端情况的概率大小,简称为P值。2.计算公式介绍若W为检验统计量,而0W为W的观测值,通常P值可以用下面公式计算得到。I:单边检验P值(i)拒绝域在右边区域的检验假设0010HH::0P=PWW右(ii)拒绝域在左边区域的检验假设00:H10H:0ppWW左Ⅱ:双边检验P值假设0H:010;:H(i)当检验的统计量为对称分布的双边检验时由于00P=PWW+W-W双又000PWW=1-PWW=PW-W故可以得到以下结论:000002P,0,P=P2P,0;双(ii)当检验统计量为非对称分布的双边检验时,可以得到以下结论:00P=2minP,P双3.双边检验中P值与单边检验中P值间的关系根据上面P值的计算公式不难推出如下性质:设W为检验统计量,0W为W的观察值,W中为W的中位数,P双,P右和P左分别为双边检验0H:010=;H:,右边检验0010H:;H:和左边检验0010:;:HH的P值,则它们有下面关系:3.1检验统计量为对称连续分布时001PW02P=11-PW0;2双右双,,,0011PW0,2P=1PW0.2双左双,,3.2检验统计量为非对称分布时001PWW2P=11-PWW2双中右双中,,,;0011-PWW2P=1PWW.2双中左双中,,,证:1.检验统计量为对称连续分布时,由于000PWW=PWW+PW-W且统计量为联系对称分布,故有以下结论:000002PWW,W0PPWW=,2PWW,W0双0P=PWW右及0P=PWW左,所以(i)拒绝域为右边区域的检验,若0W0,则P=右0PWW=P/2双;若0W0,则00P=PWW=1-PWW1P/2双右.(ii)拒绝域为左边区域的检验,若0W0,则00PPWW=1-PWW=1-P/2双左;若0W0,则0P=PWW=P/2双左。2.检验统计量为非对称分布时,由于00P=2minPWWPWW双,,00P=PWWP=PWW右左及,所以(i)拒绝域为右边区域的检验,若0WW中,则0P=PWW=P/2双右;若0WW中,则P右=0PWW=1-P/2双。(ii)拒绝域为左边区域的检验若0WW中,则0PWW=1-P/2双左;若0WW中,则0P=PWW=P/2双左。当知道了双边检验的P值法和单边检验的P值法的关系后,三种不同检验法就可以一次性地完成。事实上,在实际应用中如果只作一次双边检验或者单边检验时候,得到的拒绝原假设0的结论下,有时还需要进行进一步的检验来判定是能否可以认为0或者0才可以得到更为准确的结论。即使是在得到不可以拒绝原假设0的结论下,如果双边检验的P值还不够大(0.050.1)p,也可以说是拒绝备择假设0的证据较弱,经常也需要再进一步作单边检验,以方便得到更为合理的0或0的结论。对于以上两种情形,再利用以上所述的双边检验的P值法和单边检验的P值法之间的关联,那么三种检验方法的同时进行就将变得会有必要了。在我们研究双边检验的P值法和单边检验的P值法之间的关系时,有时当检验的统计量为非对称分布的时候还要用到检验统计量分布中常用的中位数,我们可以查阅有关资料中给出的分位数表,或者用一些统计软件调用相应分位数函数来进行计算。4.应用实例例1在某次投掷一元硬币的重复试验中,假如你投掷一元硬币1000次,并记录下相应的一元硬币出现字的次数。如果每次出现字的次数都是500,那么你就有把握认为这枚一元硬币是均匀的;如果出现字的次数小于450或者大于550,那么你就会有一点怀疑它是不是均匀的;如果出现字的次数小于300或者大于700,那么你就比较怀疑是不是均匀的;如果出现字的次数小于100或者大于900,那么你就非常怀疑是不是均匀的。如上所述,如果出现字的次数和出现花的次数的差异越大,你就越有把握认为这枚硬币不是均匀的,即拒绝原假设。再重新叙述下P值的基本定义,“P值就是当原假设为真时,比得到的相应样本的观察结果出现更加极端的现象所得的概率”。把这个基本定义再代入上面所述的投掷一元硬币的重复试验的中去,好比说目前你所观察到的情况是“一元硬币投掷出现字的次数是100或者900。以致出现字和出现花的次数差异是800”:若原假设为真(一元硬币是均匀的),P值就是你投掷1000次一元硬币。所得的出现字和花的次数的差异大于800的概率。若这个P值很大,则表明每次投掷均匀的一元硬币1000次,经常会有出现字和花的次数差异大于800的情形。若这个P值很小,则表明每次投掷均匀的一元硬币1000次,你将很难看到出现字和花的次数差异会超过800。若一枚一元硬币投掷出字和花的次数差异大于800。这是一个“极端”的情况,只好认为原假设不对,一元硬币是不均匀的。在这里我们所用到的基本逻辑思维是:在假定原假设为真的前提条件下,出现我们所观察到的偏差(投掷出字和花的差异为800),是如此的不可能,即P值很小,以至于我们不能再继续相信原假设成立的真确性与否。例2一项关于某品牌巧克力的抽样调查结果显示,在n=34个曾吃过该品牌巧克力的被访者中,有3X个人喜欢该品牌巧克力。生产该饮料的厂家声称“五分之一的消费者喜欢该品牌巧克力”。检验该厂家说法的合理性。从样本看,喜欢该品牌巧克力的被访者的比例为325,低于厂家的声称15。这种差异可能是由于抽取样本的随机性导致的,也有可能是因为厂家的声称有误。由于样本的结果15小于厂家的声称335,所以设立0H与1H如下:0111H;H55:p=:p其中,P为实际喜欢该品牌巧克力的消费者比例。容易知道,在抽取的34n个曾吃过该品牌巧克力的被访者中,喜欢该品牌巧克力的被访者人数X服从二项分布,即1Xb345,,那么出现样本值或者更极端值的概率为

1 / 15
下载文档,编辑使用

©2015-2020 m.777doc.com 三七文档.

备案号:鲁ICP备2024069028号-1 客服联系 QQ:2149211541

×
保存成功