复旦版工程数学之概率统计课件第31讲续

整理文档很辛苦,赏杯茶钱您下走!

免费阅读已结束,点击下载阅读编辑剩下 ...

阅读已结束,您可以下载文档离线阅读编辑

资源描述

第三十一讲(续)检验的p值前面,我们已经了解到,在假设检验中使用的逻辑是:如果原假设H0是对的,那么衡量差异大小的某个统计量落入区域W(拒绝域)是个小概率事件.如果该统计量的实测值落入W,也就是说,H0成立下的小概率事件发生了,那么就认为H0不可信而否定它.否则我们就不能否定H0。我们称这个小概率为显著性水平,用表示.在前面的假设检验中,这个显著性水平是事先给定的..05.0,01.0,1.0如根据给定的显著性水平,我们得到的假设检验结果只有两个,拒绝或不能拒绝原假设.但作出这一结论或那一结论的可能性有多大,则往往不易清楚地显示出来.拒绝域为W:|U|1.96要检验假设H0:=0;H1:≠0取检验统计量为nXU0)1,0(~N例如从正态分布总体N(,1)中抽样得X1,X2,…,Xn,其中n=16.(显著性水平=0.05)拒绝域为W:|U|1.96则根据拒绝域,我们不能拒绝=0,也就是只能接受=0.设又有另一组样本,由样本算得U=0.48,结论也是接受=0.对这两组样本而言,结论一致.设由样本算得U=1.92,0然而,我们会觉得,在后一场合,作出接受的结论根据充分一些,而在前一场合,根据就不很够.为了反映这一点,我们引进检验的p值.设有一个原假设H0,其拒绝域为|T|C,T是检验统计量.若对一组具体样本,算出统计量T的值为T0,则称这组样本的p值是p=P(|T||T0||H0)它的意思是,如果H0是对的,那么看到|T||T0|的概率有多大?如果这个概率很小,我们就倾向于拒绝H0;反之,如果这个概率不是很小,我们就不能拒绝H0.如果拒绝域为TC,则p值是p=P(T>T0|H0),如果拒绝域为TC,则p值是p=P(T<T0|H0)类似地,T0是对一组具体样本,算出的统计量T的值.p值是当H0正确时,得到所观测的数据或更极端值的概率.若p,则拒绝H0.若p,则不能拒绝H0;将显著性水平与p值比较p值是人们可以拒绝原假设的最小显著性水平在实践及各种统计软件中,人们并不事先指定显著性水平的值,而是很方便地利用上面定义的p值.对于任意大于p值的显著性水平,人们可以拒绝原假设,但不能在任何小于它的水平下拒绝原假设.TH正面55次反面45次掷一枚均匀硬币100次,问这枚硬币是否均匀?2/1:2/1:10pHpH提出假设其中p为正面出现的概率.取统计量npU/)5.01(5.05.0ˆ近似N(0,1)pˆ为正面出现的频率.由中心极限定理先算出统计量U的实测值我们来计算检验的p值.1100/)5.01(5.05.055.0Up=P{|U|1}检验的p值是:=2-2(0.8413)=0.3174=2-2(1)=1-P{|U|≤1}若给定显著性水平0.3174,U的实测值就不落入拒绝域,此时不能拒绝H0.50次50次0.50不能拒绝H045次55次40次60次THU值决策值p0.31741不能拒绝H00.04562拒绝H0下面给出几种情况下的p值及按05.0的检验结果35次65次0.00263拒绝H0由p值不难看出,出现65次正面时,拒绝H0的把握较大;出现60次正面时,次之.但若0.04,则不能拒绝H0.我们来看另一个例子:1988年7月28日的纽约时报上刊登了一篇有关人们地理知识的文章.这篇文章中描述了一个研究结果.研究者们从一些国家抽取许多成年人并请他们鉴别在一个地图上的16个地方(包括13个国家、中非、波斯湾和太平洋);然后把每个人答对的个数加起来.四个国家的样本中答对的个数的均值如下:美国6.9墨西哥8.2大不列颠9.0法国9.2平均来看,法国的回答者有可能在地图上找到的地方比其他三个国家的人要多.美国6.9墨西哥8.2大不列颠9.0法国9.2几国答对个数的均值这篇文章称“从统计显著性方面考虑,得分相差至少应在0.6以上才算有差异.”也就是说,样本均值的不同可能仅仅归于随机性.仅当两样本均值相差在0.6以上才认为两国均值是有差异的.美国6.9墨西哥8.2大不列颠9.0法国9.2几国答对个数的均值我们来探讨墨西哥的总体均值是否等于美国的总体均值.要检验的假设是:我们用表示墨西哥的总体均值,12用表示美国的总体均值0:0:211210HH取检验统计量已知n1=1200,n2=1600,计算得t的实测值等于4.25.)2(~112)1()1()(21212122221121nntnnnnSnSnYXt642)1()1(21222211nnSnSn已知墨西哥的样本中有1200个观测,美国的样本中有1600个观测.3.1YX我们来计算检验的p值.由于样本量很大,我们用正态分布N(0,1)近似t分布.用计算机上软件求得p值=P(|t|4.25)≈0.00001因此样本均值的差大于等于1.3的概率也是0.00001.换句话说,从均值相等的总体中抽取大约100000个样本才有可能碰到一次样本均值差在1.3以上,即在总体均值相等的情况下样本均值差异这么大是件罕见的事情.于是我们认为导致这个小概率出现的假设-------两总体均值相等是错误的.因此拒绝假设H0.即认为墨西哥和美国两个总体均值差异不是0.由前述,只要显著性水平大于0.00001,人们就可以拒绝原假设.或者说,1.3这个差异是统计显著的.作出这种结论犯错误的概率非常小.

1 / 19
下载文档,编辑使用

©2015-2020 m.777doc.com 三七文档.

备案号:鲁ICP备2024069028号-1 客服联系 QQ:2149211541

×
保存成功