第6章总体率的区间估计和假设检验

整理文档很辛苦,赏杯茶钱您下走!

免费阅读已结束,点击下载阅读编辑剩下 ...

阅读已结束,您可以下载文档离线阅读编辑

资源描述

第6章总体率的区间估计和假设检验掌握率的抽样误差的概念和意义掌握总体率区间估计的概念意义和计算方法掌握率的U检验的概念和条件,计算方法第一节率的抽样误差与总体率的区间估计一、率的抽样误差:在同一总体中按一定的样本含量n抽样,样本率和总体率或样本率之间也存在着差异,这种差异称为率的抽样误差。率的抽样误差的大小是用率的标准误来表示的。例6.1检查居民800人粪便中蛔虫阳性200人,阳性率为25%,试求阳性率的标准误。本例:n=800,p=0.25,1-p=0.75,%53.10153.080075.025.0pS二、总体率的区间估计㈠正态分布法样本含量n足够大,np与n(1-p)均≥5时,例6.2求例6.1当地居民粪便蛔虫阳性率的95%可信区间和99%的可信区间。95%的可信区间为:25%±1.96×1.53%即(22.00%,28.00%)99%的可信区间为:25%±2.58×1.53%即(21.05%,28.95%)㈡查表法当样本含量较小(如n≤50),np或n(1-p)5时,样本率的分布呈二项分布,总体率的可信区间可据二项分布的理论求得。第二节率的u检验应用条件:样本含量n足够大,np与n(1-p)均≥5。此时,样本率p也是以总体率为中心呈正态分布或近似正态分布的。一、样本率与总体率比较的u检验u值的计算公式为:例6.5根据以往经验,一般胃溃疡病患者有20%(总体率)发生胃出血症状。现某医生观察65岁以上胃溃疡病人152例,其中48例发生胃出血,占31.6%(样本率)。问老年胃np)1(nppSp)1(pSupnppup)1(||||0000溃疡病患者是否较一般胃溃疡病患者易发生胃出血。计算结果及判断58.3152)20.01(20.0|20.0316.0|u判断:u=3.58u0.05=1.64(单侧),P0.05。在α=0.05水准上,拒绝H0,接受H1,差异有统计学意义。二、两样本率比较的u检验适用条件为两样本的np和n(1-p)均大于5。计算公式为例6.6某中药研究所试用某种草药预防流感,观察用药组和对照组(未用药组)的流感发病率,其结果见表6-1。问两组流感发病率有无差别?表6-1用药组和对照组流感发病率比较组别观察人数发病人数发病率(%)用药组1001414对照组1203025合计2204420第七章二项分布与Poisson分布第一节二项分布及其应用一、二项分布的概念及应用条件二项分布(binominaldistribution)是一种重要的离散型分布,在医学上常遇到属于两分类的资料,每一观察单位只具有相互独立的一种结果,如检查结果的阳性或阴性,动物试验的生存或死亡,对病人治疗的有效或无效等。二项分布也称为贝努里分布(Bernoullidistribution)或贝努里模型,是由法国数学家J.Bernoulli于1713年首先阐述的概率分布。如果已知发生某一结果(如阳性)的概率为π,其对立结果(阴性)的概率为(1-π),且各观察单位的观察结果相互独立,互不影响,则从该总体中随机抽取n例,其中出现阳性数为X(X=0,1,2,3,…,n)的概率服从二项分布。贝努里模型应具备下列三个基本条件试验结果只出现对立事件A或,两者只能出现其中之一。这种事件也称为互斥事件。试验结果是相互独立,互不影响的。例如,一个妇女生育男孩或女孩,并不影响另一个妇女生育男孩或女孩等。每次试验中,出现事件A的概率为π,而出现对立事件的概率为1-π。则有总概率π+(1-π)=1。二、二项分布的概率函数根据贝努里模型进行试验的三个基本条件,可以求出在n次独立试验下,事件A出现的次数X的概率分布。X为离散型随机变量,其可以取值为0,1,2,…,n。)11)(1(21212121nnppppSppuccpp2121nnxxpc则X的概率函数为:X=0,1,2,3…..,n式中:0π1,XnC为组合数,上述公式称随机变量X服从参数为n,π的二项分布,则记为X~B(n,π)。三、二项分布的性质1.二项分布的每种组合的概率符合二项展开式,其总概率等于1111000)1()1()1()]1([nnnnnXXnXXnnCCC1)1()1(0111nnnnnnCC二项展开式有以下特点:(1)展开式的项数为n+1。(2)展开式每项π和(1-π)指数之和为n。(3)展开式每项π的指数从0到n;(1-π)的指数从n到0。2.二项分布的累积概率设m1≤X≤m2(m1<m2),则X在m1至m2区间的累积概率有:21)1()(21mmXXnXXnnCmXmP至多有x例阳性的概率为:xXnXPxXP0)()(X=0,1,2,…,x(7.4)至少有x例阳性的概率为:nxXnXPxXP)()(X=x,x+1,…,n分别为下侧累计概率,和上侧累计概率。3.二项分布的概率分布图形以X为横坐标,P(X)为纵坐标,在坐标纸上可绘出二项分布的图形,由于X为离散型随机变量,二项分布图形由横坐标上孤立点的垂直线条组成。二项分布的图形取决于与n的大小。当n充分大时,二项分布趋向对称,可以证明其趋向正态分布。一般地,如果nπ之积大于5时,分布接近正态分布;当nπ5时,图形呈偏态分布。当π=0.5时,图形分布对称,近似正态。如果π≠0.5或距0.5较远时,分布呈偏态。4.二项分布的数字特征(这里的数字特征主要指总体均数、方差、标准差等参数)(1)随机变量X的数学期望E(X)=μ,即指总体均数:μ=nπ(2)随机变量X的方差D(X)=σ2为:)1(2n(3)随机变量X的标准差为:)1(nXnXXnnCXP)1()(四、二项分布展开式各项的系数二项分布展开式的各项之前均有一个系数,用组合公式来表示。计算公式为:)!(!!XnXnCXn该系数也可用杨辉三角来表示,国外参考书习惯称之为巴斯噶三角。当试验次数n较小时,可直接利用杨辉三角将二项分布展开式各项的系数写出来,应用十分方便。杨辉三角的意义:①杨辉三角中每行有几个数字,表示展开式有几项。当试验次数为n时,有n+1项。②杨辉三角中每行中的数字表示展开式中每项的系数大小。③杨辉三角中的各数字项及其数字的排列很有规律。可依照规律继续写下去。第一行的第一、第二项均为数字1,以后每下一行的首项及末项均为1,中间各项为上一行相邻两项数字之和。五、二项分布的应用二项分布在医学领域中,主要应用在下列几个方面:①总体率的可信区间估计,②率的u检验,③样本率与总体率比较的直接计算概率法。(一)应用二项分布计算概率例如出生男孩的概率π=0.5,出生女孩的概率为(1-π)=0.5。在一个妇产医院里有3名产妇分娩3名新生儿,其中男孩为X=0,1,2,3的概率按公式计算的结果列于表7-1的第(3)栏中。分析:根据题意,已知生育男孩为事件A,其概率P(A)=0.5(即π=0.5);生育女孩为事件A-,其概率为P(A-)=1-P(A)=1-0.5=0.5(即1-π=0.5)。三个妇女生育均为女孩(即无男孩)的概率为:125.05.05.0)!03(!0!3)1()0(303003CP三个妇女生育一个男孩,两个女孩的概率为:375.05.05.0)!13(!1!3)1()1(212113CP(二)样本率与总体率的比较的直接概率法此法适用nπ和n(1-π)均小于5的情形。应注意:①当样本率大于总体率时,应计算大于等于阳性人数的累积概率。②当样本率小于总体率时,应计算小于等于阳性人数的累积概率。例A药治疗某病的有效率为80%。对A药进行改进后,用改进型A药继续治疗病人,观察疗效。①如果用改进型A药治疗20例病人,19例有效。②如果用改进型A药治疗30例病人,29例有效。试分析上述二种情形下,改进型A药是否疗效更好。分析:A药有效率为80%,可以作为总体率,即π0=0.8。治疗20例病人的样本有效率为(19/20)×100%=95%;治疗30例病人的样本有效率为(29/30)×100%=96.67%。两个样本率均大于总体率80%,故应计算大于等于有效例数的单侧累积概率。情形一:治疗20例病人的疗效分析(1)建立检验假设H0:改进型A药的疗效与原A药相同,π=π0=0.80H1:改进型A药的疗效高于原A药,π>π0=0.80单侧α=0.05(2)计算概率值根据二项分布有:(P02020201191920)20.0()80.0()20.0()80.0()20()19()19CCPPX=0.0548+0.0115=0.0663(3)推断结论本例P=0.0663>0.05,在0.05检验水准上,不拒绝H0。尚不能认为改进型A药的疗效优于原A药。情形二:治疗30例病人的疗效分析(1)检验假设同情形一。(2)计算单侧累积概率有:03030301292930)20.0()80.0()20.0()80.0()30()29()29(CCPPXP=0.008975+0.001238=0.0102(3)推断结论本例P=0.0102,在=0.05水准上,拒绝H0,接受H1。可以认为改进型A药的疗效优于原A药。注意:治疗20例病人的有效率为95%,治疗30例病人的有效率为96.67%,两个样本有效率很接近。但最终得出的结论却不相同。一般地,临床上观察疗效,样本含量不能太小。随着观察例数的增加,疗效的稳定性及可靠性也相应增加,受到偶然因素影响的机会也变得较小。例一般人群对B药的副作用反应率为1%。调查使用B药者300人,其中只有1人出现副作用。问该调查人群对B药的副作用反应率是否低于一般人群。分析:本例总体率=1%。调查人群样本反应率为(1/300)×100%=0.33%。由于样本率小于总体率,故应计算小于等于阳性人数的累积概率。(1)建立检验假设H0:调查人群反应率与一般人群相同,π=π0=0.01H1:调查人群反应率低于一般人群,ππ0=0.01单侧α=0.05(2)计算单侧累积概率:1976.01486.00490.0)99.0()01.0()99.0()01.0()1()0()1(2991130030000300CCPPXP(3)推断结论本例P=0.1976,在α=0.05水准上,不拒绝H0。尚不能认为调查人群的B药副作用反应率低于一般人群。第二节Poisson分布及其应用一、Poisson分布的概念及应用条件(一)Poisson分布的概念Poisson分布由法国数学家S.D.Poisson在1837年提出。该分布也称为稀有事件模型,或空间散布点子模型。在生物学及医学领域中,某些现象或事件出现的机会或概率很小,这种事件称为稀有事件或罕见事件。稀有事件出现的概率分布服从Poisson分布。Poisson分布的直观描述:如果稀有事件A在每个单元(设想为n次试验)内平均出现λ次,那么在一个单元(n次)的试验中,稀有事件A出现次数X的概率分布服从Poisson分布。Poisson分布属于离散型分布。在Poisson分布中,一个单元可以定义为是单位时间,单位面积,单位体积或单位容积等。如每天8小时的工作时间,一个足球场的面积,一个立方米的空气体积,1升或1毫升的液体体积,培养细菌的一个平皿,一瓶矿泉水等都可以认为是一个单元。一个单元的大小往往是根据实际情况或经验而确定的。若干个小单元亦可以合并为一个大单元。二)常见Poisson分布的资料在实际工作及科研中,判定一个变量是否服从Poisson分布仍然主要依靠经验以及以往累积的资料。以下是常见的Poisson分布的资料:1.产品抽样中极坏品出现的次数;2.枪打飞机击中的次数;3.患病率较低的非传染性疾病在人群中的分布;4.奶中或饮料中的病菌个数;5.自来水中的细菌个数;6.空气中的细菌个数及真菌饱子数;7.自然环境下放射的粒子个数;8.布朗颗粒数;9.三胞胎出

1 / 12
下载文档,编辑使用

©2015-2020 m.777doc.com 三七文档.

备案号:鲁ICP备2024069028号-1 客服联系 QQ:2149211541

×
保存成功