样本含量估计

整理文档很辛苦,赏杯茶钱您下走!

免费阅读已结束,点击下载阅读编辑剩下 ...

阅读已结束,您可以下载文档离线阅读编辑

资源描述

第19章样本含量估计朱彩蓉华西公共卫生学院卫生统计学教研室抽样的目的由样本信息推断总体信息样本的代表性抽样时的可行性样本含量估计的原则足够的检验效能下的最小样本含量既能满足医学科研的统计学要求又能最大限度控制研究成本和研究风险,提高研究效率样本含量估计的不同情况总体参数的估计常见于调查设计用样本信息(XS、p)估计总体特征(、)影响因素分析或预测用样本信息完成总体间的比较相关(或回归)分析总体参数估计中样本含量的估计拟调查某地区人群血红蛋白含量(g/L),已知中国人血红蛋白含量为(120±30)g/L,要求允许误差不超过5g/L(即=5)。取=0.05,问需要调查多少患者?从总体均数为120g/L的总体中进行抽样样本均数在115~125g/L之间的概率为1-0.0500.10.20.30.41-/2/2-+x2~(,)XN2~(,)XXN22XZZn2/2Zn单纯随机、有放回抽样例19.1拟调查某地区人群血红蛋白含量(g/L),已知中国人血红蛋白含量为(120±30)g/L,要求允许误差不超过5g/L。取=0.05,问需要调查多少患者?05.0/20.05/21.96ZZ30521.9630138.31395n估计条件正态分布、有放回抽样情况下估计误差总体标准差(用来计算标准误)可信度(概率保证程度)1-,一般取95%,即=0.05正态分布、无放回抽样情况下(尤其当有限总体时)**11XXXNnnNN1cnnnN估计总体率时样本含量的估计正态分布、有放回抽样情况下估计误差总体标准差可信度(概率保证程度)1-(1))1(22/22/ZZn整群抽样样本含量的估计正态分布、有放回整群抽样情况下估计误差群标准差S群可信度(概率保证程度)1-2/2ZSg群对于定性资料,当总体为无限总体时对于定性资料,当总体为有限总体时对于定量资料,无论总体是否有限22=(/)()/(1)iiNNppKS22(1/)(/)()/(1)iikKNNppKS22=(/)()/(1)iiNNxxKS22(1/)(/)()/(1)iikKNNppKS22=(/)()/(1)iiNNxxKS22=(/)()/(1)iiNNppKS22(1/)(/)()/(1)iikKNNppKS22=(/)()/(1)iiNNxxKS分层抽样的样本含量估计N:总体样本含量Ni:各层(子总体)样本含量Pi:各层(子总体)概率估计值Wi:各层(子总体)样本含量在总样本含量中所占比例22/2222/2(1)(1)iiiiiiiZNPPWnNZNPP等距抽样样本含量估计相当于分层较多(总体分为同等大小的m个层)而每层抽取一个调查单位的分层抽样其抽样误差可由分层抽样的误差公式近似计算假设检验中样本含量的估计已知某地成年男性的血红蛋白含量(13515)g/L,拟在当地煤矿工人中对成年男性进行抽样调查,研究煤矿工人的血红蛋白量水平与当地一般成年男性无差异。根据专业医学知识,当血红蛋白含量相差10g/L以内时,认为二者无差异。取=0.05,=0.10,问应检查多少煤矿工人?若两人群实际有差异,也发现了这种差异的最小样本例数设血红蛋白服从正态分布+●●●●/2检验效能1-22xZZn()()xZZn2()nZnZ22()ZZnX~N(,2)X~N(,x2)估计条件正态分布,不同总体间方差齐I型错误概率,一般取0.05(注意单双侧)II型错误概率,一般取0.1或0.2总体间差距总体标准差单样本均数的比较单样本设计均数比较的样本含量估计(双侧)2/2()ZZn例19.3已知某地成年男性的血红蛋白含量(135±15)g/L,拟在当地煤矿工人中对成年男性进行抽样调查,研究煤矿工人的血红蛋白量水平与当地一般成年男性无差异。根据专业医学知识,当血红蛋白含量相差10g/L以内时,认为二者无差异。取=0.05,=0.10,问应检查多少煤矿工人?10/20.05/2=1.96ZZ0.10=1.282ZZ152(1)(1.961.282)1523.62410n独立样本比较的样本含量估计独立样本均数差的分布2/2()ZZn212121211~(,())XXNnn211~(,)XN222~(,)XN11nnQ22nnQ211121212~(,)QQXXNn2/21112ZZnQQ独立样本比较的样本含量估计当两样本含量不等时当两样本含量相等时2/21112ZZnQQ2/24ZZn样本比例(samplefraction)n=n1+n2,Q1=n1/n,Q2=n2/n当两组例数相等时,Q1+Q2=0.5+0.5=1根据设计需要可以调整比例如:Q1+Q2=0.6+0.4或Q1+Q2=0.3+0.7等。例19.4某人欲比较A药与B药对改善贫血的作用,据以往经验,A药可增加红细胞11012/L,B药可增加红细胞21012/L。若=1.81012/L,取=0.05,=0.10,每组例数相等,问需要多少病例?若A药组样本含量占整个样本含量的60%,每组各需多少病例?21nn121.810/L1212=(21)10/L=110/L/20.05/2=1.96ZZ2(1.960.842)1.8250.9511842.020.0ZZ若要求A药组样本占整个样本含量的60%,即10.6Q2110.4QQ211(1.960.842)1.8(0.60.4)106.01N配对设计均数比较样本含量估计2/2()dZZn例19.5已知依地酸二钠钙可使铅中毒患者的血红蛋白升高(30±10)g/L,依据经验,规定治疗后患者血红蛋白升高值5g/L以上治疗有效。为验证该药疗效,作单侧检验,取=0.05,=0.10,问需纳入多少病例?645.105.0ZZ842.020.0ZZ10d0.05=0.10=52(1.6451.282)1034.3355n定性资料的样本含量估计单样本设计的率比较样本含量估计2/2(1)ZZn例19.6已知常规疗法治疗湿疹的有效率为45%,现采取新式疗法治疗湿疹,估计治疗有效率可达55%,取=0.05,=0.10,问需要干预多少人?0.450.550.450.10/20.05/2=1.96ZZ0.10=1.282ZZ21.961.2820.45(10.45)260.12610.10n独立样本率比较样本含量估计两组样本比例相等两组样本比例不相等2/224()(1)ZZn21111/212111222(1)()(1)(1)ZQQZQQn2/224()(1)ZZn21111/212111222(1)()(1)(1)ZQQZQQn例19.7要研究菜农钩虫感染率是否与粮农不同,估计菜农和粮农的感染率分别为20%及10%,取=0.05,=0.10,问样本例数相等时各需调查多少人?如果要求菜农组样本量占总样本的60%,菜农组和粮农组各需调查多少人?样本例数相等时/20.05/2=1.96ZZ05.010.00.10=1.282ZZ120%210%12=(+)/2=15%1210%=0.10.2681.0)15.01(15.0282.196.122221)(nn要求菜农组样本含量占60%,则粮农组样本含量占40%,0.20.60.10.40.16211111.960.16(10.16)(0.60.4)1.2820.2(10.2)0.60.1(10.1)0.40.20.1N559.6560配对设计的率比较样本含量估计212/21222aZZn22121,,cacbab例19.8拟比较甲、乙两种快速检验试纸对乙肝表面抗原的检出情况,初步估计甲法的阳性检出率为96%,乙法的阳性检出率为90%,两种方法一致的阳性检出率为88%。问需要检测多少乙肝患者的血样?甲方法+–合计+0.88n0.02n0.90n乙方法–0.08n0.02n0.10n合计0.96n0.04nn10.020.0220.90bnabn20.080.0830.96cnacn120.0220.0830.05322表19.3乙肝表面抗原快速检验试纸试验05.010.0/20.05/2Z1.96Z0.101.282ZZ21.9620.0531.28220.0220.083/0.053255.32560.0830.022n相关系数检验的样本含量估计2/2431ln1ZZn直线相关的样本含量估计211111ln()~(ln(),)21213rNrnrr骣++÷ç÷ç÷÷ç--桫-例19.9估计长期大量饮酒与胃癌之间的相关系数=0.5,取双侧=0.05,=0.10,问需多少样本例数?/20.05/2Z1.96Z0.101.282ZZ21.961.2824337.83810.5ln()10.5n小结基本公式总体信息的获得方式查阅文献预实验专业意义或经验2/2Zn2/2()ZZn使用公式计算得到的样本含量为有效样本含量(最小样本含量)调查设计中缺失值、无效访问等前瞻性研究中对象的退出、失访、意外死亡、剔除等样本含量调整习惯在样本含量公式估计值基础上增加20%多组情况下样本含量的估计以其中总体间差异()最小的两组估计每组样本含量作为其余每组的样本含量检验效能的估计何时需要估计检验效能假设检验中P,不拒绝H0总体间实际无差异检验效能不足(犯II型错误)检验效能的估计方法2/2()ZZn/2nZZ查标准正态分布表,得到1-的估计值查表注意事项当Z0时,检验效能一定大于0.5应使用-Z值查标准正态分布曲线下的面积(附表2)得到值,检验效能为(1-)。当Z0时,检验效能一定小于0.5直接使用Z值查标准正态分布曲线下的面积得到的概率值即为检验效能(1-)。估计检验效能的意义当检验效能低于75%时,则认为结论不可靠样本例数过少应增加样本例数重新研究单样本均数比较的检验效能/2nZZ例19.11已知某地9岁儿童身高为(135.82±6.13)cm。从该地农村随机抽取了30名9岁儿童,测得其

1 / 70
下载文档,编辑使用

©2015-2020 m.777doc.com 三七文档.

备案号:鲁ICP备2024069028号-1 客服联系 QQ:2149211541

×
保存成功