主讲人:黄品贤所在部门:上海中医药大学基础医学院预防医学教研室联系方式:hpx8388@163.com联系电话:51322156网址:统计学三大任务与三大规则三大任务:描述样本特征、估计总体参数、检验总体差别三大规则:对比类型(设计类型)、数据类型、分布类型一、确定样本含量的意义确定样本量是医学研究设计的一个重要内容。在估计样本含量时应克服两种倾向:一是片面追求大样本,认为样本含量越多越好,其结果导致人力、物力、财力和时间的浪费;二是忽视样本含量的估计,使得样本量偏少,检验效能偏低,得出非真实的阴性结果。樱桃.gif一、确定样本含量的意义样本含量估计是指为确保研究结论在一定检验效能基础上的最少观察单位数。医学研究没有绝对的样本量标准。样本含量的大小应根据研究目的、研究设计的类型、研究资料的性质、接受的处理因素、研究对象的种类、研究阶段、统计方法等因素而决定。一、确定样本含量的意义在临床研究中,样本量越小,其抽样误差越大。若样本量不足,可重复性差,检验效能低(容易犯第二类错误),不能排除偶然因素的影响,其结论缺乏科学性、真实性。若样本量过大,实验条件难以严格控制,容易造成人力、物力和时间上的浪费。樱桃.gif二、确定样本含量应具备的条件1.第一类错误的概率(检验水准α)。常取α≤0.052.检验效能(把握度1-β)>0.75。检验效能即在特定的α水准下若总体间确实存在着差异,此时该次实验能发现此差异的概率。1-β常取0.80、0.85、0.90。3.所比较的两个总体参数的差值δ:可根据专业上有意义的差值代替4.总体标准差σ:由样本标准差代替、查阅文献…2121樱桃.gif校正样本含量由于估算的样本含量是最少需要量,考虑到受试者可能有不合作者、中途失访、意外死亡等情况出现,而减少有效观察对象的例数,因此,应该在估算的样本含量基础上增加若干样本例数。通常,失访人数不得大于20%。樱桃.gif樱桃.gif二、样本含量估计的注意事项组间例数相等多指标估计多种估计条件与研究目的的结合估计的适用条件樱桃.gif1.组间例数相等成组设计的样本含量,尽可能采用例数相等的设计,尤其是多组设计时,一般要求各组间的样本含量相等。只有在某些特殊情况下才考虑各组的样本含量不相等。樱桃.gif2.多指标估计若研究有多个效应指标,其样本含量估计应对每个效应指标进行样本量的估计,然后取样本数量最大者为其研究的样本量。若研究能区分主要指标和次要指标,也可以对主要指标进行样本含量估计,然后取量大者为其研究的样本含量。樱桃.gif3.多种估计条件尽可能将多样本含量估计方法联合使用,并且在使用计算估算时,可多做几种方案,以便选择。如:不同α、β、δ等条件组合下,估计其样本含量。樱桃.gif4.与研究目的的结合根据研究目的严格选择估算样本含量的方法。如单侧与双侧不同,估计参数与假设检验不同,一般假设检验与等价检验不同,样本率超过与0.3~0.7(0.2~0.8)范围不同,t检验与u检验不同等。樱桃.gif5.估计的适用条件目前,国内有关书籍提供的样本含量计算公式,主要适用于临床试验,而并非适用于其他医学实验,如动物实验。动物实验的样本含量可以参考临床试验的样本含量,并在此基础上适当减少其数量。樱桃.gif二、样本含量估计的注意事项组间例数相等多指标估计多种估计条件与研究目的的结合估计的适用条件樱桃.gif三、样本含量的估计(1)估计总体均数时样本量估计(2)估计总体率时样本量估计(3)样本均数与总体均数比较的样本量估计(4)完全随机设计两样本含量相等时均数比较的样本量估计(5)完全随机设计两样本含量不等时均数比较的样本量估计(6)配对设计两样本均数比较的样本量估计(7)完全随机设计多样本均数比较的样本量估计(8)完全随机设计两样本率比较的样本量估计(9)完全随机设计多个样本率比较的样本量估计(10)直线相关分析时样本含量估计(11)两样本相关系数比较的样本量估计(11)不配对病例-对照研究设计样本量估计(13)病例-对照研究设计时样本量(配对对照研究的样本含量)(14)队列研究设计四格表资料统计分析时样本量(已知RR)(15)队列研究设计四格表资料统计分析时样本量(已知p1、p2)(16)两样本生存率比较的样本量估计樱桃.gif(1)估计总体均数时样本量估计例题1:已知某地成年男子心率的标准差为20.9次/分,现在某研究想进一步了解该地区成年男子心率的总体平均水平,若规定误差δ不超过5次/分,取α=0.05,试估计需要调查多少人?2un已知:其中,n,δ,σ,s分别为样本含量、允许误差、总体标准差和样本标准差。2stn未知:樱桃.gifCOMPUTEn=(1.96*8.9/5)**2.EXECUTE.n=68(1)估计总体均数时样本量估计樱桃.gif(2)估计总体率时样本量估计例题2:某研究欲调查乳腺小叶增生的发病率。已知一般中青年女性乳腺小叶增生的发生率约占70%。要求正式调查时所得样本率与已知发生率相差不超过5%的可能性不大于0.05,如果采用简单随机抽样,需要多少调查对象?200)1(uun其中:n,δ,π0分别为样本量、允许误差、已知的总体率。樱桃.gifCOMPUTEn=0.70*(1-0.70)*((1.96+1.282)/(0.05))**2.EXECUTE.(2)估计总体率时样本量估计樱桃.gif(3)样本均数与总体均数比较的样本量估计例题3:某药厂评价某种治疗原发性高血压的疗效,要求用药后舒张压下降1.5kPa(1kPa=7.5mmHg)才算该药有实际疗效。根据以前试验表明舒张压下降量的标准差为3kPa。规定α=0.05,检验效能1-β=0.9,试估计需要多少病人进行临床试验?2)(uun樱桃.gifCOMPUTEn=((1.96+1.282)*3/1.5)**2.EXECUTE.n=43(3)样本均数与总体均数比较的样本量估计樱桃.gif(4)完全随机设计两样本含量相等时均数比较的样本量估计其中:为第一类错误概率的u值,为第二类错误概率的u值,δ为容许误差,两均数之差,σ为总体标准差。例题4:某药厂对新研发的降压中成药与标准降压药的疗效比较。已知标准降压药能使血压平均水平下降2kPa,期望降压中成药能平均下降4kPa,降压值的标准差为4kPa。α=0.05,检验效能1-β=0.9时,需要多少病人进行临床试验?221)(2uunnuu樱桃.gifCOMPUTEn=2*((1.96+1.282)*4/(4-2))**2.EXECUTE.(4)完全随机设计两样本含量相等时均数比较的样本量估计樱桃.gif(5)完全随机设计两样本含量不等时均数比较的样本量估计两样本含量之比为n1:n2=1:k其中:δ为两均数之差,σ为总体标准差。对照组样本含量为kn。K为对照组样本例数占试验组例数的比例。例题5:某研究者分析多毛症患者与正常人血清睾丸酮含量(ng%)的不同。根据其他研究者的血清睾丸酮含量的标准差为13.33。H0:μ1-μ2=δ0=0;H1:μ1-μ2=δ1=10。α=0.05,检验效能1-β=0.95时,由于多毛症患者较少,预计以1:4的比例调查患者与健康人,问需要调查患者与健康人各多少?2011)(1suukkn樱桃.gifCOMPUTEn=(4+1)/4*((1.96+1.645)*13.33/(10))**2.EXECUTE.n1=29n2=29*4=116(5)完全随机设计两样本含量不等时均数比较的样本量估计两样本含量之比为n1:n2=1:k樱桃.gif(6)配对设计两样本均数比较的样本量估计例题6:用某药治疗硅沉着病患者后,尿矽排除量平均增加15mg/L,其标准差为25mg/L。假定该药确能使尿矽排除量增加,定α=0.05,β=0.05,问需观察多少患者才能得出服药前后尿矽排除量之间的差别有统计学意义的结论?2)(dsttn樱桃.gifCOMPUTEn=((1.96+1.645)*25/15)**2.EXECUTE.n=37(6)配对设计两样本均数比较的样本量估计樱桃.gif随机区组设计的样本含量估计222uQdMSen式中:MSe为误差的均方,d为总组间差值;一般取α=0.05,Q值查表1。表1随机区组设计样本含量估计的Q值表组数345678910Q值3.43.84.04.24.44.54.64.7【例题】欲比较4种中药方降低血清谷丙转氨酶(ALT)的效果。由预实验得MSe=30(U/L)2,预计d=8U/L,问每组需要观察多少病例?本例:已知MSe=30(U/L)2,d=8U/L,取α=0.05,β=0.10代入公式11-4,得21.24282.18.3830222nCOMPUTEn=2*(30/8**2)*(3.8+1.282)**2.EXECUTE.樱桃.gif(7)完全随机设计多样本均数比较的样本量估计 例题7:某中医院应用中西医结合治疗肺气虚、脾气虚、肾气虚慢性阻塞性肺疾病(COPD)患者,并与单纯西药为对照组,观察中西医结合治疗COPD患者不同中医证型的肺功能改善效果,根据查阅相关资料,肺气虚的FVC(L)为2.44±0.32;脾气虚为2.40±0.36;肾气虚为2.31±0.29;对照组为2.51±0.32。问该项临床研究估计需要观察多少病例数?)1/()(//12122kknkiikii式中:n为各组样本所需的例数,σi为各组的总体标准差,μi为各组总体均数,μ=Σμi/k,k为所比较的样本组数,ψ值是由α、β、νi=k-1、ν2=∞查ψ值表。樱桃.gif(7)完全随机设计多样本均数比较的样本量估计樱桃.gifCOMPUTEn=2.17**2*((0.32**2+0.36**2+0.29**2+0.32**2)/4)/(((2.44-2.415)**2+(2.40-2.415)**2+(2.31-2.415)**2+(2.51-2.415)**2)/3).EXECUTE.(7)完全随机设计多样本均数比较的样本量估计樱桃.gif(8)完全随机设计两样本率比较的样本含量估计(当两样本量相等时)例题8:拟研究新研制的抗菌药物对某感染性疾病的治疗效果。经预试验,试验药有效率为80%,对照药有效率为60%。问正式临床试验每组需要观察多少病例(假设采用双侧检验)?221222112221)()1()1()1(2ppppppuppunn单侧:2212221121)()1()1()1(2ppppppuppunn双侧:p1和p2分别为两样本率的估计值,p为两样本合并率。每组需要观察109例患者。樱桃.gifCOMPUTEn=((1.96*SQRT(2*(0.8+0.6)/2*(1-(0.8+0.6)/2)))+(1.282*SQRT(0.8*(1-0.8)+0.6*(1-0.6))))**2/(0.8-0.6)**2.EXECUTE.n=108.27(8)完全随机设计两样本率比较的样本含量估计(当两样本量相等时)樱桃.gif(8)完全随机设计两样本率比较的样本量估计(当两样本量不等时)例题9:拟研究新研制的抗菌药物对某感染性疾病的治疗效果。经预试验,试验药有效率为80%,对照药有效率为60%。问正式临床试验每组需要观察多少病例(假设采用双侧检验)?221222112221)(/)1()1(/1)1(2ppcppppuccppunn单侧:221222112221)(/)1()1(/1)