临床试验样本含量的估算方法柴倩云北京中医药大学循证医学中心1概述公式计算及练习查表计算及练习软件计算方法举例2理论上,验证某一干预措施与对照之间的差异,样本量越大,试验结果越接近于真实值,即结果越可靠。大样本试验还有助于探讨亚组疗效,发现罕见结局。临床试验报告中有无预先的样本量估计是评价试验质量的重要依据之一。3试验样本量过小,无论试验结果是否存在差异,均不能排除因机遇(随机误差)造成的假阳性或假阴性错误。样本量过少:结果不稳定,检验效能过低,结论缺乏充分依据。样本量过大:增加临床研究难度,造成人力、无力、时间和经济上的浪费,伦理问题,一些临床意义不大的微弱疗效最终也可能会出现统计学上的显著差异。4样本含量估算就是在保证科研结论具有一定可靠性条件下,确定的最少观察例数。5公式计算法查表法软件计算法6试验干预与对照干预效应差异的大小需要研究者根据该药物前期的临床研究和临床的实际意义决定。对试验精度的要求把握度(power)检验效能:指两总体确实有差别,按照α水准能发现它们有差别的能力,用1-β表示其概率大小。试验对象的依从性估计试验中病人退出的比例,按照国际惯例,当试验病例退出或释放超过病例总数的20%,试验结果将不可靠。7人群A人群B8人群A人群B患病健康AB9人群A人群B患病健康AB???10计算机模拟举例假设:-试验组死亡率为20%-对照组死亡率为50%-试验组和对照组的样本量均为n=50-显著性水平为双侧0.05-检验方法=卡方检验结果:16次试验(100次)中未能显示出显著性差异84次试验显示有显著性差异1次试验成功率为84%-power11计算机模拟举例假设:-试验组死亡率为20%-对照组死亡率为50%-试验组和对照组的样本量均为n=100-显著性水平为双侧0.05-检验方法=卡方检验结果:1次试验(100次)中未能显示出显著性差异99次试验显示有显著性差异1次试验成功率为99%-power12比较90%和80%的事件发生率,是否有显著性差异?不仅看率,例数也起关键作用有效率(AVSB)每组Np值9vs.8100.5345vs.40500.1690vs.801000.048P:在试验组与对照组事件发生率相差10%的情况下,犯假阳性错误的概率13组间出现统计学上显著性差异组间存在的真实差异有无有正确(1-β)I类错误(α)无II类错误(β)正确(1-α)I类错误的概率:单侧为α,双侧为α/2,α越小所需样本越大,一般取α≤0.05;检验效能:1-β,指H1正确的能力,信心!!β为II类错误,一般β=0.1或β=0.2,β越大,检验效能越低,样本数量也越小;14数值变量资料的样本含量估计无序分类资料的样本含量估计有序分类资料的样本含量估计等效性检验的样本含量估计非劣效性检验的样本含量估计其他设计的样本含量估计(诊断性试验,危险因素,多元回归,多因素分析,重复测量,生存分析等)15估计总体样本与总体比较配对资料两样本比较多样本比较16计数(定性)指标死亡与存活,阳性与阴性,正常与异常计量(定量)指标血压、血糖、血清酶结局指标有多个时,估计样本含量时需要选择其中最重要的结局指标。或按照所需样本量最多的指标。17优效性检验:反应试验药效果优于对照药物(安慰剂,阳性药)的试验,常用单侧检验;等效性检验:确认2种或多种治疗的效果差别大小在临床上并无重要意义,试验药与阳性药在疗效上相当,常用双侧检验;非劣效性检验:显示试验药的疗效在临床上不劣于阳性对照药,常用单侧检验。由少到多:安慰剂对照优效试验非劣效性试验等效性试验阳性对照优效试验。18可满足多种设计的要求,目前应用广泛。192.1.1总体均数的估计详解:σ为总体标准差,一般用样本标准差表示;δ为容许误差,即样本均数与总体均数间的容许差值;α取双侧,u值可以查表。222un单侧α0.400.300.200.100.050.0250.010.005双侧α/20.800.600.400.200.100.050.020.01β0.400.300.200.100.050.0250.010.0051-β0.600.700.800.900.950.9750.990.995u值0.25320.52430.84171.28161.64491.9602.32632.575820例1:某医院拟用抽样调查评价本地区健康成人白细胞数的水平,要求误差不超过0.2*109/L。根据文献报告,健康成人的白细胞数的标准差约1.5*109/L。问需要调查多少人(双侧α=0.05)222un单侧α0.400.300.200.100.050.0250.010.005双侧α/20.800.600.400.200.100.050.020.01β0.400.300.200.100.050.0250.010.0051-β0.600.700.800.900.950.9750.990.995u值0.25320.52430.84171.28161.64491.9602.32632.5758n=(1.96)2(1.5)2/(0.2)2=216.1≈217212.1.2样本均数与总体均数比较例2:某院普查市区2-6岁幼儿体格发育情况,其中体重未达标的幼儿,血红蛋白平均为100g/L,标准差25g/L。现欲使用抗贫血药物,如果治疗前后血红蛋白上升10g/L为有效。设单侧α=0.05,β=0.1时,试问应治疗多少人,可以认为该药是有效的?222uun单侧α0.400.300.200.100.050.0250.010.005双侧α/20.800.600.400.200.100.050.020.01β0.400.300.200.100.050.0250.010.0051-β0.600.700.800.900.950.9750.990.995u值0.25320.52430.84171.28161.64491.9602.32632.5758n=(1.6449+1.2816)2(25)2/(10)2=53.522222duun例3:某医师拟用新药治疗矽肺患者,预实验尿矽排出量平均比治疗前增加15mg/L,标准差为25mg/L,问需要观察多少患者可以认为该药有效(单侧α=0.05,β=0.10)n=(1.6449+1.2816)2(25)2/(15)2=23.823222/11knuu解析:①式中整体方差σ2可用样本方差S2估计,②差值③试验组样本量为n,对照组样本含量为kn,当k=1时两组样本含量相等。)/11/()(222kkssscexxce24例4:某一项研究吲达帕胺治疗原发性高血压的治疗,经预试验得治疗前后舒张压差值(mmHg)资料如下(与安慰剂比较,两药治疗前后差异均有显著性差异),当α=0.05,β=0.10时需要治疗多少例可以认为吲达帕胺有效?均数标准差吲达帕胺17.1()8.175()安慰剂9.9()3()xexcsesc222/11knuu)/11/()(222kkssce25设k=0.7n=20kn=142.2.1估计总体率(抽样)当目标事件发生率为0.2-0.8(0.3-0.7)时,用下列公式:P为总体率,δ为允许误差,即允许样本率和总体率的最大容许误差为多少。221ppuN26例5:某口腔医院研究青少年龋齿发病情况,拟了解某市青少年龋齿患病情况,期望误差在平均患龋齿率30%的1/6范围内,当α=0.05,问需要抽样调查多少人?U0.05=1.96P=0.3Δ=0.3/6=0.05221ppuNn=(1.96)2(0.30)(1-0.30)/(0.05)2=322.727当目标事件发生率为0.2-0.8(0.3-0.7)时,用下列公式:例6:某医师研究药物对产后宫缩、外阴创伤的镇痛效果,若新药比公认稳定有效的老药物(镇痛率55%)高于20%,可说明新药优于标准药物,需治疗多少例数?(设α=0.05,β=0.20)查表u0.05=1.6449,u0.02=0.8417221)(PPuuN答案:38.3≈3928p1,p2分别为甲、乙两法阳性率,p为甲、乙两法一致性阳性率,甲法乙法+-P1+PP1-P-P2-PP212/)2(21pppp2121/))((22ppPPpPpuPuN29例7:某医师观察甲药是否比乙药治疗过敏性鼻炎更有效,采用配对双盲设计,预试验甲药有效率为60%,乙药有效率为50%,两药一致性阳性率为43%,试估算两药疗效差别有统计学意义时样本含量。设u0.05=1.96,u0.1=1.28162121/))((22ppPPpPpuPuN2/)2(21pppp本设计至少需要观察235例30例8:某医师研究某药对产后宫缩痛、外阴创伤痛效果,预试验旧药镇痛率为55%,新药镇痛率为75%,当α=0.05,β=0.1时需要观察多少例能说明新药镇痛效果优于旧药?22)1(/11ppppkuuNcekpkppce1N=111.4≈112(k=0.75)31两样本比较的秩和检验估算公式:N=n1+n2C=n1/n例9:某肿瘤研究室初步观察不典型增生与原位癌患者阴道涂片,按巴氏细胞学分级的检查结果,不典型增生患者IV级及V级占6.6%,原位癌患者IV级及V级占72.0%。当α=0.05,β=0.10时需要观察多少例,可认为原位癌患者级别高于不典型增生者?u0.05=1.6449u0.10=1.2816c=0.5P”=0.720-0.066N=(1.6449+1.2816)2/[12*0.5*(1-0.5)(06454-0.5)2]=120.4各组需要至少61例2)5.0)(1(12)(2pccuun3233当要求平均有80%、90%以上的机会能得出相差显著或非常显著时,计算公式比较复杂,数理统计上已编制成工具表,一查便得。总体均数,总体率配对比较,两样本均数比较(t检验)两样本率比较时所需样本含量非配对病例-对照34例1:某医院拟用抽样调查评价本地区健康成人白细胞数的水平,要求误差不超过0.2*109/L。根据文献报告,健康成人的白细胞数的标准差约1.5*109/L。问需要调查多少人(双侧α=0.05)222un单侧α0.400.300.200.100.050.0250.010.005双侧α/20.800.600.400.200.100.050.020.01β0.400.300.200.100.050.0250.010.0051-β0.600.700.800.900.950.9750.990.995u值0.25320.52430.84171.28161.64491.9602.32632.5758n=(1.96)2(1.5)2/(0.2)2=216.1≈21735简单、方便,但受条件限制,有时不一定完全适应。1.5/0.2=7.536nQueryAdvisorSamplePowerSASAPASS(例1,例8,病例对照,随机多组)SAS37例1:某医院拟用抽样调查评价本地区健康成人白细胞数的水平,要求误差不超过0.2*109/L。根据文献报告,健康成人的白细胞数的标准差约1.5*109/L。问需要调查多少人(双侧α=0.05)222un单侧α0.400.300.200.100.050.0250.010.005双侧α/20.800.600.400.200.100.050.020.01β0.400.300.200.100.050.0250.010.0051-β0.600.700.800.900.950.9750.990.995u值0.25320