简单随机化、中心分层区组随机化和最小化法的均衡性比较•随机对照临床试验(RCT)既是一种临床研究的最佳方法,也是评判一个临床研究的金标准•在临床研究中,除了要研究的处理因素外,往往还存在很多非处理因素,其中一些非处理因素会影响到研究结果的判定,因此必须对这些影响结果的重要的非处理因素进行均衡,使其在处理组间的分布一致,消除其对研究结果的影响•随机化和对照是常用的均衡非处理因素的两个手段•设置对照的主要目的是使处理组和对照组具有可比性,以便分离出处理因素的效应。•而随机化的主要目的是使各种已知或未知的影响因素在处理组间保持均衡,减少选择偏倚,同时为统计推断提供理论基础。如何选择正确合适的随机化方法呢?•首先要符合设计方案的要求,其次还要了解各种随机化方法的特点。均衡性是我们在评价一个随机分组方法时常常要考察的。•在统计学上各比较组的样本例数完全相等时检验效率是最高的,但均衡的含义除了这种组间总例数的均衡外还包含影响研究结果的重要的非处理因素在比较组间分布一致,即非处理因素组间分布均衡。•本研究采用MonteCarlo模拟方法对临床研究中常用的简单随机化、中心分层区组随机化和动态随机化中最小化法的均衡性进行比较,以期为临床研究选用合适的随机化方法提供参考。简单随机化•简单随机化是指靠掷硬币或随机数字表,或用计算机产生伪随机数来进行随机化,不加任何限制和干预•若有两个处理组,其分配到任一组的概率π为0.5。简单随机化即最简单的随机化方法,样本量少时容易出现组间不均衡的情况。分层和区组随机化•分层和区组随机化是在简单随机化的基础上进行了一定的改进,区组随机化可改善组间不均衡性,而分层随机化可保证分组结束后分层因素在组间分布的均衡性。动态随机化(dynamicrandomization)•临床试验的过程中每例病人分到各组的概率不是固定不变的,而是根据一定的条件进行调整的方法,它能有效地保证各试验组间例数和某些重要的非处理因素接近一致。•动态随机化包括瓮(urn)法、偏币(biasedcoin)法、最小化(minimization)法等。最小化法在临床研究中应用较多。最小化法•最小化法最初由Taves[2]提出,后Pocock和Simon对其做了改进。•基本原理是在分组过程中,每增加一个新受试者都计算一下各组影响因素分布的不均衡性,然后以不同的概率决定该受试者的组别,以保证影响因素分布的不均衡性达到最小•最小化法主要从以下三个方面来确定新病例的分组:①影响因素在各组间的差别;②各治疗组已有病例数;③新病例分配到目标组的概率P。•在随机化分组过程中,第一例受试者使用完全随机化分组,随后入组的受试者采用最小化法。组间不均衡性的大小一般采用全距或方差来衡量。•分层随机只适合于有2~3个分层因素时,而当分层因素较多时容易出现不均衡的情况。有文献报道,通常受试对象在100~200例之间,有2~3个分层因素,每个因素仅有2个水平时,应用分层随机化较恰当•当分层因素较多时各层所含的例数会变少,容易出现各组分层因素分布和组间例数的不均衡,影响分析结果。•在实际的临床试验中将中心作为分层因素的中心分层区组随机化应用更为普遍,可保证试验结束时各中心例数接近。•那么对于影响结果较大的多个非处理因素的临床研究来说,采用中心分层区组随机后各非处理因素的分布是否能保持均衡呢?•此外,随着中心随机化系统的出现,动态随机化在临床研究中的应用越来越多•国外一些模拟试验表明,在病人例数为100,影响因素为12个时,最小化法仍可保持组间影响因素和例数均衡•在国外,最小化法已开始应用于实际研究并被誉为临床试验的“白金标准”。方法与步骤•参数设置:研究主要探讨两个处理组时各随机化方法的均衡情况,分层区组随机化以中心作为分层因素,然后在每个中心内部进行区组随机化。•最小化法中衡量两组均衡的指标采用极差,分配概率设为1,即总是将受试者分配到使不均衡性减少到最小的那组。•本研究分析了6个非处理因素(均为2水平)时三种方法的均衡情况。•模拟方法和比较指标:采用MonteCarlo方法进行模拟研究,模拟次数为1000次。从组间均衡性和非处理因素的均衡性两个方面来比较三种方法的均衡效果。•组间均衡性通过两组总例数的绝对差值来衡量,同时计算其均数、第5及第95百分位数;•非处理因素的均衡情况通过6个非处理因素与组别的列联表的卡方检验的P值来衡量,P值越大说明均衡性越好。为了更有代表性,本研究采用6个非处理因素中最小的卡方检验的P值作为衡量非处理因素均衡性的综合指标,并同时计算这个最小P值的第1、第5、第95和第100百分位数。模拟过程•本研究模拟了三种随机分组方法在非处理因素为6个,两组总样本量分别为60、100、200、500、1000时的组间均衡性及非处理因素的均衡情况。•先利用均匀分布的随机数模拟产生不同样本量时每例受试者各非处理因素(x1-x6)的水平,然后分别采用三种方法进行随机分组•计算分组后两组总例数的绝对差值及6个非处理因素与组别的列联表的卡方检验中的最小P值。上述过程重复1000次,最后计算1000次模拟中两组总例数绝对差值的均数、第5和第95百分位数及最小P值的第1、第5、第95和第100百分位数。模拟结果•组间均衡性模拟结果:由于区组的作用,中心分层区组随机化的组间均衡性最好,可保证分组后两组绝对差值为0,即各组例数相等。最小化法的组间均衡性与中心分层区组随机化方法接近,不同样本量时最小化法分组后组间最大例数差别为2例。与上述两种方法相比,简单随机化的组间均衡性最差。样本量为60时两组组间例数的最大差别为24(即两组例数为42∶18)。•两组间非处理因素均衡性模拟结果:因为考虑到样本量小分层因素多时,可能会出现理论频数小于1的情况,因此P值全部采用确切概率法计算得到。模拟结果如下:最小化法分组后的组间非处理因素的均衡性要明显优于简单随机化和中心分层区组随机化。由模拟结果可知,当有6个非处理因素时,无论样本量为多大,最小化法分组后的6个非处理因素中均衡性卡方检验最小P值的均数均保持在0.70以上,即使是最小P值的第1百分位数仍远远大于完全随机化和中心分层区组随机化的最小P值的第5百分位数。•中心分层区组随机化的非处理因素的组间均衡性与简单随机化接近,并没有显著提高,说明中心分层区组随机化在保证组间非处理因素均衡上效果并不明显,其第5百分位数(P5)均在0.01附近,远远小于0.05。•结合组间均衡性比较的结果可知,中心分层区组随机化由于进行了区组和中心分层进而保证了组间和中心间例数均衡,但由于对非处理因素未做任何限制因而在保证组间非处理因素均衡性上与简单随机化接近,并无理想的效果。讨论•McEntegart建议,在选择临床试验分组方法时应考虑均衡性(balance)、预测性(predictability)和效能(power)三个变量。而均衡性的好坏又可以影响统计分析时的效能,因此,好的均衡性是一个随机分组方法应具备的基本条件。•均衡的含义除了组间总例数的均衡外还包含影响研究结果的重要的非处理因素在比较组间分布一致即非处理因素组间分布均衡。但Pocock和Simon指出,组间例数不均衡导致的检验效能降低不会对试验造成大的偏离,而重要的预后因素的重度不均衡则会带来严重的后果•例如,乳腺癌化疗的临床试验中患者有无肝转移是一个非常重要的预后因素,如果肝转移病例在其中一组的分布要多于另外一组,那么就会导致研究结果的严重偏倚。•这种偏倚虽然可以在分析阶段通过分层分析或协方差分析解决,但通过这种方式可以解决的变量是有限的,而且是有代价的,会损失检验的灵敏度或特异度,尤其当预后因素的严重不平衡导致与治疗效应的混杂时,这种代价就更大了。因此,均衡性是我们在选择随机化方法时要考虑的首要问题。•在上述三种随机化分组方法中,最小化法的均衡性是最好的,尤其适用于一些样本量不可能很大而基线的某些非处理因素对治疗效果影响较大的临床试验。如在抗癌药物的临床试验中,疾病分期、病理分型、年龄等因素对治疗效果的影响很大,这时用简单随机化或中心分层区组随机化很难保证各组的例数和影响因素的组间分布相接近。•最小化法的预测性虽然要高于其他方法,但大多数学者认为在多中心临床试验中,最小化的分配概率等于1是可以接受的。而检验效能问题,国外一些模拟试验已经证明最小化法分组并不会降低检验效能。