实验设计(DesigningExperiments)内容提要第一节实验设计的基本要素第二节实验设计的基本原则第三节常用的实验设计方案第四节误差和偏倚第五节样本含量的估算第六节临床试验设计设计实验设计调查设计专业设计统计设计专业设计统计设计第一节实验设计的基本要素实验设计三要素:•受试对象(object)•处理因素(treatment)•实验效应(experimentaleffect)1、受试对象受试对象或称研究对象是处理因素作用的客体,是根据研究目的确定的研究总体。研究目的不同,医学研究的对象可以是人、动物和植物,也可以是某个器官、细胞和血清等生物材料。按试验对象,实验可以分为三类:•动物实验(animalexperiment),其受试对象为动物;•临床试验(clinicaltrial),其受试对象通常为患者;•现场试验(fieldtrial),其受试对象通常为正常人群。•受试对象应作严格的规定,以保证其同质性(homogeneity)和代表性同质性:动物的种类、品系、年龄、性别、体重、窝别和营养状况等。人群的性别、年龄、民族、职业、文化程度和经济状况、病情和病程等。代表性:随机抽样•受试对象应满足两个基本条件:一是对处理因素敏感;二是反应必须稳定。•选择受试对象应明确其纳入标准(inclusioncriteria)和排除标准(exclusioncriteria)。2、处理因素•处理因素或受试因素:根据研究目确定的欲施加或欲观察的、并能引起受试对象直接或间接效应的因素,简称处理或因素(factor)。是根据研究目的确定的主要因素,处理因素在整个实验中应始终要保持不变•非处理因素:与处理因素可能同时存在的能使受试对象产生效应的非研究因素。非处理因素干扰效应与所研究因素间关系的观察与分析,常常又称混杂因素(confounder)。•处理因素种类:生物性、化学性、物理性•处理因素水平:每个因素在数量上或强度上可有不同。单因素单水平:研究某药物对原发性高血压患者的降压作用;单因素多水平:研究某药不同剂量的降血糖作用;多因素单水平:比较不同药物或不同疗法对某病的治疗效果;多因素多水平:临床上探索某肿瘤的联合化疗方案等。3、实验效应实验效应是处理因素作用于受试对象的反应(response)和结局(outcome),它通过观察指标(统计学常将指标称为变量)来体现。观察指标应具有客观性、精确性、特异性和灵敏性。•客观性:客观指标则是借助测量仪器和检验等手段来反映的观察结果,客观指标具有较好的真实性和可靠性。主观指标是受试对象的主观感觉、记忆、陈述或实验者的主观判断结果;而。主观指标具有随意性和偶然性。•精确性:包括准确度(accuracy)和精密度(precision)两层含义。准确度指观察值与真值的接近程度,主要受系统误差的影响;精密度指重复观察时,观察值与其均数的接近程度,其差值属于随机误差。•特异性和灵敏性:某指标的特异度(specificity)反映其鉴别真阴性的能力,灵敏度(sensitivity)则反映其检出真阳性的能力。特异度高的指标不易受混杂因素的干扰;灵敏度高的指标能将处理因素的效应更好地显示出来。4)指标的盲法观察:为消除或最大限度地减少主观偏性,在设计时常采用盲法(blindmethod)。单盲法(singleblindmethod):受试对象不知道自己分在哪一组;双盲法(doubleblindmethod):受试对象和实验执行者均不知道受试对象分在哪一组三盲法(tripleblindmethod):受试对象、实验执行者和统计分析人员三者均不知道受试对象分在哪一组第二节实验设计的基本原则实验设计的基本原则•对照(control)•随机化(randomization)•重复(replication)1、对照原则•目的:显露处理因素的效应;控制混杂因素和偏倚;判断不良反应。•对照的形式:(1)安慰剂对照(placebocontrol)(2)空白对照(blankcontrol)(3)实验对照(experimentalcontrol)(4)自身对照(selfcontrol)(5)标准对照(standardcontrol)2、随机化原则随机化是使每个受试对象都有同等的机会被抽取或分到不同的实验组和对照组。•随机化形式(1)抽样的随机(2)分组的随机(3)实验顺序的随机•完全随机化(1)编号将n个受试对象编号,动物可按体重大小,患者可按就诊顺序。(2)取随机数可从随机数字表或计算器或计算机获得。每个受试对象获得的随机数可是一位数,也可是两位数或三位数,一般要求与n的位数相同。(3)确定组别根据受试对象获得的随机数决定受试对象在哪一组。分两组可按随机数的奇偶;分k组可按随机数除以k后的余数进行分组。例1试将同性别、体重相近的30只动物分到A、B、C三组。先将动物按体重编号,再从本书后面所附随机数字表中任一行如第16行最左开始连续取30个两位数字。最后将这30个两位数字分别除以3,余数0、1、2分别对应于A、B、C三组•分层随机化分层随机化步骤:(1)编号排序将每层的受试对象编号排序,如体重从轻到重,时间由前至后等。(2)取随机数从随机数字表或计算器或计算机获得。每个受试对象可取两位数。(3)确定组别根据每层受试对象获得的随机数的大小顺序决定受试对象在哪一组。对每个处理也可规定顺序,如处理A,B,C,…分别对应于序号1,2,3,…。3、重复原则重复是指在相同实验条件下进行多次研究或多次观察。重复的情形:(1)整个实验的重复(2)用多个受试对象进行重复有足够的样本含量(samplesize),(3)同一受试对象的重复观察重复最主要的作用是估计实验误差。第三节常用的实验设计方案完全随机设计配对设计随机区组设计交叉设计析因设计目标人群随机抽样研究对象试验组对照组随机分配阳性阴性阳性阴性完全随机设计1、设计模式:交叉设计设计模式:阳性阳性甲组(方案A)洗方案B对象阴性脱阴性阳性期阳性乙组(方案B)方案A阴性阴性随机区组设计例3如何按随机区组设计,分配5个区组的15只小白鼠接受甲、乙、丙三种抗癌药物?方法为先将小白鼠的体重从轻到重编号,体重相近的3只小白鼠配成一个区组,见表4-6。在随机数字表(附表15)中任选一行一列开始的2位数作为1个随机数,如从第8行第3列开始纪录,见表4-6;在每个区组内将随机数按大小排序;各区组中内序号为1的接受甲药、序号为2的接受乙药、序号为3的接受丙药,5个区组小白鼠按随机区组设计分配结果区组号12345小白鼠123456789101112131415随机数683526009953936128527005483456序号321132321231213分配结果丙乙甲甲丙乙丙乙甲乙丙甲乙甲丙川芎嗪对新生大鼠缺氧缺血性脑损伤的保护作用实例:通过对各实验组动物脑组织MDA、SOD、NO生化指标的比较,进一步阐明氧自由基及NO损伤在新生儿HIE的发病机制中的重要作用及川芎嗪抗新生儿HIE的作用机制。江西医学院实验动物部提供7日龄SD新生大鼠,雌雄各半。数量共40只研究目标研究对象研究目标和研究对象对照及分组情况按随机区组设计如下:假手术组、HI组、川芎嗪Ⅰ组和川芎嗪Ⅱ组共四组,每窝4只鼠为一区组,共10窝,每窝随机分配至各处理组。分组假手术组HI组川芎嗪Ⅰ组川芎嗪Ⅱ组为对照组。只切开皮肤游离左颈总动脉,不进行缺氧处理。于缺氧前30分钟腹腔注射等量生理盐水。假手术组HI组结扎左颈总动脉,并缺氧2小时。于缺氧前30分钟腹腔注射等量生理盐水。川芎嗪Ⅰ组:结扎左颈总动脉,并缺氧2小时。于缺氧前30分钟腹腔注射川芎嗪注射液100mg/Kg。川芎嗪Ⅱ组于HI后即刻腹腔注射川芎嗪注射液100mg/Kg。采用随机区组实验设计方差分析及X2检验统计分析方法第四节误差和偏倚误差(error)误差的概念及分类误差(error)泛指实测值与真值之差随机误差非随机误差非系统误差系统误差误差的分类偏倚(bias)四、误差和偏倚偏倚偏倚的概念及种类在实验过程中由于某些非实验因素的干扰所形成的系统误差。种类选择性偏倚(selectionbias)测量性偏倚(measurementbias)混杂性偏倚(confoundingbias)选择性偏倚选择性偏倚的概念及其防止措施由于纳入观察对象的方法不正确而产生的偏倚。防止措施正确拟定观察对象的纳入和排除标准采用分层抽样的方法正确设立对照组贯彻随机化原则测量性偏倚的概念测量性偏倚在实验过程中对研究对象进行观察或测量而造成的偏倚。导致测量性偏倚常见因素依从(compliance)和非依从(noncompliance)常见因素沾染(contamination):使差异缩小干扰(co-intervention):使差异扩大失访:失访率<20%检查结果和诊断结果的不一致(disagreement)可采用Kappa检验进行一致性判断观察记录的失误规定记录的方式、时间、记录本、记录人员、定期检查可避免心理因素的干扰测量性偏倚的防止措施单盲法双盲法三盲法防止措施盲法(blindmethod)签订实验合同检查实验对象的依从性情况注意医德定期检查研究记录提高诊断一致性严格实验设计和实验操作混杂性偏倚的概念及其防止与控制措施混杂性偏倚在总结分析阶段,由于某些非实验因素与实验因素同时并存的作用影响到观察结果,造成混杂性偏倚防止与控制措施严格实验设计,精选研究对象贯彻随机原则分层分析多因素分析第五节样本含量的估计•影响样本含量估计的因素1.第一类错误概率的大小。越小所需样本含量愈多,2.检验功效(1)或第二类错误概率的大小检验功效愈大,第二类错误的概率愈小,所需样本含量愈多。3.容许误差容许误差愈大,所需样本含量愈小。4.总体标准差或总体概率反映资料的变异度。愈大,所需样本含量自然愈多。总体概率越近于0.50,则所需样本含量愈多。•样本含量估计的方法样本含量的估计方法:查表法:查有关样本含量表,计算法:根据假设检验的公式反推。①样本均数与总体均数比较(或配对比较)2suuu例:用某药治疗矽肺患者,估计可增加尿的排出量,标准差89.0mmol/L,要求以α=0.05,β=0.10的概率,能够辨别出尿的排出量平均增加35.6mmol/L,需观察多少例矽肺患者?本例:δ=35.6;S=89.0;单侧α=0.05,β=0.10,282.1,645.11.005.0单单uu。代入上式5455.536.350.89282.1645.122suun约需治疗54例矽肺患者。(本例也可查表求样本含量)nuucunubuuna2222、估计总体参数的差异、估计检验效能、估计最低样本含量②两样本均数比较A、两样本含量相等例:A、B两种处理的动物冠状静脉血流量实验,A处理平均增加血流量1.8ml/min,B处理平均增加血流量2.4ml/min,已知两处理标准差相等,均为1.0ml/min,α=0.05β=0.10,要得出两处理有差别的结论,需观察多少实验动物?例:δ=1;双侧α=0.05,β=0.10,282.1,960.1,6.08.14.210.005.0单uu11778.116061282.1960.12222suun两组会计所需样本117例,每组约需动物59例。(本例也可查表求样本含量)B、两样本含量不等nQQuuunnUQQnuQQuuuuQQn121121211112112221211211Q1和Q2为样本比例(sample,paction),当样本比例不等时,Q1+Q2=1;当两样本例数相等时Q1+Q2=0.5,4221211QQ。例、用新药降低高血脂患者的胆固醇,研究者规