实验设计(experimentaldesign)原理及基本原则魏敏杰、阮强、罗阳、孟繁浩、富伟能、王振宁、陈磊中国医科大学实验的基本要素处理因素受试对象实验效应处理因素的性质化学:药物、毒物、激素、营养素等有机和无机的化学物质;物理:电、磁、射线、温度、湿度、乏氧等;生物:细菌、真菌、病毒、寄生虫等;其他:本体因素。处理因素的数目和水平单因素设计:每次实验只观察1个因素的效应。优点:目标明确,简单易行,条件容易控制,结果一目了然。缺点:每次解决的问题少,如果有多种因素等待实验,则进度慢。单因素多水平设计:处理因素只有1个,但可从几个水平进行观察。“水平”是指同一因素在量上的不同程度。如药物剂量有高、中、低。单因素多水平的设计也可看成是多因素设计。多因素设计:在一次实验中同时观察几种因素的效应。处理因素的强度量的概念如剂量的大小,射线的强弱,温度的高低等。处理因素的强度应适宜,过强则伤害受试对象,过弱则观察不出应有的效应。处理因素的标准化要保证在整个实验过程中处理因素始终如一,保持不变。受试对象(studysubjects)指处理因素所作用的对象。亦称实验对象、研究对象或观察对象。受试对象的标准化动物:用国际上承认的种属、品系。窝别、体重、龄期等。人:种族、地域、性别、年龄等自然条件,应考虑社会因素(如职业、爱好、生活习惯、经济条件、居住环境、家庭状况、心理状态)。离体器官、组织、细胞:采样部位、采取条件、新鲜程度、保存方式、培养方式等。病理模型:要考虑病理的强度,病理模型的病情不宜过重,病程不宜过长。受试对象的例数要有一定的例数才能说明问题资料的性质:计数资料30~100例,计量资料10~20例。实验效应(experimentaleffect)处理因素作用于受试对象后出现以某种指标形式表示的效应。以计数指标表达的资料为计数资料,大多以研究对象中出现或不出现某一属性的“率”或“比”来表达,故又称定性资料,以计量指标表达的资料为计量资料,计量资料比计数资料精确,多次重复测量所得结果变异较小,可得出较精确可靠的结论,由于较精确、误差小,故所需样本数量和观察次数较少。选择指标的原则:有效、合理、勿滥、客观。指标应具备的条件:(1)关联性:与研究目的有本质的联系,能确切的反映处理因素的效应。即有效性。(2)灵敏性:能敏感的反映效应。(3)稳定性:一致性要好,变异大的指标测试结果不可能正确,也不具有可重复性。(4)特异性是指指标的专一性,只对某种或某几种处理因素产生效应反应。特异性越强越能揭示事物的本质。(5)精确性即精确度。二种含义:一是指标本身的精确度,二是所用仪器设备的精确度。(6)可行性是否具备测试所选指标的条件和设备。一.对照原则1.对照的意义通过对照鉴别处理因素与非处理因素的差异消除和减少实验误差。2.对照种类:(1)空白对照:对照组不加任何处理。(2)实验对照:对照组施加与试验组等同的非处理因素。实验设计基本原则(3)标准对照:对照组用公认的标准方法处理作为标准对照组。(4)自身对照:对照与试验在同一受试对象身上进行(部位,先后)。(5)相互对照:不设空白对照及标准对照,而是几个实验组互相比较。(6)其它:历史对照、配对对照、克隆对照等。二、均衡原则1.均衡(balance)的意义指实验组与对照组在非处理因素方面尽可能一致。越均衡一致其可比性越好,就越能显示出实验的处理因素的作用,从而减少非处理因素对实验结果的影响。如动物的种属、品系、窝别、性别、年龄、体重等保持基本一致;临床上病人的病种、病期、病型、性别、年龄等保持一致。组内的非处理因素条件不一定一致但组间的非处理因素必须一致。2.均衡化方法:⑴交叉均衡:是在实验单元中各设立实验组和对照组,以使两组的非处理因素均衡一致。如,实验某一新药预防肠道传染病的效果观察的实验设计:不均衡方法:甲幼儿园100名→服新药→发病率下降乙幼儿园100名→不服新药→发病率上升⑵分层均衡:用分层方法使各处理中的非处理因素得到均衡。它是将非处理因素按不同水平分为若干单位组,然后在每个单位组内安排处理因素。例:4种处理后8名受试者的皮肤温度变化实验的设计:第一种方案:每天一种处理的设计实验天数受试者数处理因素d18Ad28Bd38Cd48D第二种方案:每天4种处理的设计处理因素ABCDd12222d22222d32222d42222实验天数三、随机原则1.随机的意义随机(random)是指没有主观成见地将每个研究对象安排到某个试验单位中去,使每个受试对象接受处理的机会完全相等。随机是保证实验中非处理因素均衡一致的又一重要手段,同时也是数据处理、统计推断和假设检验同的前提。随机原则通过随机可以克服研究者的主观随意性、主观意识及受试对象个体差异性对实验研究的影响。大样本可完全用随机化法分组,小样本采用人为加随机法分组。2随机化(randomization)方法:模球法或抽签法:随机数字表法:是实验研究中广泛采用的方法,按随机数表某段连续出现的数字与事先将受试对象的编号对应分组。(在Excel中可利用随机数字发生器生成任意随机数字表,RAND()*(b-a)+a)3.分组方法⑴配对设计将实验对象按其相似的性质或条件进行配对,然后将每对中的两个实验对象分别随机分配给实验组与对照组。配对形式可分为:同源配对同源性质较高。非同源配对同源性质较低。⑵分层设计要研究某一现象在一个总体的不同层次之间存在的差别。是多因素的比较。如“小细胞癌治疗的观察”的病例可分成年龄、肿瘤大小、病程3个层次:A-40岁以上a-40岁以下B-大瘤b-小瘤C-6个月以上c-6个月以下这3个层次即3个因素,每个因素均2个水平,可组成8个小群,见表:对子号分层对子号分层1ABC5aBC2Abc6aBc3AbC7abC4Abc8abc区组形成的原则基本与配对的要求相同,尽量将多方面条件相同或相近的个体放在一起,形成一个个“组内一致”或“基本一致”的区组。在动物实验中,常将同窝别、同年龄、同性别、体重相近的几个动物作为一个区组,再将区组内的个体随机分配到个处理中去。四、重复原则在试验中,同一处理设置的试验单位数,称为重复(replication)。重复是消除非处理因素影响的又一重要手段。设置重复的最主要作用是估计试验误差,另一主要作用是降低误差(标准误与重复次数平方根成反比)。为克服个体差异、操作误差及各种偶然因素的影响,实验必须有足够的重复。五、其它组间比较设计单因素多水平设计:处理因素只有1个,但可从几个水平进行观察。“水平”是指同一因素在量上的不同程度。如药物的剂量有高、中、低。多因素设计:在一次实验中同时观察几种因素的效应。各组例数应尽量相等,并应科学地合理地设计对照组。单因素多水平例:研究一新药(单因素)的药效,需将该药分成高、中、低三个剂量(多水平),再设一个实验对照组,一个阳性药对照组,共5个实验组。用大白鼠50只,按窝别、年龄、性别、体重分成若干个区组,每个处理组的动物定为10只,按随机表法或随机加人为法将各区组内的动物分配到个处理组中。性别体重(g)数量对照组阳性药对照低剂量组中剂量组高剂量组第五节临床试验设计临床试验设计(clinicaltrialdesign)是以人类作为受试对象所进行的试验设计,是按科学的实验方法研究疾病临床阶段的规律的试验。包括一般疾病的病因或机理,寻找早期诊断指标,判断疾病的临床分型,研究影响疗效的因素及疗法的对比等。临床设计除应遵守实验设计的基本原则和方法外,在病例选择、设立对照、疗效选择方面,避免实验偏倚及效果评价等方面均有其特点。因为:①研究的对象是人,人权、人道;②个体差(生物学变异、社会和心理因素;③实验例数受限制;④受试对象中途停止;⑤观察时间不易保证同时;⑥标准化较难保证等。实验设计中要注意:1.病例选择最基本的要求是诊断必须明确,制定统一的诊断标准。标准化。依从性:志愿配合试验,严格遵从试验的各项要求。有可能发生防碍试验进行情况者不宜入选。2.设立正确的对照非处理因素较动物实验多。常用的对照形式:历史对照,随机同期对照,安慰剂对照,标准治疗对照。3.效应指标的选择尽量能客观衡量的指标。4.防止试验偏倚偏倚(bias)是在研究组间变量差异时产生的一种系统误差。是对真实情况的偏离。病人的心理、研究者的主观意识等。(1)临床试验中常见的偏倚选择性偏倚产生于实验设计阶段,主要由于选择受试对象的方法不正确所造成。信息偏移(informationbias)产生于研究的实施阶段,在资料的观察、测量及收集方法上,诊断试验的灵敏度、特异度,以及患者提供各种有关信息的准确性方面都可能有不足。常见有:①暴露怀疑偏移;②诊断怀疑偏移;③测量偏移;④回忆偏移;⑤报告偏移;⑥归类错误偏移(错误分类偏移);⑦诱导偏移。混杂性偏倚在评价被研究因素和疾病的关系时,如果存在外来因素,该外来因素与该病及研究因素均有关系,使得资料中研究因素的效应与外来因素的效应混杂在一起,产生混杂性偏倚。从而全部或部分掩盖或夸大研究因素和疾病之间的真实联系。是一种系统误差,可发生在试验的设计阶段,常常不易被识别,但在资料分析阶段可以用统计学方法加以清除。(2)偏倚的防止和处理临床试验设计必须严格合理坚持随机化分组盲法试验有单盲、双盲和三盲。限制在选择试验对象时,限制在具有一定特征的对象中进行观察,以排除其他因素的干扰。配对为病例的每一个研究对象匹配一个或几个具有同样特征的对照,然后进行比较。配对常能消除某些潜在的混杂性偏倚。标准化标准化率的计算方法有直接法、间接法和反推法。多变量分析目前多采用Logistic回归模型进行多变量分析。调查研究设计调查研究方法广泛应用于预防医学、临床医学及基础医学领域。一.常用的调查1.居民健康状况调查是评价居民健康水平和实行防治措施的主要依据。这种调查包括人口构成、死亡率、死因构成、平均寿命、患病率、身体发育等指标。2.流行病学调查是认识疾病的流行现象和流行规律的重要方法,包括疫源地调查、爆发流行调查、流行病学侦察、预防接种效果调查等。3.病因学调查是探索病因的一个重要手段,可为深入研究病因学作出定向性依据。包括二个方面:一是疾病分布与构成的调查,如患者的姓别、年龄、职业等;二是疾病与各种因素如气候、水质、营养、生活习惯、地理环境等之间的关系。4.临床中、远期疗效随访调查是对某些慢性病疗效观察或某种新的治疗方法观察其中期和远期治疗效果的重要方法。因为从门诊和病房获得的第一手资料是近期疗效资料,近期的疗效不能代表中或远期的疗效。5.卫生学调查现场调查在卫生学的研究方法中有着重要的地位,如城市大气污染的调查、水质情况的调查、车间毒害对工人健康的影响等。这些调查不仅为深入研究各种问题提供宝贵的资料,还可以对预防工作提出具体而有效的措施性意见。尚有生理正常值的测定,寄生虫病、结核病和地方病现状及流行规律和防治效果调查等等也都广泛采用调查方法。调查的主要特点:样本大,应答率低,产生系统误差的机会多。二.调查设计的内容调查设计包括资料收集、整理分析设计等。1.调查目的要解决的核心问题.大致可归纳为二类:①为了了解总体情况;②为了探索某病与其他事物间的关系。要把调查目的具体化到指标。2.调查对象调查对象是指要研究的对象的总体,即同质的许多个体的总称。3.调查范围空间范围、时间范围、数量范围。要事前明确调查哪一个地区的事物,调查什么时间的现象,观察多少个例数。4.观察单位是指调查对象的各个单位(个体),可以是人、户、病例等。5.调查项目根据计算指标所需各项统计数字,提出需从每个被调查者方面获得的问题答案(表示调查对象的每个个体特征的标志,并在调查中能取得结果的)则为调查项目。由调查目的所需要的调查内容来决定。包括:分析项目和备查项目。6.调查表格把调查项目按提问题的逻辑顺序组织到表内,供被调查者使用。调查表的基本形式可分为一览表式和卡片式。调查表的内容一般分为三