医学中的实验设计与数据处理摘要:实验是一切自然学科的基础。实验设计与数据处理在医学中更是发挥着不可估量的作用。通过科学合理的实验设计过程加上严谨规范的数据处理方法,可以使医学中更多的生理机制被探索发现,使更多的药物疗法被发明应用,从而更好地拯救患者,造福人类。关键词:医学实验,实验设计,数据处理实验是自然学科的基础,任何自然科学都离不开实验。科学界中大多数的公式定理都是由实验反复验证而推导出来的,只有经得起实验验证的定理定律才具有普遍实用性。而科学的实验设计是利用已有的专业学科知识,以大量的实践经验为基础而得出的既能减少实验次数,又能缩短试验周期,从而迅速找到优化方案的一种科学计算方法。这就必然涉及到实验的数据处理,也只有对实验得出的数据作出科学合理的处理,才能使实验结果更具说服力。实验设计方法最早应用于农业、生物学、遗传学方面。早在20世纪中期,就有一些欧美国家将实验设计应用于工业生产,以达到减少成本而获取最大利益的目的。随着时间的推移,实验设计越来越受到人们的重视,也开始在各个领域开始广泛的应用。医学是一门将科学和生活紧密结合的学科,因此医学中的实验设计显得尤为的重要。科学的实验设计不仅能起到节约时间,节约成本的作用,还能使分析更具普遍适用性,或减少药物风险,或增强药物疗效,更加福泽患者。1常见的医学实验设计类型医学实验设计类型有几十种,其中常见的有:配对设计、成组设计、单因素K水平设计(K≥3)、配伍组设计、拉丁方设计、交叉设计、析因设计、正交设计和具有重复测量的设计。从是否便于考察因素之间交互作用的角度看,前六种设计都不便考察交互作用,后三种设计是可以考察交互作用的。从同时考察因素的个数多少角度看,前三种设计都属于单因素设计,配伍组设计属于二因素设计,拉丁方设计、交叉设计都属于三因素设计,而后三种设计即可以用于二因素设计,又可以用于多因素设计。由于配伍组设计、拉丁方设计和交叉设计都不便考察交互作用,故最适合用于安排只含一个处理因素,含一个或二个区组因素的实验研究场合。如果实验中同时涉及二个或二个以上处理因素,因素之间的交互作用往往又是不可忽视的,此时,就应当选用析因设计或正交设计。如果希望观察接受不同处理的几组受试对象某些定量观测指标随时间推移的动态变化趋势,需要在不同时间点上从同一个受试对象身上进行多次观测,这就是所谓的重复测量设计(1)。在一次实验中,某人在研究三七皂甙Rg1对大鼠实验性血栓形成的影响和对正常血压及高血压大鼠血小板内游离钙水平影响时,收集到表1和表2资料(2)。Tab.1EffectsofRgl,Rb1andlysinipirinum(LNP)onthrombosisinrats(±s)Drug/(mg*kg)Thrombosiswetweight/mgNS25.3±3.9Rg158.7±1.2Rb1518.0±3.3LNP9.048.2±1.2NS:Normalsaline;Rb1andRg1:TwocomponentsinGinsenosides;LNP:LysinipirinumTab.2EffectsofRg1onplatelet[Ca2+]iundertheinfluenceofthrombininnormotensiveandhypertensiverats(±s)GroupRg1/(μmol*L)[Ca2+]i*(nmol/L)RestingThrombinNormotensive0167±24503±621154±26255±6610141±30160±33100120±26140±31Hypertensive0230±47709±651182±38312±4610140±39232±31100131±32157±37可以看到,表1中虽然涉及到药物和剂量二个方面,但一种药物只取了一种剂量,并不能将剂量视为一个独立的因素。因此,在表1中,只有药物一个因素,它有四个水平,生理盐水可被视为一种特殊的“药物”。显然,与表1资料所对应的实验设计类型应叫做单因素四水平设计。而表2资料中涉及到三个因素,即受试者的类型(分为正常血压者与高血压者)、接受药物Rgl的剂量(分为0、1、10和100/μmol*L-1)和受试者被检测时所处的状态(静息与接受凝血酶刺激后)。本资料所对应的实验设计类型取决于在二种状态下是对各组中每一只大鼠分别进行了检测,还是对不同大鼠进行了检测。若属于前一种情况,应叫做具有一个重复测量的三因素设计;若属于后一种情况,应叫做三因素析因设计。2.实验数据的分析与处理在设计实验中,表格的合理设计对实验结果的分析有很大的促进作用。科学合理的表格让人对实验分析方法一目了然,而不合理的表格则易使人产生混淆,误用分析方法而出现不必要的错误影响实验结果。在另一次实验中,某人用6.5Gy照射小鼠后再用几种不同的药物治疗,观察每只小鼠照后不同时间点上外周血白细胞数的动态变化情况,各处理组中的小鼠在不同时间点上反复被观测。资料如表3所示。Tab.3ChangesofcirculatingWBC(×109/L)inratsby6.5γirradiation(±s,n=10)Daysafterirrad#GroupWBC(×109/L)ControlrhIL-6rhG-CSFrhIL-6+rhG-CSFBefore*19.7±1.817.3±3.217.9±3.818.3±3.771.8±0.71.9±0.82.0±1.02.2±1.5101.8±0.91.7±0.81.7±0.61.3±0.6141.9±0.62.9±1.02.7±1.12.5±0.9172.8±1.03.3±0.94.6±1.24.5±1.1217.6±2.06.6±2.46.0±3.06.9±4.2239.4±3.89.7±4.29.7±3.98.7±5.6在本实验中涉及了三个处理因素,除照后时间外,纵向所列的四组是各有二水平的二个因素的四种组合,并非是一个药物因素的四个水平,仔细观察不难看出,这个组合因素的四个水平就是由rhIL-6不用与用、rhG-CSF不用与用的四种组合。将这四种组合视为四个实验条件,每个实验条件下的10只小鼠在7个不同的时间点上被重复观测WBC的值,故与表5对应的实验设计类型应叫做具有一个重复测量的三因素设计。若将表3资料用表4的形式表达,则容易辨别出它所从属的设计类型。Tab.4ChangesofcirculatingWBC(×109/L)inratsatdifferenttimepointsby6.5γirradiation(±s,n=10)Daysafterirrad#TREATMENT:WBC(×109/L)A0,B0A1,B0A0,B1A1,B1Before*19.7±1.817.3±3.217.9±3.818.3±3.771.8±0.71.9±0.82.0±1.02.2±1.5101.8±0.91.7±0.81.7±0.61.3±0.6141.9±0.62.9±1.02.7±1.12.5±0.9172.8±1.03.3±0.94.6±1.24.5±1.1217.6±2.06.6±2.46.0±3.06.9±4.2239.4±3.89.7±4.29.7±3.98.7±5.6Irrad#meansirradiation;Before*meansbeforeirradiation.A0andA1standfornotusingandusingrhIL-6;B0andB1standfornotusingandusingrhG-CSF2将数据录入科学合理的表格以后,就要进入最终分析步骤了。目前最常用的数据处理技术有t检验和F检验。一般来说,如果比较的数据只有两组,一般用t检验,但也可以用F检验,但是如果比较的数据多于两组,则只能用F检验。不同的设计类型,需要运用相应的方差分析方法。但严格地说,方差分析也有其应用条件。与t检验相同,它也要求资料满足正态性(即各组数据分别服从正态分布)和方差齐性(即任何一个因素的多个水平所对应的多个总体方差应相等)。如果应用条件不满足,要么找到合适的变量变换方法,使变换后的数据满足条件,再对变换后数据进行方差分析;要么找到相应的非参数检验方法。概括地说,方差分析方法有几十种。因为存在几十种不同的实验设计类型,而每一种实验设计类型,有与其对应的方差分析方法。分析的思路是基本相同的,只是具体的计算公式(即统计模型)是有区别的。例如上面提到的表一的资料,如果四组资料都分别满足正态性,四组资料满足方差齐性,则应选用单因素四水平设计资料的方差分析。若方差分析的结果为四组均数之间的差别有显著或非常显著性意义(P<0.05或P<0.01),尚需作多个均数之间的两两比较。若四组中任何两组之间都需要比较,有多种方法,其中较常用的方法叫q检验;若三个药物组之间不需要比较,而三个药物组都需与生理盐水组比较,则应选用DUNNETT的t检验。而对于表2资料,如果原始资料满足正态性和方差齐性,根据它是属于三因素析因设计还是属于具有一个重复测量的三因素设计,就应分别选用相应设计资料的方差分析法。通过三因素析因设计资料的方差分析,可以分析出三个因素各自的效应大小以及它们之间各级交互作用(包括任何二个因素之间和三个因素之间的交互作用)的效应大小。当交互作用具有显著性意义时,还可对其作进一步分解,以便发现因素之间的最佳水平组合。通过具有一个重复测量的三因素设计的方差分析,可以有效地排除个体差异和相邻时间点上观测值之间的高度相关性对结果的干扰和影响,比运用一般的方差分析方法能更合理、更有效地揭示因素及其交互作用的效应大小。在医学科研中,要解决的问题往往比较复杂,经常要运用多因素实验设计方法和相应的统计分析方法。这就需要医学工作者有足够的勇气和耐心来克服难关,突破阻碍。利用国际上著名的统计分析系统(简称SAS)(3),可以有效地进行多因素实验设计和各种实验资料的统计分析,它可以帮助人们从依赖计算器和t检验的落后局面中解放出来。随着人类文明程度的不断提高,科研工作(包括医学期刊中论文的质量)的水平和质量也应不断提高,以适应时代的发展。相信在不久的将来,人类能够利用自己的智慧,使医学中的实验设计与数据处理发挥最大作用,更好地拯救患者,造福人类。参考文献:(1)现代统计学与SAS应用[M].胡良平主编.北京:军事医学科学出版社,1996:57-151.(2)《医学实验中常见设计类型的辨析及统计方法的合理选用》胡良平中国应用生理学杂志2000年第1期第16卷技术方法(3)SASInstituteInc.SAS/STATUser'sGuide,Release6.03Edition.NorthCarolina,USA:SASInstituteInc.1988:549-637,941-947.