医用统计学马传香资源药物与中药资源研究所2002硕医学统计拟讲内容一引言统计学统计在整个科研中的位置、重要性二统计研究设计研究设计的基本内容;实验设计的三要素;实验设计的四原则;实验设计的常用类型;实验设计类型应用和判断中的错误举例,如何避免三统计资料的收集、整理、描述与表达讲述统计的几个基本概念:总体与样本、抽样误差、随机化、概率、统计量等等;讲述统计资料在收集整理过程中应注意的问题:如何针对自己的实验设计统计表和统计图?报表资料的设计与填写、资料的记录与贮存、资料的检查整理应注意的问题;讲述统计资料拿到后,如何进行描述:资料类型、平均指标、相对数、分位数、变异指标等;什么样的资料该用哪几个统计量进行描述,表达什么意义资料表达与描述中存在的统计学错误举例四统计分析方法定量资料的统计分析:常用参数检验(T检验,方差分析等)和非参数检验的原理、应用条件等前提;定量资料中存在的统计学错误举例;定性资料的统计分析:定性资料常用的统计分析方法,处理定性资料时存在的统计学错误举例!一引言统计学的主要内容:统计研究设计;统计资料的收集、整理、描述与表达;统计分析方法;统计结果的阐述对统计学的错误认识:二统计研究设计所谓医学科研设计,就是根据专业和统计学知识制定的一个完善的医学研究计划或方案。专业设计科研设计=统计研究设计2.1医学科研设计调查设计统计研究设计=临床试验设计实验设计2.2实验设计三要素受试对象实验因素实验效应(观测指标)受试对象或实验单位实验的承受者被称为受试对象,有时称其为“实验单位”更贴切一些,因为往往是在受试对象身上某个局部(不是全身)做实验。受试对象的种类活体动物标本或样品病人或正常人受试对象的数量即是实验研究中总共需要多少样本含量,也称样本大小,在统计学上称“样本大小的估计问题”。它涉及到实验设计的类型、观测指标的性质、有关实验知识和对结果可靠性的要求。因素与水平因素:影响实验结果的各种原因,统称为因素。分为:实验因素与非实验因素水平:因素的具体表现,称为水平。如:温度---------------叫因素30℃、60℃、90℃---叫水平实验因素与非实验因素实验因素:研究者希望着重考察的实验条件,并且,性质相同的实验条件必须具备两种或两种以上状态时,这种实验条件被称为实验因素。非实验因素:除实验因素之外的其他所有因素都属于非实验因素如何理解“因素与水平”在16℃条件下考察去甲肾上腺素(浓度为1×10-9)对兔肺动脉收缩压的影响。问:在上面的表述中共涉及到几个实验因素?每个因素有几个水平?统计学上所讲的因素与水平因素是特定实验条件的总称,水平是其具体的表现。仅当实验条件有两种或两种以上的具体表现时,在统计学上才称其为“因素”,而具体表现称为“水平”。如:温度:30、60、90(℃)剂量:2、4、6、8(mmol/L)实验效应实验效应就是实验因素作用于受试对象后所产生的效果。实验效应通常是通过一系列特定的观测指标来体现的。应结合专业知识,尽可能选用与实验因素对应的观测指标,要注意观测指标的客观性、特异度、灵敏度。2.3实验设计的四原则随机对照重复均衡随机原则的作用随机≠随便随机总体中任何一个个体都有同等含义:的机会被抽出,进入样本;样本中任何一个个体都有同等的机会被抽出,进入任何一组。随机尽可能消除人为因素的干扰作用:和影响,提高样本的代表性。对照原则的作用对照的作用:建立比较的基础,即设置参照物。对照的形式:空白对照、标准对照、相互对照、实验对照、历史或中外对照重复原则的作用重复的三层含义:重复实验、重复测量、重复取样重复的作用:由掷硬币实验10次与10000次的结果可知:其作用就是“让随机变量的变化规律性更真实地显露出来”。样本大小即受试对象的数目,取决于:(1)实验设计类型;(2)先验知识;(3)对精确度的要求最好借助相应公式计算。均衡原则的作用均衡的含义:各种非实验因素对各组的影响是均等的。均衡的作用:提高组间可比性,增大结论可信度。提高均衡性的对策(1)研究者自身应有丰富的专业知识和统计学知识(2)请同行专家审阅实验设计方案(3)请统计学专家提建议随机原则的实施(1)运用“随机数字表”实现随机化(2)运用”随机排列表”实现随机化(3)运用”计算机产生伪随机数”实现随机化用随机排列表实现随机化举例1【例2.3.1】将10只小鼠随机地均分到甲(实验组)、乙(对照组)两组中去。【分析与解答】先将小鼠编成1~10号,并任意指定随机排列表的某一行(这里指定第4行),舍掉10~19的双位数字排列在10个编号之下。事先应规定分组方法,如:凡与随机数中的偶数相对应者分入甲组、与奇数对应者分入乙组。小鼠编号12345678910随机数字6154078392所属组别甲乙乙甲甲乙甲乙乙甲【分组结果】1,4,5,7,10号小鼠进入甲组,其他鼠进入乙组。用随机排列表实现随机化举例2【例2.3.2】将20名某病患者按一定条件(如性别、年龄、病情等)配成10对,请把每对中的两名患者随机地分入甲、乙两组,分别接受不同的处理。【分析与解答】先按对子编成1~10号,第i对中两名患者再编为Ai和Bi号,i=1,2,…,10,然后任意指定随机排列表中某一行,如第9行,舍掉10~19的双位数字后排列在10个编号之下,并事先规定每对中两名患者遇偶数取甲→乙顺序、遇奇数取乙→甲顺序。用随机排列表实现随机化举例2续患者对号12345678910随机数字9302158647患者编号A1A2A3A4A5A6A7A8A9A10所属组别乙乙甲甲乙乙甲甲甲乙患者编号B1B2B3B4B5B6B7B8B9B10所属组别甲甲乙乙甲甲乙乙乙甲【分组结果】编为A3,A4,A7,A8,A9,B1,B2,B5,B6,B10号的小鼠进入甲组,其他小鼠进入乙组。用随机排列表实现随机化举例3【例2.3.3】将15只兔随机均分入三组,任意指定随机排列表的某一行(如第18行)。【分析与解答】将15只兔编成1~15号,舍去指定行中15~19的随机数字,剩下的依次抄录在15个编号之下,并事先规定遇随机数0~4、5~9、10~14的兔分别进入甲、乙、丙组。现假定从表2.1.1中选定了第16行随机排列数字,舍去该行中15~19的随机数字,剩下的依次抄录在15个编号之下:用随机排列表实现随机化举例3续小兔编号123456789101112131415随机数字15281213147639104110所属组别甲乙甲乙丙丙丙乙乙甲乙丙甲丙甲【分组结果】1,3,10,13,15号小鼠进入甲组;2,4,8,9,11号小鼠进入乙组;5,6,7,12,14号小鼠进入丙组。对照原则的实施(1)空白对照组(2)相互对照组(3)标准对照组(4)实验对照组(5)历史或中外对照组(6)多种对照形式同时并存(1)空白对照组设共有K组受试对象,它们在非处理因素方面基本相同,其中有一组不给予任何处理,其他组分别给予不同的处理,没给任何处理的那一组就是其他K-1个组的空白对照组。此种对照一般用于动物实验中,在临床上,一般只适用于慢性病的对比研究中。(2)相互对照组有时要考察的某因素不能取零水平,如考察某化学实验中反应温度对实验结果的影响,此时,各实验组分别在不同的温度条件下做实验,各组在实验中起到了相互对照的作用。(3)标准对照组为了比较某新药的疗效,往往以当前社会上被公认的、疗效比较好且比较稳定的同类药物作为对照,此为标准对照。(4)实验对照组当某些处理本身夹杂着重要的非处理因素的作用时,仅有空白对照是不能说明问题的,还需设立仅含该非处理因素的实验组,此为实验对照组。(5)历史或中外对照组拿当前的实验结果与历史上或其他国家或其他地区的同类实验结果相比较,此为历史或中外对照,这种对照形式应慎用。其对比的结果仅供参考,不能作为推理的依据。因为环境和条件相差悬殊,缺乏起码的比较基础。(6)多种对照形式同时并存在实际应用中,常常是多种对照形式同时并存。例如:某研究者为考察某药物(设为甲药)的疗效,同时,还希望了解该药与另一种药(设为乙药)同时使用的效果是否比单用其中一种药效果好。重复原则的实施所谓重复原则,就是在相同实验条件下必须做多次独立重复实验。在估计样本含量时,研究者需提出某些精度要求,并提供某些先验知识,方可进行估计。所谓精度要求,通常指事先规定允许犯Ⅰ型(或假阳性)错误的概率α、检验功效或称把握度1-β(这里β为允许犯Ⅱ型(或假阴性)错误的概率)。重复原则的实施α定得越小,1-β定得越大,所需样本含量就越大。所谓先验知识,就是根据专业知识、文献资料或预实验结果获得的由样本推断总体的一些信息,如:已知δ(最大容许误差或差值)、σ(标准差)等。重复原则的实施目前,仅在一些较简单的设计类型中有估计样本大小的计算公式,对一些复杂的多因素设计类型,尚无现成的方法。SAS软件中能估计十几种简单情形下的样本大小均衡原则的实施提高统计研究设计方案均衡性的措施有:其一,研究者应具有较好的专业知识和统计学知识,能够制定出较为理想的设计方案;其二,应当请从事本专业研究的有经验的专家帮助审阅和修改设计方案;其三,应当请对统计学有较深入研究的统计学工作者参与设计方案的制定,至少要请他们帮助审阅和修改设计方案。均衡原则的实施若科研课题将涉及大量、复杂的实验设计和统计分析方面知识时,研究者应主动与统计学工作者开展积极的科研协作,这样可达到事半功倍之效果。均衡原则的实施一个实验设计方案的均衡性好坏,关系到实验研究的成败。均衡性问题很重要,但又极易被研究者所忽视。因为很多问题是少数人竭尽全力想考虑,但又很难考虑周全的,此时,充分发挥具有各种知识结构和背景的人的作用,群策群力,方可有效地提高实验设计方案的均衡性。理解均衡原则的一个生动实例铲雪比赛在一段路面质量相同的大道上,两组人进行铲雪比赛。一切自然条件都完全相同,两组人数一样多。第一组中男性10人、女性5人;第二组中女性10人、男性5人。两组人年龄、身体状况、以前和平时干体力活的机会等情况都基本相近,两组人都戴着相同的手套。比赛持续了半小时,每个人都竭尽全力地铲,其结果是:第一组比第二组铲的质量差、数量少,问这是怎么回事?